ホームページ~ログファイル

1.種類

ホームページ関連のログとしては、Webのアクセスログとエラーログを見ることができます。 Webアクセスログ・Webエラー ログはApacheが出力したテキスト形式の生ログです。また、Webのアクセスログを集計してHTML形式で 統計情報を表示するログ解析も行えます。

複数のドメインを設定されている場合、子ドメインのアクセスログ/エラーログは生成されず、親ドメインのログファイルに記録されます。 アクセスログ解析も同様に、子ドメインのものについては親ドメインのアクセスログ解析の中に含まれます。

2.参照方法

管理ツール(サイト管理者(admin)の場合サイトマネージャ、Web特権ユーザーの場合Webマネージャ)では最近10~500件の生ログを参照することができます。また、サ イトマネージャではログ解析も参照することができます。
FTPでのダウンロードでは前日以前の生ログとログ解析を参照することができます。

Webアクセスログ Webエラーログ ログ解析
サイトマネージャー ○ (最近500件) ○ (最近500件)
Webマネージャー
(Web特権ユーザーのみ)
○ (最近500件) ○ (最近500件) ×
FTPでのダウンロード ○ (前日以前) ○ (前日以前)

3.参照出来るお客さま

ログファイルを参照できるのはサイト管理者(admin)・Web特権ユーザーです。

4.ログファイル用ディレクトリ

ログファイルはサーバーの /log ディレクトリ内に保存されます。/log ディレクトリ内はさらに/log/www と/log/ftp に分かれており、 /log/www にWeb、 /log/ftp にFTPのログが保存されます。

5.保存期間

生ログのログファイルは1日分ごとに1つのファイルにまとめられ、あらかじめ設定されている保存日数分が サーバーに保存されます。設定されている日数が経過したログファイルは サーバーから自動的に削除され、参照することは出来なくなります。ただし、 ログ解析だけは保存日数の設定に関わらず過去12か月分のログが保存されます。

保存日数は0日~40日の範囲で任意に設定する事ができます。設定はサイト管理者(admin)の場合サイトマネージャにアクセスして、 「Web&FTP管理」→「ログファイル」→「ログ保存日数」から行うことができます。Web特権ユーザーの場合Webマネージャにアクセスして、 「Webアカウント管理」→「ログファイル」→「ログ保存日数」から行うことができます。
初期状態では7日に設定されています。なお、0日に設定すると /log ディレクトリ配下へのログファイルの保存は行われなくなり、以下のログ以外は参照できなくなります。

  • 最近500件分のWebアクセスログ
  • 最近500件分のWebエラーログ
  • 最近500件分のFTPアクセスログ

6.ログファイルの容量

ログファイルはご契約頂いたディスク容量を使用します。Webコンテンツの容量として計算されますので、 ログを多く使用するお客さまはサイトマネージャーの「Web/メー ル容量配分」でWebの容量を多めに配分しておいて下さい。なお、当日分の記録途中の生ログはお客さまのディスク容量を使用しません。

7.Webアクセスログ

WebアクセスログはHTTPリクエストを記録したApacheの生ログです。以下のファイル名で作成されます。

access_[日付].log.gz (通常のホームページ)
ssl_access_[日付].log.gz (SSLのホームページ)

日付は [YYYYMMDD] の形式になっています。たとえば、2003年4月1日のログファイルは

access_20030401.log.gz

となります。gzip形式で圧縮されていますので、解凍して参照して下さい。

書かれている内容は使用しているWWWサーバープログラム「Apache」で定義されているログフォーマットのうち 「combined」という名称が付けられたフォーマットを採用しています。書式は以下の様になっています。

(host) - - [(date)] "(request)" (status) (bytes) "(referer)" "(user-agent)"

  • (host)はアクセスしたクライアントのIPアドレスです。 ※ドメインでのアクセス制限を行っている時に限り、IPアドレスから ドメインが逆引き検索できた場合はドメインで記録されます。
  • (date)はアクセスがあった日時です。
  • (request)はクライアントからのリクエスト内容です。
  • (status)はクライアントに返されたHTTPステータス番号です。
  • (bytes)はクライアントに送信されたデータのバイト数です。
  • (referer)は環境変数Refererの値です。リンク元のページのアドレスが記録されます。
  • (user-agent)は環境変数User-Agentの値です。ページを参照しているクライアント(ブラウザ) の情報が記録されます。

例えば、Webアクセスログに以下の情報が記録されていたとします。 (ここでは改行を入れていますが、実際には1行につながって表示されます。)

123.123.123.123 - - [13/Jan/2003:16:20:21 +0900]
"GET /counter.html HTTP/1.1" 200 600 "http://abc.st123.arena.ne.jp/index.html"
"Mozilla/4.0 (compatible; MSIE 5.5; Windows NT 5.0)"

この部分からは、

  • 123.123.123.123というIPアドレスのクライアントから
  • 日本時間の2003年1月13日 16時20分21秒に
  • GET /counter.html HTTP/1.1というリクエストがあり、
  • 200というHTTPステータスと
  • 600バイトのデータを返し、
  • このアクセスのリンク元はhttp://abc.st123.arena.ne.jp/index.htmlで、
  • クライアントはWindows 2000版のInternet Explorer 5.5 (Windows NT 5.0はWindows 2000を 意味しています。)

という事が分かります。

8.Webエラーログ

Webエラーログは発生したエラーを記録したApacheの生ログです。以下のファイル名で作成されます。

error_[日付].log.gz (通常のホームページ)
ssl_error_[日付].log.gz (SSLのホームページ)

日付は [YYYYMMDD] の形式になっています。たとえば、2003年4月1日のログファイルは

error_20030401.log.gz

となります。gzip形式で圧縮されていますので、解凍して参照して下さい。

書かれている内容は使用しているWWWサーバープログラム「Apache」の標準フォーマットになっており、 ページが参照された時や CGIが実行された時にエラーが発生するとそのエラーの情報が記録されます。書式は以下の様になっています。

[(date)] [error] [client (host)] (error)

  • (date)はアクセスがあった日時です。
  • (host)はアクセスしたクライアントのIPアドレスまたはドメインです。
  • (error)は発生したエラーの内容です。

例えば、Webエラーログに以下の情報が記録されていたとします。(ここでは改行を入れていますが、実際には1行に つながって表示されます。)

[Thu Jan 13 16:13:38 2003] [error] [client 123.123.123.123]
File does not exist: /home/abc.html

この部分からは、

  • 日本時間の2003年1月13日 16時13分38秒に
  • 123.123.123.123というIPアドレスのクライアントからアクセスがあり、
  • File does not exist: /home/abc.htmlという内容のエラーが発生した

という事が分かります。

記録されるエラーメッセージの内容には様々なものがありますが、ページの表示が正常に行われない場合 やCGIの実行が失敗してしまう 場合などはエラーメッセージの内容をご覧頂くと原因が特定出来る場合があります。

9.ログ解析

Webアクセスログの過去12か月分の内容をHTML形式でまとめた統計情報ログです。ログ解析は、 以下のファイル名で作成されます。

access_analyzed.tgz (通常のホームページ)
ssl_access_analyzed.tgz (SSLのホームページ)

tar + gzip形式で圧縮されていますので、解凍して参照して下さい。デフォルト状態ではログ解析は作成されません。ログ解析を行いたい場合はあら かじめサイトマネージャーで設定しておく必要があります。設定はサイトマネージャー内の、「Web&FTP管理」→「ログファイル」→「アクセスログ解析 ON-OFF」 から行うことができます。

ログ解析では、以下の統計情報を見ることができます。
サンプル画像こちらよりご覧になれます。

  • 日ごとの統計
  • 時間ごとの統計
  • URL
  • エントリー
  • Exit
  • サイト
  • リファラー
  • 検索文字列
  • エージェント

統計情報に表示されているHits・Files・Pages・Visits・Sites・KBytesはそれぞれ以下の内容を示しています。

Hits 全アクセス数
Files Hitsのうち正常に処理された(エラーを除いた)アクセス数
Pages HitsのうちHTMLファイルへのアクセス数
Visits Filesをもとに計算された訪問者数
Sites Hitsをもとに計算された訪問サイト数
KBytes 転送したデータ量(キロバイト単位)

VisitsはFilesのうち、最初のアクセスから30分以内に同じIPア ドレスからアクセスがあった場合そのアクセスをカウントせずに集計したアクセス数です。この項目からおよその訪問者数を知ることができます。

SitesはHitsのうち、 最初のアクセスから1年以内に同じIPアドレスからアクセスがあった場合そのアクセスをカウントせずに集計したア クセス数です。 この項目からおよその延べ訪問者数を知ることができます。

10.ワームのアタックへの対処

サーバーに限らず、インターネット上のWebサイトには「Code Red」「Nimda」などのワームに感染したサイトから 頻繁にアタックが行われています。サーバーはこれらのワームには感染しませんが、 アタックの際に送られてくるHTTPリクエストが非常に多いため、通常の状態ではアクセスログが非常に大きくなってしまいます。

この現象への対処として、サーバーはリクエストURIに以下の文字列が含まれる場合、そのアクセスをワームによるアクセス とみなしアクセスログへの記録を行いません。

  • /system32/cmd.exe
  • /MSADC/root.exe
  • /scripts/root.exe
  • /default.ida
  • /NULL.IDA

また、8KBより長いリクエストのアクセスがあった場合、アクセスログに記録されるリクエストURIに「-」と記録します。

なお、エラーログへの記録は通常通り行われます。

※送られたリクエストの内容がHTTPのフォーマットとして不正な内容だった場合など、まれにパターンに該当する文字列が含まれていても アクセスログに記録されてしまう場合があります。