アクセスログをデータベースに入れて集計

某所でレンタルサーバを借りてるんですが、そこのログをデータベースに入れていろいろ分析してみようと1週間くらいチマチマといろいろ作ってみました。

  • ログを整形してデータベースに入れるためのスクリプト(WSHJScript)
  • ↑の処理でログは.gz圧縮されているため、それを展開するためのプログラム(既にそういうのはあるんだが、せっかくだからアーカイバDLLにあるやつ全部対応したのを作ってしまおうということで)
  • データベース表示のためのPHPスクリプト

とりあえずこんな感じ。で、基本的なところでログを指定条件で抽出して表示するのと、一番興味のあるUserAgentの集計、この2つがここまでで完成。

UserAgentは見てると結構面白い物がありますな。msnbotがかなりランクの上の方に来ていたり、なんか妙な文字列入れてる人もいるし…。

あとは転送量総合計とかステータスコードのランク(=エラー発生率)とかファイル別のアクセス数とかこの辺を作っておきたいですな。