アクセスログをデータベースに入れて集計
某所でレンタルサーバを借りてるんですが、そこのログをデータベースに入れていろいろ分析してみようと1週間くらいチマチマといろいろ作ってみました。
- ログを整形してデータベースに入れるためのスクリプト(WSHのJScript)
- ↑の処理でログは.gz圧縮されているため、それを展開するためのプログラム(既にそういうのはあるんだが、せっかくだからアーカイバDLLにあるやつ全部対応したのを作ってしまおうということで)
- データベース表示のためのPHPスクリプト
とりあえずこんな感じ。で、基本的なところでログを指定条件で抽出して表示するのと、一番興味のあるUserAgentの集計、この2つがここまでで完成。
UserAgentは見てると結構面白い物がありますな。msnbotがかなりランクの上の方に来ていたり、なんか妙な文字列入れてる人もいるし…。
あとは転送量総合計とかステータスコードのランク(=エラー発生率)とかファイル別のアクセス数とかこの辺を作っておきたいですな。