List of class taught by takasu
thermodynamics
photo
access statistics by takasu
検索エンジンのアクセス統計
by 高須 97.8.1 → ホームページ
はじめに
1。検索エンジンの種類
2。検索語の統計
。。
7月の検索語
3。解析に使ったperlスクリプト
4。検索エンジンの問題点
はじめに
最近、Apacheの設定を変えて、referer_logが見れるようになりました。
検索エンジンの種類と、どういう検索語で来ているかを、
perlスクリプトを使って統計をとってみました。
私のホームページへのアクセスのみです。
1。検察エンジンの種類
gooという検索エンジンは、最近できたらしくて、
アクセス数がトップです。
全文検索しているようで、文章の中の
普通の単語まで検索しているようです。
7月に来た検索エンジン
2。検索語の統計
perlスクリプトを書いて統計をとってみました。
モバイルギアが多いようです。
どうしてそういう言葉で検索するのかわからないのも、
混ざってます。
7月の検索語。
3。解析に使ったperlスクリプト
「初めてのPerl」という本を見ながら、作ってみました。
サーチエンジンについては、あらかじめ名前を調べておく
必要があります。
スクリプト本体は
こちら。
4。検索エンジンの問題点
今回、access_logやreferer_logを解析してみて、
気がついたことを書いてみます。
私は、検索エンジンの専門家ではないので、
あくまで、ユーザとしての立場から、書いてます。
(1)古いファイルをはずしてない。
新しく追加したファイルはどんどん登録されているようです。でも、
ディレクトリ構成を変えたために、もう存在しないファイル名にも
アクセスしてます。
ファイルが存在しても、内容を変えたために、
その単語が存在しない場合もあります。
「一度書かれた文書は、増えることはあっても、減ることはない」と
仮定しているのでしょうか?
「古い登録がまだ有効か、定期的に自動チェックする」機能を
検索エンジンにつけてほしいものです。
(2)遅い
これは、エンジンによるのですが、
私の所からは、hole-in-oneと、japan.infoseek.comへの
アクセスが遅いです。
平日だと、5分かかることもあります。
回線が細いのでしょうか。
他の、gooなどは、わりと早くアクセスできます。