List of class taught by takasu thermodynamics photo access statistics by takasu

検索エンジンのアクセス統計

     by 高須   97.8.1    ホームページ

はじめに
1。検索エンジンの種類
2。検索語の統計
。。7月の検索語
3。解析に使ったperlスクリプト
4。検索エンジンの問題点

はじめに

最近、Apacheの設定を変えて、referer_logが見れるようになりました。
検索エンジンの種類と、どういう検索語で来ているかを、
perlスクリプトを使って統計をとってみました。
私のホームページへのアクセスのみです。


1。検察エンジンの種類

gooという検索エンジンは、最近できたらしくて、
アクセス数がトップです。
全文検索しているようで、文章の中の
普通の単語まで検索しているようです。
   7月に来た検索エンジン

2。検索語の統計

perlスクリプトを書いて統計をとってみました。

モバイルギアが多いようです。

どうしてそういう言葉で検索するのかわからないのも、
混ざってます。

    7月の検索語

3。解析に使ったperlスクリプト

「初めてのPerl」という本を見ながら、作ってみました。
サーチエンジンについては、あらかじめ名前を調べておく
必要があります。
スクリプト本体はこちら

4。検索エンジンの問題点

今回、access_logやreferer_logを解析してみて、
気がついたことを書いてみます。
私は、検索エンジンの専門家ではないので、
あくまで、ユーザとしての立場から、書いてます。

(1)古いファイルをはずしてない。

新しく追加したファイルはどんどん登録されているようです。でも、
ディレクトリ構成を変えたために、もう存在しないファイル名にも
アクセスしてます。
ファイルが存在しても、内容を変えたために、
その単語が存在しない場合もあります。

「一度書かれた文書は、増えることはあっても、減ることはない」と
仮定しているのでしょうか?

「古い登録がまだ有効か、定期的に自動チェックする」機能を
検索エンジンにつけてほしいものです。

(2)遅い

これは、エンジンによるのですが、
私の所からは、hole-in-oneと、japan.infoseek.comへの
アクセスが遅いです。
平日だと、5分かかることもあります。
回線が細いのでしょうか。

他の、gooなどは、わりと早くアクセスできます。