2005年08月16日

インデックス数はそんなに大事か?

ITmediaの記事として「Yahoo!とGoogle、検索インデックスめぐり論争」という記事を読んだのだが、果たしてここで言われるインデックス数とはそんなに大事なものなのか?

先日のエントリーでも、YSTのインデックス数がウェブページで192億になったということを疑問符つきで書いた。
GoogleもYSTのインデックス数については疑問を投げかけているようだ。

私の考え方としては、Googleとは違うが、改めてこのインデックス数について疑問を投げかけておきたい。といっても、YSTがいう192億という数字自体を否定するつもりは毛頭無い。
問題はこの192億というインデックス数のうち実際に検索に利用されるインデックスはいくらあるのかということである。

これまでにも何度か書いたことであるが、自サイトの場合、「○○○ △△△」というような2語検索を行った場合に、「○○○ △△△ site:ドメイン」のかなり下のほうのページがSERPsに現れるというケースが多数見られる。しかし、同様のケースが競合サイトにも見られることや、類似のキーワードで表される他のページではsite:ドメインを加えて検索した場合の1位が表示されるケースもあることから、不本意ながらスパムと判定されているというものではないと判断している。発リンクの多く構造が複雑になっているページほどその傾向が強いことから、インデックスはされていても評価が確定していないために一般的な検索のSERPsには現れないのだと考えているのだが。

まあ、この現象の真相はさておき、「○○○ △△△」で表示される自サイトのページより「○○○ △△△ site:ドメイン」で上位にあるページは、他の検索を行っても表示されることはまず無い。つまりこれらのページは一般には知られる機会が無いのである。

また、毎日その数を見ている検索語の一つの米YSTにおけるインデックス数は、8/16の段階で8,050であるが、実際に100件表示の10ページ目を見てみると920件しかSERPsには表されていない。
確かにどの検索エンジンでもある程度以降のページについては類似する内容としてSERPsからは省略されていることが多い。しかし省略されるインデックスの数字がこれほど多いのも珍しい。
現在ではどの検索エンジンにおいてもインデックス数の多少に拘わらず、ある件数以上のSERPsは表示しない(YST,Googleならば1000件)ため、表示されうるインデックス数がこれを超える場合には実際にどれほどのものが省略されているのかを知る術を今のところ私は知らない。しかし、もしかするとインデックス数の多い検索に対して、YSTのアルゴリズムあるいはフィルターの中で省略されるインデックスの数はそれ以上に多くなっているのではなかろうか。

話をGoogleの方に向けると、Googleにおいても同様のことは言えるわけで、自サイトを例に取ると、実際に存在するページに対してGoogleが、site:ドメインで示すインデックス数は倍以上ある。この数字がSERPsを決定する上で必要な数字であるとすれば、それ自体に異議を唱えるつもりは無いが、この数字とGoogleのトップページに示される8,168,684,336という数字の関係についてはGoogleも開示してはいない。
その点では先の記事でGoogleがYSTに投げかける疑問はGoogle自身も答えるべき必要性があると考える。

いずれの検索エンジンにおいても、この一般的な検索で表示されることのある、我々が検知可能なインデックスの数こそが、数字としては本当は大切なのではなかろうか。

少なくともYSTの言うインデックス数の定義とGoogleの言うインデックス数の定義には乖離があるはずである。それを前提としない論争は不毛である。

一ユーザーとして見たとき、我々が検索エンジンに求めるものは、インデックス数を競う事ではなく、検索結果の質である。であるからこそ、各検索エンジンもそのSERPsの質をより良くしていこうとするのではないか。
SERPsの質という点を問題にするとき、先にも書いたとおりYSTのlj系のインデックスは完成されたとは言い難い面があると私は感じている。これはアルゴリズム云々以前の問題である。
日本でYSTが導入された昨年6月以降に関しても、少なくとも自サイトでは順位の回復に数ヶ月を要した。この間特に構造の変更などを行なっていない点から考えて、YST(lj)のインデックスをアルゴリズムに沿った形で完成させるには数ヶ月の時間が必要なのかもしれない。
こうした事を考えるとき、YSTには今更そのインデックス数をこっそり発表して自社の優位性を云々するより、その質の優位性を証明するような発表を行なってもらいたいものである。


この記事へのトラックバックURL

http://trackback.blogsys.jp/livedoor/medartkuma/50013587