ljインデックスはいつも作成中?
「lj2000系のインデックスには複数のグループあるいはアルゴリズムが存在するのではないだろうか。」ということについてなのだが、この部分についてはいくつかの可能性があるのだが、そのいずれも明確に肯定も否定も出来るだけの材料を持ち合わせていない。
昨日の段階では
ljをインデックスする際には、幾つかのグループに分けて、評価計算を分散しているのではないだろうか
クロールのクールごとに評価のポイントをずらして、オーソリティー中心、ハブの傾向中心、ハブの内容中心といったような個別の評価の時期があるのではないだろうか
というような仮説を立ててみた。
しかし、前者は兎も角、後者にはどこか無理がある。
そこで、新たな仮説として
ljインデックスは常に作成中で、約40日毎にその時点でのインデックスが更新され、計算自体は継続して行われ続ける(この計算は相当の長期間を要する。新たな要素(サイト・ページ)の追加によって現実的には終わることが無い。)と考えてみる。
まず、オーソリティーページを見つけるのは、比較的容易であると思われる。しかし、ハブページを見つけ評価するのにはネット全体の流れを判断する必要があることから相当大量の計算が必要であろう。
このことが、(現在私の知る範囲ではあるが)ハブページのうち比較的階層の浅い、リンク集などで言えば実際のメインページよりも上の目次ページが多くインデックスされている原因なのではないだろうか。そうであるとすれば、リンク集などのメインページはいずれ上位に返り咲いてくるはずである。当然このようなリンク集の存在価値が高い分野についてはオーソリティーページのSERPsは相対的に下がってくる事になる。
また、ネット全体の構造を考えると主要テーマではないが関連はあるということでリンクが比較的多くされているようなケースはままあることであるが、こうしたボトルネックになっているような部分の存在から局地的にある時期計算が急激に進むあるいはその逆に無風状態が続く分野があるように思える。
またこれとは別に様々なテーマ毎の局地的な現象面で思い当たることとして、あるサイトのテーマとする部分の計算が急激に進むとき、そのサイトの構造次第では、インデックス数が一時期過剰に増えるという現象があるのではなかろうか(実は自サイトでも3月中旬にそのような現象があったのである。自サイトの場合その結果オーソリティーページに内容が近い部分が一時的に順位を上昇、インデックス数は減少(4/1)、続いてメインページの上位にある目次ページの順位が上昇し、4/1に上昇したページは殆ど消える(5/12)という経過を辿っている。メインページの返り咲きがあるか否かは不明であるが、もしかすると次回の更新ではこの辺りが上昇してくるのかもしれない)。
このインデックス過剰増加現象はYSTが考えるサイトのリンク構造とは相容れないリンク要素がある場合に起こっているのではないかと推測する。仮にlj1000系やその他のインデックスから巡回先を決定しそれに沿って評価していくと、新しいlj2000系のアルゴリズムでは矛盾を生じ、新たに再計算の必要性が出てくるというような事態になるのではなかろうか。そのため一時的に評価のためのインデックスが増加し、その後lj2000系のアルゴリズムに沿うようなリセットが行われるため、インデックスの減少とこれまでの検索結果に表示されなくなるという現象が発生している可能性はある。
さて、最新の仮説が正解に近いとすると次回の更新でインデックスを減らすサイトがあるとすると、そのサイトでは6/20までの間に一時的なインデックス数の過剰増加現象が見られる可能性が高い。実はこうした現象に遭遇しているサイトを一つ見つけることが出来た。どこのサイトかはここでは伏せておくが6/20頃の更新に備えてそのサイトを継続して観察していこうと思う。
Posted by a1 at 10:39
│
Comments(0)
│
TrackBack(0)
この記事へのトラックバックURL
http://app.blog.livedoor.jp/medartkuma/tb.cgi/22137883