BingのSEO? Microsoft社製検索エンジンのアルゴリズムVIPSとRankNet

「Bing SEO」でアクセスする方が多いが、この対策チップスはYahoo!以上にレアものだろう…

私でさえ、MSの検索エンジン情報は過去の自サイトのページだったりする(笑

BingのアルゴリズムとSEO MSN SearchからLive Search、そしてBing?

さてさて、まずは現状から。

  • 日本のYahoo!検索は、Bingにいつかは変わる可能性が大
  • 日本のBingは、今のところアメリカのBingとは違う
  • アメリカのBingも、Yahoo!(YST)のアルゴリズムや人材をつまみ食いする可能性もある
  • Microsoftの検索エンジンは、MSN SearchからLive Searchと変遷し、現在はBingと称されている
  • MSN Search ≒ Live Search ≒ Bing と仮定しておこう

ということで、SEO塾の過去のページからMicrosoft社製検索エンジンとアルゴリズムに関する箇所をピックアップしておく。

Bingのアルゴリズム? VIPS

結局、検索エンジンとは、統計学とか数学とか、先日お会いした清田陽司東大助教のテキストマイニングとかセマンティックとか、そういう世界である。

MSNサーチの検索順位 – RankNetアルゴリズム対策 :MSNサーチ対策 ::SEO塾(情報サイト)

MSNサーチのアルゴリズム

検索アルゴリズムは最新の統計学的手法を採用

スパムメール対策やGoogleに採用されていることで有名な「ベイズ理論」だが、Microsoftはこのベイズ理論の最高峰の人材を多く抱えている。
ベイズ理論の本質は、要するに、データベースの人間的な構築と抽出ということ。しかも学習して成長するらしい。

公表されているMSNサーチのアルゴリズムの柱は「VIPS」と「RankNet」であるが、どちらも視覚や脳神経などの人間の認識活動をシミュレートしようとしているところが特徴であり、また脅威である。

MSNサーチは、学習し成長する検索エンジンなのである。

VIPSアルゴリズム

「VIPS」は、「a Vision-based Page Segmentation Algorithm」の略で、Webページをブラウザで閲覧している人間の視覚をシミュレートするアルゴリズムのこと。

要点は、リンクというかハイパーテキストがWebページの大きな要因ではあるものの、それがどこに書かれているかをプログラムとして見抜き、コンテンツパーツに位置するものだけを抽出する技術である。

例えば、このページの左のサイドバーに並ぶナビゲーションは、ひと目でコンテンツとは違うと分かる。人間は、コンテンツを中心に閲覧している。

ナビゲーション、テキストやバナーの広告、トップページの下部の相互リンク、リンク集のサイト紹介ページ、などに位置するリンクは、重み付けから排除されることになるだろう。

現在のレベルがどうかという問題は大きいものの、Microsoftも、Googleと同じように、そして違った方法論で、キーワード検索の関連性(レリバンシー relevancy)を追求しているのだろう。

こういった姿勢が、Yahoo! Inc.とは比較にならない、検索エンジン会社の誠実さである(笑

Yahoo!検索対策よりは、はるかに知的エンターテイメントになるはずだ。

そして、Googleと同じように、海外(主にアメリカ)SEO情報がベースとなる可能性が高い。

ともあれ、Microsoftの検索エンジンは、したがってBingは、GoogleやYahoo!が認めてくれたようなサイドバーからのリンク、あるいはリンクブロック、特にフッター部の大量リンク、これを排除している可能性が高いということである。

MSNサーチの検索順位 – RankNetアルゴリズム対策

Block-level Link Analysis

流説によると、GoogleのメインのアルゴリズムはPageRank、Yahoo!(YST)のアルゴリズムはHITS(Hyperlink-Induced Topic Search)と呼ばれているが、そのどちらもキーワード検索の関連性として、ページ単位の処理をしている。

これに対して、MicrosoftのVIPSアルゴリズムのプログラムは、「Block-level Link Analysis」と呼ばれ、ページ単位ではなく、ページの中のブロックレベルのリンク構造を解析して価値付けするということだ。

つまり、Microsoftは検索エンジンの新地平を切り開き、ページ対ページのリンク解析では不十分であり、書いてある内容によってページを複数のブロックに分け、リンク自体がどういった意味のブロックの中にあるのか解析し、リンク先の関連性を評価するというのである。

PageRankもHITSも、ページという分子レベルのアルゴリズムであるのに対して、VIPSのBlock-level Link Analysisは原子レベル、あるいは量子レベルのアルゴリズムであると。

このようなセマンティック(意味)解析をともなうアルゴリズムでは、古典的なスパムはほとんど無効となってしまいかねない。
まともに実装されて、稼動するのであれば、GoogleやYahoo!(YST)でかなり見受けられる不審な上位ページは、かなり消え去るはずだ。

このようにBingを解剖していくと、自サイトがやっているSEOと、Bingの順位と、思い当たることも多いはずである。

Bingのアルゴリズム? RankNet

上述のVIPSをベースとして、さらにBingは「RankNetアルゴリズム」を実装している可能性も高い。

RankNet – MSNサーチの検索結果に関連性を高めるアルゴリズム :MSN検索の伝 ::MSNサーチの書

RankNetアルゴリズム

方向性としては、コンテンツの中身、キーワードというよりもトピック、つまりキーワードに関する話題やテーマなど、を重視するアルゴリズムのように見える。

例えば、「X」を記述しているページは、「X」のトピックとしては「Y」や「Z」も書かれているべきである、つまりキーワードとして「X」「Y」「Z」などが記述されているページが、トピック「X」に関連性が高いページと判断されるのではなかろうか。

仕組みとしては、複数のキーワードで検索され、かつ各キーワード検索による表示回数も多いページなど、MSNサーチのクエリを基礎データにして、複数のキーワードの関連性がインプットされながら、あるべきトピックの姿が作り上げられていくと思われる。

MSNサーチは、学習し成長する検索エンジンなのである。

今なお、RankNetの理想とはほど遠い日本Bingの検索結果ではあるものの、Microsoftの検索エンジンとしての志は高いということである。

relevanceやneural netなど、MicrosoftはまじめにGoogleのアルゴリズムに対抗しているのである。

Bingでは、GoogleでもYahoo!でも通用しないブラックハットSEOが暗躍している一方で、逆にGoogleやYahoo!で通用するホワイトハットSEOも効き目がないということが多発している。

よって、サイトオーナーの意図したとおりの検索結果になっていないところが歯がゆい思いになるだろう。

まあ、意志決定エンジンなのか、切歯扼腕エンジンなのか。

今後のタイムスケジュールが楽しみである。

«
»
 

コメント (1)

海外SEOの鈴木さんの記事にありましたが、グーグルもアメリカの方では、セマンティック解析をリンク評価に導入するアルゴリズムに導入しているような傾向があるようです。

bingとグーグル、意外と近い検索結果になるかもですね。

コメントを書き込む