連想検索エンジンという記事。
NRIでは、コンピュータが自動的に連想し、最適な情報を消費者に提案・推薦する“リコメンデーション”技術を応用した検索サービスが、主にECなどの分野でこれから拡大していくと考えています。
ここは疑いの余地無し。「これから」どころか検索エンジンってその精度に差はあれどそもそも目的はリコメンデーションのはず。ググって上位にくるページは google が良いとお勧めしているわけだし。Amazon のお勧めなんかは心を見透かされているようで怖いくらい。
一般的に広く利用されている検索エンジンでは、入力されたキーワードを含む文書しか検索結果に出てきません。このため、利用者は欲しい情報を得るために、入力する言葉を工夫したり、検索結果の中から最も適した情報を選別する作業が必要でした。しかし、今回NRIが開発した連想検索エンジンは、キーワードの関連性を定義した“連想辞書”を自動生成し、これを参照することにより、検索語から連想されるキーワードをコンピュータが自動的に提案します。
分からない何かを検索するとき、最初に検索して引っかかったページに含まれるそれっぽい用語で再度検索して望みのページに近づいていくケースは多い。最初に検索して出てくる直接キーワードを含むページを一次的と呼ぶとすると、一次的なページに共通に含まれるキーワードで検索してたどれる二次的、三次的なページ。当然ながら探索空間は指数関数的に増大するので、それを機械でやろうとすると従来のやり方ではうまくいかない。
結局 google で検索して一発で出てこなかったけど実はこのページが欲しかったんだという情報をいかに集めるか。そしてそれをどのように利用するか。これは次の検索エンジンの大きなポイントだと思う。ここでいう連想辞書もその情報の一形態なわけだが、単なる類義語辞書から今後どのように発展させるか。結局辞書作り自体はキーワードのつながりで作成するしかないので同じ問題に直面する。
リコメンデーション技術は大きく
- 欲しいと思っている情報をより正確にかつ速く探しだせる
- 新たな出会いとしてのセレンディピティの促進
の2つに分類できると思う。後者は新聞を読んでいてふと目に留まったとか本屋で偶然見つけたとかそういう類のもの。現在の検索エンジンは基本的には前者だが、二次的、三次的なページが簡単に検索できるようになると後者の意味が強まると思う。線形、線形でたどっていく先には非線形な出会いがある。友達の友達って詳しく知らないことがほとんどなので。