riya の新しいサービス Like.com - Schi Heil と叫ぶために

ちょっとタイミングを逃したが riya の新しいサービス Like.com について。

Google Shopping

この話を伝えるTechCrunchの記事には「はじめての本物の画像検索（"First True Visual Image Search"）」と書かれているが、これは、他の「画像検索」と称する各サービスが対象となる画像に付されたメタデータの文字情報を頼りに画像を見つけ出すのに対し、Likeではメタデータのほか画像自体の（視覚的な）類似性を手がかりに検索する、ということを意味している。
画像認識技術のRiya、イメージ検索サービス「Like.com」をついに公開 - CNET Japan

画像を入力として画像を探す。確かに Web サービスとしては新しいのかもしれない。でもこれが riya の目指すところなのだろうか？もちろん最初の一歩であり究極のゴールは高いところにあるのだろうが、それにしてもゴールと現在をつないだ線上にこの Like.com があるようには思えない。入力に任意の画像を使えるわけでもなく、検索対象もあらかじめ登録した画像だけであるのなら、タグ付けしたテキストを選んで検索することとなんら変わらない。扱う画像も「もの」だけが中心に大きく写った綺麗な写真ばかりであり、しかもそれらはあらかじめ4つのカテゴリに分類されているわけで面白さにかける。Web サービスという観点でもユーザーが API を使って商品を追加できたりアフィリエイトにつながる要素などが欲しかった。

Like.com のエンジンではテキストとイメージを検索入力として受け付けるという今まで誰もやっていないことが可能になった。検索入力にイメージを受け取った場合、このエンジンはそのイメージの特徴を抽出し、他の画像と比較して検索する。 “visual signature”（シグネチュア）と呼ばれる抽出された特徴は、元の画像を数学的に処理して得られる 10,000 種類の指数である。この指数同士が十分な数一致した場合、Like.com はこれらが似た画像だと判断する。
RiyaのLike.comは最初のホンモノのイメージ検索

また気になるのが 10,000 種類という数字。一般に画像には色やテクスチャなど様々な特徴量がある。一見特徴量を増やせば増やしただけ賢いシステムが出来上がるように思えるが、その特徴量が独立したものでなければ意味は無い。例えば重さと体積に加えて密度を追加してもそれは最初の2つから求まるため意味は無いというイメージだ。さらに効果は確かに小さいかもしれないががちょっとは違うし追加してもマイナスになることはないだろうと考えるのも誤り。実際の認識では学習サンプルが有限であるため、特徴を増やしすぎるとむしろ誤りが増えることが知られている。10,000 という数字が特徴ベクトルの次元数だとは明記していないし、もちろん riya の研究者がそれを知らないわけないが、10,000 だからすごいというこの記事の書き方は誤りだ。

私は riya の登場を知ったとき、検索の世界が単なるパターンマッチングから意味の理解へ動き出したと感じた。パターン認識技術が Web とつながり Web2.0 の次に来るものを期待した。riya には荒削りでいいので本質をついたきらりと光る何かをやってほしい。riya もベンチャーなのでビジネスとしての方向性を示す必要があったというところだろうか。riya の開発は継続するそうなので本家の方の発展に期待したい。たとえ google に買収されたとしても。