2006年11月26日

次世代検索はキーワードいらず〜「見えざる関係」の可視化がカギ

 旧来のキーワード検索は、必要なことがすべて記述されていることを前提にしている。用語の統制が取れている新聞記事や論文ならよいが、多様な人々が思い思いの言葉で綴るカジュアルなブログやBBSには太刀打ちできない。

 次世代の検索技術では、文章の特徴を抽出して似ている記事を探す機能や、個々の記事ではなく筆者を単位として検索する機能などが注目される。

続きを読む
posted by tht at 18:16 | コメント (0) | トラックバック (0) | imolist!

2006年11月26日

関連文書提示機能の改善〜「簡単な連想検索」が実現

 だいぶ時間が開いてしまったが、私のサイトのフォーラムで9月1日に行なった改良についての補足説明である。

 「連想検索」というものをご存知だろうか。

Webcat Plus「連想検索について / 連想検索のコンセプト」

 私のところの機能も「簡単な連想検索」と呼べそうな状態になってきた。あくまでも簡易版であるが、過去ログの全件全文を分析対象にしていること、もともと特定のテーマの(比較的狭い範囲の)話題を扱う一BBSのログであり、極端なノイズが出にくいことから、簡単な仕組みでも実用的な精度の連想検索ができているように思う。

続きを読む
posted by tht at 17:53 | コメント (0) | トラックバック (0) | imolist!