2007年5月12日

『2.0』目指すNii(4)〜「利用者発信情報」と個人

 国立情報学研究所(NII)が「Yahoo!知恵袋」のデータ提供を受け、研究に利用するという。おもしろい取り組みだと思うのだが、知恵袋のデータを使って意味のある研究ができるのかどうかは大いに疑問である。

 「利用者発信情報」という表現には、「利用者」というものを一段低いものとして見下ろしているような印象を受けてしまう。「情報」と呼ぶには不十分で中途半端だけれども無視はできないものを、とりあえずそう呼んでいるのだろうか。すると、このブログの中身は「利用者発信情報」なのか。誰がどのように発信すれば、「利用者発信情報」ではなく「情報」になるのか。「利用者発信情報」と呼んでいる人は、利用者ではないのか。

 似たような話として、「匿名の個人」が発信する情報は信用できないという風潮が未だに残っている。

・「企業製品への Blog 書き込み、ポジティブな「ファン」が7割以上――Web 広告研究会「Blog 書き込み調査」」(2005年11月28日)
 http://japan.internet.com/wmnews/20051128/4.html

 > 「ブロガーは匿名であっても読者との継続的な対話になるため、掲示板での書き込みに比べて非建設的、悪意的な誹謗・抽象に走りにくいのではないか」

 「誹謗・抽象」というのは誤字だろう。それはともかく、匿名で情報を発信する個人に対する不信感は根深い。ただ、ブロガーの多くは、匿名ではなくハンドルネームを使って情報を発信している。一定のハンドルネームを使うのは、「匿名希望」とは違う。逆に、インターネット上で氏名らしき文字列が名前欄に書かれていたとしても、それが実在する人物の氏名なのか、書いているのが本人なのかを確かめる術はない。氏名を書くということに意味がないのである。個人が識別できれば十分であり、ハンドルネームはその役に立つ。ハンドルネームを使って情報を発信している人は、自分が匿名で情報を発信しているとは思っていない。それに、読者との継続的な対話になるため云々というのは順序が逆だ。読者との継続的な対話をするために、自分を自分だと識別してもらうために、ハンドルネームを名乗っているのである。

続きを読む
posted by tht at 23:46 | コメント (0) | トラックバック (0) | imolist!

2007年5月12日

『2.0』目指すNii(3)〜空っぽの「情報爆発」とGoogleデスクトップ

 国立情報学研究所(NII)が「Yahoo!知恵袋」のデータ提供を受け、研究に利用するという。おもしろい取り組みだと思うのだが、知恵袋のデータを使って意味のある研究ができるのかどうかは大いに疑問である。

 そもそも図書館のデータベース構築や学術情報の流通の電子化に取り組んできた情報学研究所が「Y!知恵袋」に着目するのは、2000年以降に顕著になった「情報爆発」という現象に着目してのことである。

・「情報爆発の時代」
 http://www.tkl.iis.u-tokyo.ac.jp/Kilab/Research/Paper/2005/Kitsuregawa-FOSE-200511.pdf

 > 2000年前後より、人類が創出する情報量が爆発的に増加しているという統計が米国カルフォルニア大学バークレイ校より報告された。

・国立情報学研究所「i-explosion プロジェクト概要」
 http://i-explosion.ex.nii.ac.jp/i-explosion/ctr.php/m/Index/a/Introduction/

 > 本特定領域研究は…爆発する大量で多様な情報から真に必要とする情報を効率良く且つ偏りなく安心して取り出すことを可能とする技術、大量の情報を管理する大規模な情報システムを安定・安全に運用するための新しいサステナブルな技術、並びに、人間とのしなやかな対話により誰もが容易に情報を利活用できるようにする技術の確立を目指す。

続きを読む
posted by tht at 22:44 | コメント (0) | トラックバック (0) | imolist!

2007年5月12日

『2.0』目指すNii(2)〜魅力あるサービスを生み出すには

 国立情報学研究所(NII)が「Yahoo!知恵袋」のデータ提供を受け、研究に利用するという。おもしろい取り組みだと思うのだが、知恵袋のデータを使って意味のある研究ができるのかどうかは大いに疑問である。

 そもそも、具体的な何かのサービスと切り離して、検索技術だけを開発することが有意義なのかは、批判的に検討したい。便利で魅力的なサービスを作るためには、最適な検索技術とリッチなデータベースの両方が揃っていなければならない。

続きを読む
posted by tht at 22:23 | コメント (0) | トラックバック (0) | imolist!

2007年5月12日

『2.0』目指すNii(1)〜「Y!知恵袋」の正体は「居心地のいいBBS」

 「検索技術の開発にあたって学術論文や新聞記事を素材にしているだけでいいのだろうか」(2006年6月6日の記事)と書いていたら、「Yahoo!知恵袋のデータベースを研究に利用する」という話が出てきた。

・国立情報学研究所「Web 2.0に向けた新たな情報検索技術の研究を開始」(2007年3月6日)
 http://www.nii.ac.jp/news_jp/2007/03/web_20_yahoo_1.shtml

・@IT「Q&Aサイトなら米国に勝てる? 「Yahoo!知恵袋」研究が開始」(2007年3月6日)
 http://www.atmarkit.co.jp/news/200703/06/yahoo.html

・日経ITpro「国立情報学研究所,Yahoo!知恵袋のQ&Aデータを無償提供」(2007年3月6日)
 http://itpro.nikkeibp.co.jp/article/NEWS/20070306/264067/

 おもしろい取り組みだと思うのだが、「Yahoo!知恵袋」のデータを使って意味のある研究ができるのかどうかは大いに疑問である。そもそも「Yahoo!知恵袋」とは、どういうものなのだろうか。

続きを読む
posted by tht at 22:21 | コメント (0) | トラックバック (0) | imolist!

2006年11月26日

次世代検索はキーワードいらず〜「見えざる関係」の可視化がカギ

 旧来のキーワード検索は、必要なことがすべて記述されていることを前提にしている。用語の統制が取れている新聞記事や論文ならよいが、多様な人々が思い思いの言葉で綴るカジュアルなブログやBBSには太刀打ちできない。

 次世代の検索技術では、文章の特徴を抽出して似ている記事を探す機能や、個々の記事ではなく筆者を単位として検索する機能などが注目される。

続きを読む
posted by tht at 18:16 | コメント (0) | トラックバック (0) | imolist!

2006年11月26日

関連文書提示機能の改善〜「簡単な連想検索」が実現

 だいぶ時間が開いてしまったが、私のサイトのフォーラムで9月1日に行なった改良についての補足説明である。

 「連想検索」というものをご存知だろうか。

Webcat Plus「連想検索について / 連想検索のコンセプト」

 私のところの機能も「簡単な連想検索」と呼べそうな状態になってきた。あくまでも簡易版であるが、過去ログの全件全文を分析対象にしていること、もともと特定のテーマの(比較的狭い範囲の)話題を扱う一BBSのログであり、極端なノイズが出にくいことから、簡単な仕組みでも実用的な精度の連想検索ができているように思う。

続きを読む
posted by tht at 17:53 | コメント (0) | トラックバック (0) | imolist!

2006年9月11日

タグがネットを切り拓く〜ソーシャルブックマークの優位性

 自分が見たウェブページに「タグ」と呼ばれる分類のラベルを貼って他の人に紹介することのできるサービス、「ソーシャルブックマーク」が流行している。(「クリップ」と呼んでいるところもある。)ポータルサイトやコミュニティサイトがこぞってサービスを始めており、あなたもきっとどこかで見たことがあるだろう。

 しかし、内容はいまいちなところが多い。マニアックすぎる内容や、あまりにも賛否の割れるような時事問題ばかりが出てくる。それぞれのサイトが抱えるコミュニティの性質がダイレクトに現れているのだろう。何気なくのぞいてみた人は、ちょっと近寄りがたいという印象を持つかも知れない。

続きを読む
posted by tht at 00:04 | コメント (0) | トラックバック (0) | imolist!

2006年8月6日

imolist!×Ajax

 新しい技術の理解には、長ったらしい説明を聞くよりサンプルを見るのが一番…ということを再認識させられた。遅れ馳せながら、Ajaxである。

・@IT「実践Ajaxアプリケーション」(2005年8月2日)

続きを読む
posted by tht at 21:46 | コメント (0) | トラックバック (0) | imolist!

2006年6月25日

要約と「地の文」

 FORUM×ATOSに要約を表示する機能を追加した。一覧表示画面で使用するほか、メタデータの「概要」にも使うことができる。フォーラムのトップページで最新の発言の概要をコンパクトに表示できるようにして「思わず続きを読みたくなるデザイン」にしたいという目論見もある。

 既に定着している書式を活用して「地の文」を取り出し、段落・文の長さに着目しながら冒頭部分の要約を生成する。ブログにおける「続きを読む」に相当する「テキストの分割」ができればよいのであり、全体を適切に要約した要約になっている必要はない。

続きを読む
posted by tht at 21:24 | コメント (0) | トラックバック (0) | imolist!

2006年6月6日

反復度によるキーワード抽出と関連文書列挙

 昨年秋よりフォーラムの機能強化に手をつけており、既に引用関係索引「imolist!」を作っている。

 今回は簡単なテキストマイニングに挑戦してみた。以下、参考にした資料を紹介しながらメモ的に記す。私自身のオリジナルなアイデアは(まだ)ほとんど含まれていないので、ウェブサイトや掲示板をお持ちの方が同じ方法を試行されることはまったく構わない。

 先に要点だけまとめておくと、「漢字とカタカナ」から成る語句を抽出、「反復度」を求めて重み付けを行ない、キーワードや関連する記事を表示するというもの。結果として「自然言語によるクエリ」に近いものができた、今後は自動要約も…という話である。

続きを読む
posted by tht at 22:31 | コメント (0) | トラックバック (0) | imolist!

2006年1月12日

BBSの全体像を描くには

 「このBBSはこれこれこういうBBSです」と書かれているだけで、BBSのイメージが湧くでしょうか。

 「百聞は一見にしかず」「能書きはいらない」などと言います。やはり説明文だけでは無理なようです。

 新しく来た人にすばやくBBSの全体像をつかんでもらうには、どうしたらいいのでしょうか。

続きを読む
posted by tht at 22:48 | コメント (1) | トラックバック (0) | imolist!

2006年1月1日

そこにMiniBBSがあったから

 「リニア型で話題拡散型のBBS」と「ノンリニア型で話題集束型のBBS」とが二大軸になることが期待されるものの、現状では前者ばかりが目に付きバランスに欠けている、と書きました。

 不特定多数を相手にするBBSでは最小公倍数的な運営スタイルをとらざるを得ず、決まりきったスタイルに落ち着くのは自然なことでしょう。多様な運営スタイルが本来なら存在していてしかるべきなのは、個人サイトです。その個人サイトのBBSが多様ではなく画一的である背景には、どんな事情があるのでしょうか。

続きを読む
posted by tht at 22:53 | コメント (0) | トラックバック (0) | imolist!

2006年1月1日

BBSの運営スタイル

 よく見かけるBBSを大雑把に分類してみましょう。

・MiniBBS型…いわゆるふつうの掲示板。個人サイトに多い。
・2ちゃんねる型…マルチスレッド型掲示板。掲示板専門のサイトに多い。
・ポータルサイト型…いわゆる質問掲示板。企業が運営するサイトに多い。

 これらのいずれも、「ノンリニア型で話題集束型のBBS」ではありません。

続きを読む
posted by tht at 22:45 | コメント (0) | トラックバック (0) | imolist!

2006年1月1日

BBSの構造と性格

 インターネット上にあふれる多種多様な電子掲示板(BBS)を、私なりに分類してみます。

BBSの情報構造に着目

・リニア型…ページに記事が特定の順序(例えば時系列)で並んでいて、それ以外の並べ方はできないタイプ。
・ノンリニア型…ページが記事単位で独立していて、関係性や重要度に基づいて分類されているタイプ。

BBSが持つ性格に着目

・話題拡散型…他者への言及が少なく、多くの話題が散発的に出されるタイプ。掲示板、ゲストブックと称すことが多い。日記、情報交換、ユーザーサポートなど。
・話題集束型…他者への言及が多く、一つの話題に多くの人が加わるタイプ。電子会議室、フォーラムと称すことがある。討論、共同作業など。

続きを読む
posted by tht at 22:44 | コメント (0) | トラックバック (0) | imolist!

2005年11月29日

引用で結びつく論文と「Re:[1234]」で成り立つBBS

 論文の探し方を教わったことのある方なら、下のようなことを一度は聞いたことがあるでしょう。

・注目すべき内容を含む論文は、より多くの論文から引用される(はずである)
・引用関係をたどれば、関連性の高い論文が見つけられる(はずである)

 こういう考え方で資料を探すことは「引用検索」と呼ばれます。一つ一つはバラバラに書かれて発表される論文が、互いに「引用」という関係によって結びついているのです。

 でもって、これから自分が書く論文についても、嫌というほど「引用はしっかり明示しなさい」「参考文献リストをつけなさい」と指導されたはず。それはとりもなおさず、自分が恩恵を受けた引用のネットワークに自分も貢献するということに他なりません。

 同じことがインターネット上の電子掲示板(BBS)でもできないか…と思ったのが、「imolist!」を作り始めたきっかけの一つです。

続きを読む
posted by tht at 10:27 | コメント (0) | トラックバック (0) | imolist!

2005年11月28日

BBS引用索引プログラム「imolist!」

 プログラミングを勉強しつつ、メディア論や情報組織化といった分野も勉強している身として、何か形あるものを作りたい、と思って作り始めたのが「imolist!」です。

 私のサイトの「FORUM×ATOS」で実際に動かしていますので、ご興味のある方はご覧ください。当初はフォーラム上に「開発メモ」(のようなもの)を書いていたのですが、あまり適切ではないとは思っていましたので、以後ブログで書くことにします。

続きを読む
posted by tht at 17:41 | コメント (0) | トラックバック (0) | imolist!