カテゴリ imolist!
『2.0』目指すNii(4)〜「利用者発信情報」と個人 (2007/5/12)
『2.0』目指すNii(3)〜空っぽの「情報爆発」とGoogleデスクトップ (2007/5/12)
『2.0』目指すNii(2)〜魅力あるサービスを生み出すには (2007/5/12)
『2.0』目指すNii(1)〜「Y!知恵袋」の正体は「居心地のいいBBS」 (2007/5/12)
次世代検索はキーワードいらず〜「見えざる関係」の可視化がカギ (2006/11/26)
関連文書提示機能の改善〜「簡単な連想検索」が実現 (2006/11/26)
タグがネットを切り拓く〜ソーシャルブックマークの優位性 (2006/9/11)
imolist!×Ajax (2006/8/6)
要約と「地の文」 (2006/6/25)
反復度によるキーワード抽出と関連文書列挙 (2006/6/6)
BBSの全体像を描くには (2006/1/12)
そこにMiniBBSがあったから (2006/1/1)
BBSの運営スタイル (2006/1/1)
BBSの構造と性格 (2006/1/1)
引用で結びつく論文と「Re:[1234]」で成り立つBBS (2005/11/29)
BBS引用索引プログラム「imolist!」 (2005/11/28)
『2.0』目指すNii(3)〜空っぽの「情報爆発」とGoogleデスクトップ (2007/5/12)
『2.0』目指すNii(2)〜魅力あるサービスを生み出すには (2007/5/12)
『2.0』目指すNii(1)〜「Y!知恵袋」の正体は「居心地のいいBBS」 (2007/5/12)
次世代検索はキーワードいらず〜「見えざる関係」の可視化がカギ (2006/11/26)
関連文書提示機能の改善〜「簡単な連想検索」が実現 (2006/11/26)
タグがネットを切り拓く〜ソーシャルブックマークの優位性 (2006/9/11)
imolist!×Ajax (2006/8/6)
要約と「地の文」 (2006/6/25)
反復度によるキーワード抽出と関連文書列挙 (2006/6/6)
BBSの全体像を描くには (2006/1/12)
そこにMiniBBSがあったから (2006/1/1)
BBSの運営スタイル (2006/1/1)
BBSの構造と性格 (2006/1/1)
引用で結びつく論文と「Re:[1234]」で成り立つBBS (2005/11/29)
BBS引用索引プログラム「imolist!」 (2005/11/28)
(16)
2007年5月12日
『2.0』目指すNii(4)〜「利用者発信情報」と個人
国立情報学研究所(NII)が「Yahoo!知恵袋」のデータ提供を受け、研究に利用するという。おもしろい取り組みだと思うのだが、知恵袋のデータを使って意味のある研究ができるのかどうかは大いに疑問である。
「利用者発信情報」という表現には、「利用者」というものを一段低いものとして見下ろしているような印象を受けてしまう。「情報」と呼ぶには不十分で中途半端だけれども無視はできないものを、とりあえずそう呼んでいるのだろうか。すると、このブログの中身は「利用者発信情報」なのか。誰がどのように発信すれば、「利用者発信情報」ではなく「情報」になるのか。「利用者発信情報」と呼んでいる人は、利用者ではないのか。
似たような話として、「匿名の個人」が発信する情報は信用できないという風潮が未だに残っている。
・「企業製品への Blog 書き込み、ポジティブな「ファン」が7割以上――Web 広告研究会「Blog 書き込み調査」」(2005年11月28日)
http://japan.internet.com/wmnews/20051128/4.html
> 「ブロガーは匿名であっても読者との継続的な対話になるため、掲示板での書き込みに比べて非建設的、悪意的な誹謗・抽象に走りにくいのではないか」
「誹謗・抽象」というのは誤字だろう。それはともかく、匿名で情報を発信する個人に対する不信感は根深い。ただ、ブロガーの多くは、匿名ではなくハンドルネームを使って情報を発信している。一定のハンドルネームを使うのは、「匿名希望」とは違う。逆に、インターネット上で氏名らしき文字列が名前欄に書かれていたとしても、それが実在する人物の氏名なのか、書いているのが本人なのかを確かめる術はない。氏名を書くということに意味がないのである。個人が識別できれば十分であり、ハンドルネームはその役に立つ。ハンドルネームを使って情報を発信している人は、自分が匿名で情報を発信しているとは思っていない。それに、読者との継続的な対話になるため云々というのは順序が逆だ。読者との継続的な対話をするために、自分を自分だと識別してもらうために、ハンドルネームを名乗っているのである。
続きを読む
「利用者発信情報」という表現には、「利用者」というものを一段低いものとして見下ろしているような印象を受けてしまう。「情報」と呼ぶには不十分で中途半端だけれども無視はできないものを、とりあえずそう呼んでいるのだろうか。すると、このブログの中身は「利用者発信情報」なのか。誰がどのように発信すれば、「利用者発信情報」ではなく「情報」になるのか。「利用者発信情報」と呼んでいる人は、利用者ではないのか。
似たような話として、「匿名の個人」が発信する情報は信用できないという風潮が未だに残っている。
・「企業製品への Blog 書き込み、ポジティブな「ファン」が7割以上――Web 広告研究会「Blog 書き込み調査」」(2005年11月28日)
http://japan.internet.com/wmnews/20051128/4.html
> 「ブロガーは匿名であっても読者との継続的な対話になるため、掲示板での書き込みに比べて非建設的、悪意的な誹謗・抽象に走りにくいのではないか」
「誹謗・抽象」というのは誤字だろう。それはともかく、匿名で情報を発信する個人に対する不信感は根深い。ただ、ブロガーの多くは、匿名ではなくハンドルネームを使って情報を発信している。一定のハンドルネームを使うのは、「匿名希望」とは違う。逆に、インターネット上で氏名らしき文字列が名前欄に書かれていたとしても、それが実在する人物の氏名なのか、書いているのが本人なのかを確かめる術はない。氏名を書くということに意味がないのである。個人が識別できれば十分であり、ハンドルネームはその役に立つ。ハンドルネームを使って情報を発信している人は、自分が匿名で情報を発信しているとは思っていない。それに、読者との継続的な対話になるため云々というのは順序が逆だ。読者との継続的な対話をするために、自分を自分だと識別してもらうために、ハンドルネームを名乗っているのである。
続きを読む
2007年5月12日
『2.0』目指すNii(3)〜空っぽの「情報爆発」とGoogleデスクトップ
国立情報学研究所(NII)が「Yahoo!知恵袋」のデータ提供を受け、研究に利用するという。おもしろい取り組みだと思うのだが、知恵袋のデータを使って意味のある研究ができるのかどうかは大いに疑問である。
そもそも図書館のデータベース構築や学術情報の流通の電子化に取り組んできた情報学研究所が「Y!知恵袋」に着目するのは、2000年以降に顕著になった「情報爆発」という現象に着目してのことである。
・「情報爆発の時代」
http://www.tkl.iis.u-tokyo.ac.jp/Kilab/Research/Paper/2005/Kitsuregawa-FOSE-200511.pdf
> 2000年前後より、人類が創出する情報量が爆発的に増加しているという統計が米国カルフォルニア大学バークレイ校より報告された。
・国立情報学研究所「i-explosion プロジェクト概要」
http://i-explosion.ex.nii.ac.jp/i-explosion/ctr.php/m/Index/a/Introduction/
> 本特定領域研究は…爆発する大量で多様な情報から真に必要とする情報を効率良く且つ偏りなく安心して取り出すことを可能とする技術、大量の情報を管理する大規模な情報システムを安定・安全に運用するための新しいサステナブルな技術、並びに、人間とのしなやかな対話により誰もが容易に情報を利活用できるようにする技術の確立を目指す。
続きを読む
そもそも図書館のデータベース構築や学術情報の流通の電子化に取り組んできた情報学研究所が「Y!知恵袋」に着目するのは、2000年以降に顕著になった「情報爆発」という現象に着目してのことである。
・「情報爆発の時代」
http://www.tkl.iis.u-tokyo.ac.jp/Kilab/Research/Paper/2005/Kitsuregawa-FOSE-200511.pdf
> 2000年前後より、人類が創出する情報量が爆発的に増加しているという統計が米国カルフォルニア大学バークレイ校より報告された。
・国立情報学研究所「i-explosion プロジェクト概要」
http://i-explosion.ex.nii.ac.jp/i-explosion/ctr.php/m/Index/a/Introduction/
> 本特定領域研究は…爆発する大量で多様な情報から真に必要とする情報を効率良く且つ偏りなく安心して取り出すことを可能とする技術、大量の情報を管理する大規模な情報システムを安定・安全に運用するための新しいサステナブルな技術、並びに、人間とのしなやかな対話により誰もが容易に情報を利活用できるようにする技術の確立を目指す。
続きを読む
2007年5月12日
『2.0』目指すNii(2)〜魅力あるサービスを生み出すには
国立情報学研究所(NII)が「Yahoo!知恵袋」のデータ提供を受け、研究に利用するという。おもしろい取り組みだと思うのだが、知恵袋のデータを使って意味のある研究ができるのかどうかは大いに疑問である。
そもそも、具体的な何かのサービスと切り離して、検索技術だけを開発することが有意義なのかは、批判的に検討したい。便利で魅力的なサービスを作るためには、最適な検索技術とリッチなデータベースの両方が揃っていなければならない。
続きを読む
そもそも、具体的な何かのサービスと切り離して、検索技術だけを開発することが有意義なのかは、批判的に検討したい。便利で魅力的なサービスを作るためには、最適な検索技術とリッチなデータベースの両方が揃っていなければならない。
続きを読む
2007年5月12日
『2.0』目指すNii(1)〜「Y!知恵袋」の正体は「居心地のいいBBS」
「検索技術の開発にあたって学術論文や新聞記事を素材にしているだけでいいのだろうか」(2006年6月6日の記事)と書いていたら、「Yahoo!知恵袋のデータベースを研究に利用する」という話が出てきた。
・国立情報学研究所「Web 2.0に向けた新たな情報検索技術の研究を開始」(2007年3月6日)
http://www.nii.ac.jp/news_jp/2007/03/web_20_yahoo_1.shtml
・@IT「Q&Aサイトなら米国に勝てる? 「Yahoo!知恵袋」研究が開始」(2007年3月6日)
http://www.atmarkit.co.jp/news/200703/06/yahoo.html
・日経ITpro「国立情報学研究所,Yahoo!知恵袋のQ&Aデータを無償提供」(2007年3月6日)
http://itpro.nikkeibp.co.jp/article/NEWS/20070306/264067/
おもしろい取り組みだと思うのだが、「Yahoo!知恵袋」のデータを使って意味のある研究ができるのかどうかは大いに疑問である。そもそも「Yahoo!知恵袋」とは、どういうものなのだろうか。
続きを読む
・国立情報学研究所「Web 2.0に向けた新たな情報検索技術の研究を開始」(2007年3月6日)
http://www.nii.ac.jp/news_jp/2007/03/web_20_yahoo_1.shtml
・@IT「Q&Aサイトなら米国に勝てる? 「Yahoo!知恵袋」研究が開始」(2007年3月6日)
http://www.atmarkit.co.jp/news/200703/06/yahoo.html
・日経ITpro「国立情報学研究所,Yahoo!知恵袋のQ&Aデータを無償提供」(2007年3月6日)
http://itpro.nikkeibp.co.jp/article/NEWS/20070306/264067/
おもしろい取り組みだと思うのだが、「Yahoo!知恵袋」のデータを使って意味のある研究ができるのかどうかは大いに疑問である。そもそも「Yahoo!知恵袋」とは、どういうものなのだろうか。
続きを読む
2006年11月26日
次世代検索はキーワードいらず〜「見えざる関係」の可視化がカギ
旧来のキーワード検索は、必要なことがすべて記述されていることを前提にしている。用語の統制が取れている新聞記事や論文ならよいが、多様な人々が思い思いの言葉で綴るカジュアルなブログやBBSには太刀打ちできない。
次世代の検索技術では、文章の特徴を抽出して似ている記事を探す機能や、個々の記事ではなく筆者を単位として検索する機能などが注目される。
続きを読む
次世代の検索技術では、文章の特徴を抽出して似ている記事を探す機能や、個々の記事ではなく筆者を単位として検索する機能などが注目される。
続きを読む
2006年11月26日
関連文書提示機能の改善〜「簡単な連想検索」が実現
だいぶ時間が開いてしまったが、私のサイトのフォーラムで9月1日に行なった改良についての補足説明である。
「連想検索」というものをご存知だろうか。
・Webcat Plus「連想検索について / 連想検索のコンセプト」
私のところの機能も「簡単な連想検索」と呼べそうな状態になってきた。あくまでも簡易版であるが、過去ログの全件全文を分析対象にしていること、もともと特定のテーマの(比較的狭い範囲の)話題を扱う一BBSのログであり、極端なノイズが出にくいことから、簡単な仕組みでも実用的な精度の連想検索ができているように思う。
続きを読む
「連想検索」というものをご存知だろうか。
・Webcat Plus「連想検索について / 連想検索のコンセプト」
私のところの機能も「簡単な連想検索」と呼べそうな状態になってきた。あくまでも簡易版であるが、過去ログの全件全文を分析対象にしていること、もともと特定のテーマの(比較的狭い範囲の)話題を扱う一BBSのログであり、極端なノイズが出にくいことから、簡単な仕組みでも実用的な精度の連想検索ができているように思う。
続きを読む
2006年9月11日
タグがネットを切り拓く〜ソーシャルブックマークの優位性
自分が見たウェブページに「タグ」と呼ばれる分類のラベルを貼って他の人に紹介することのできるサービス、「ソーシャルブックマーク」が流行している。(「クリップ」と呼んでいるところもある。)ポータルサイトやコミュニティサイトがこぞってサービスを始めており、あなたもきっとどこかで見たことがあるだろう。
しかし、内容はいまいちなところが多い。マニアックすぎる内容や、あまりにも賛否の割れるような時事問題ばかりが出てくる。それぞれのサイトが抱えるコミュニティの性質がダイレクトに現れているのだろう。何気なくのぞいてみた人は、ちょっと近寄りがたいという印象を持つかも知れない。
続きを読む
しかし、内容はいまいちなところが多い。マニアックすぎる内容や、あまりにも賛否の割れるような時事問題ばかりが出てくる。それぞれのサイトが抱えるコミュニティの性質がダイレクトに現れているのだろう。何気なくのぞいてみた人は、ちょっと近寄りがたいという印象を持つかも知れない。
続きを読む
2006年8月6日
imolist!×Ajax
新しい技術の理解には、長ったらしい説明を聞くよりサンプルを見るのが一番…ということを再認識させられた。遅れ馳せながら、Ajaxである。
・@IT「実践Ajaxアプリケーション」(2005年8月2日)
続きを読む
・@IT「実践Ajaxアプリケーション」(2005年8月2日)
続きを読む
2006年6月25日
2006年6月6日
反復度によるキーワード抽出と関連文書列挙
昨年秋よりフォーラムの機能強化に手をつけており、既に引用関係索引「imolist!」を作っている。
今回は簡単なテキストマイニングに挑戦してみた。以下、参考にした資料を紹介しながらメモ的に記す。私自身のオリジナルなアイデアは(まだ)ほとんど含まれていないので、ウェブサイトや掲示板をお持ちの方が同じ方法を試行されることはまったく構わない。
先に要点だけまとめておくと、「漢字とカタカナ」から成る語句を抽出、「反復度」を求めて重み付けを行ない、キーワードや関連する記事を表示するというもの。結果として「自然言語によるクエリ」に近いものができた、今後は自動要約も…という話である。
続きを読む
今回は簡単なテキストマイニングに挑戦してみた。以下、参考にした資料を紹介しながらメモ的に記す。私自身のオリジナルなアイデアは(まだ)ほとんど含まれていないので、ウェブサイトや掲示板をお持ちの方が同じ方法を試行されることはまったく構わない。
先に要点だけまとめておくと、「漢字とカタカナ」から成る語句を抽出、「反復度」を求めて重み付けを行ない、キーワードや関連する記事を表示するというもの。結果として「自然言語によるクエリ」に近いものができた、今後は自動要約も…という話である。
続きを読む
2006年1月12日
BBSの全体像を描くには
「このBBSはこれこれこういうBBSです」と書かれているだけで、BBSのイメージが湧くでしょうか。
「百聞は一見にしかず」「能書きはいらない」などと言います。やはり説明文だけでは無理なようです。
新しく来た人にすばやくBBSの全体像をつかんでもらうには、どうしたらいいのでしょうか。
続きを読む
「百聞は一見にしかず」「能書きはいらない」などと言います。やはり説明文だけでは無理なようです。
新しく来た人にすばやくBBSの全体像をつかんでもらうには、どうしたらいいのでしょうか。
続きを読む
2006年1月1日
そこにMiniBBSがあったから
「リニア型で話題拡散型のBBS」と「ノンリニア型で話題集束型のBBS」とが二大軸になることが期待されるものの、現状では前者ばかりが目に付きバランスに欠けている、と書きました。
不特定多数を相手にするBBSでは最小公倍数的な運営スタイルをとらざるを得ず、決まりきったスタイルに落ち着くのは自然なことでしょう。多様な運営スタイルが本来なら存在していてしかるべきなのは、個人サイトです。その個人サイトのBBSが多様ではなく画一的である背景には、どんな事情があるのでしょうか。
続きを読む
不特定多数を相手にするBBSでは最小公倍数的な運営スタイルをとらざるを得ず、決まりきったスタイルに落ち着くのは自然なことでしょう。多様な運営スタイルが本来なら存在していてしかるべきなのは、個人サイトです。その個人サイトのBBSが多様ではなく画一的である背景には、どんな事情があるのでしょうか。
続きを読む
2006年1月1日
BBSの運営スタイル
よく見かけるBBSを大雑把に分類してみましょう。
・MiniBBS型…いわゆるふつうの掲示板。個人サイトに多い。
・2ちゃんねる型…マルチスレッド型掲示板。掲示板専門のサイトに多い。
・ポータルサイト型…いわゆる質問掲示板。企業が運営するサイトに多い。
これらのいずれも、「ノンリニア型で話題集束型のBBS」ではありません。
続きを読む
・MiniBBS型…いわゆるふつうの掲示板。個人サイトに多い。
・2ちゃんねる型…マルチスレッド型掲示板。掲示板専門のサイトに多い。
・ポータルサイト型…いわゆる質問掲示板。企業が運営するサイトに多い。
これらのいずれも、「ノンリニア型で話題集束型のBBS」ではありません。
続きを読む
2006年1月1日
BBSの構造と性格
インターネット上にあふれる多種多様な電子掲示板(BBS)を、私なりに分類してみます。
BBSの情報構造に着目
・リニア型…ページに記事が特定の順序(例えば時系列)で並んでいて、それ以外の並べ方はできないタイプ。
・ノンリニア型…ページが記事単位で独立していて、関係性や重要度に基づいて分類されているタイプ。
BBSが持つ性格に着目
・話題拡散型…他者への言及が少なく、多くの話題が散発的に出されるタイプ。掲示板、ゲストブックと称すことが多い。日記、情報交換、ユーザーサポートなど。
・話題集束型…他者への言及が多く、一つの話題に多くの人が加わるタイプ。電子会議室、フォーラムと称すことがある。討論、共同作業など。
続きを読む
BBSの情報構造に着目
・リニア型…ページに記事が特定の順序(例えば時系列)で並んでいて、それ以外の並べ方はできないタイプ。
・ノンリニア型…ページが記事単位で独立していて、関係性や重要度に基づいて分類されているタイプ。
BBSが持つ性格に着目
・話題拡散型…他者への言及が少なく、多くの話題が散発的に出されるタイプ。掲示板、ゲストブックと称すことが多い。日記、情報交換、ユーザーサポートなど。
・話題集束型…他者への言及が多く、一つの話題に多くの人が加わるタイプ。電子会議室、フォーラムと称すことがある。討論、共同作業など。
続きを読む
2005年11月29日
引用で結びつく論文と「Re:[1234]」で成り立つBBS
論文の探し方を教わったことのある方なら、下のようなことを一度は聞いたことがあるでしょう。
・注目すべき内容を含む論文は、より多くの論文から引用される(はずである)
・引用関係をたどれば、関連性の高い論文が見つけられる(はずである)
こういう考え方で資料を探すことは「引用検索」と呼ばれます。一つ一つはバラバラに書かれて発表される論文が、互いに「引用」という関係によって結びついているのです。
でもって、これから自分が書く論文についても、嫌というほど「引用はしっかり明示しなさい」「参考文献リストをつけなさい」と指導されたはず。それはとりもなおさず、自分が恩恵を受けた引用のネットワークに自分も貢献するということに他なりません。
同じことがインターネット上の電子掲示板(BBS)でもできないか…と思ったのが、「imolist!」を作り始めたきっかけの一つです。
続きを読む
・注目すべき内容を含む論文は、より多くの論文から引用される(はずである)
・引用関係をたどれば、関連性の高い論文が見つけられる(はずである)
こういう考え方で資料を探すことは「引用検索」と呼ばれます。一つ一つはバラバラに書かれて発表される論文が、互いに「引用」という関係によって結びついているのです。
でもって、これから自分が書く論文についても、嫌というほど「引用はしっかり明示しなさい」「参考文献リストをつけなさい」と指導されたはず。それはとりもなおさず、自分が恩恵を受けた引用のネットワークに自分も貢献するということに他なりません。
同じことがインターネット上の電子掲示板(BBS)でもできないか…と思ったのが、「imolist!」を作り始めたきっかけの一つです。
続きを読む
2005年11月28日
BBS引用索引プログラム「imolist!」
プログラミングを勉強しつつ、メディア論や情報組織化といった分野も勉強している身として、何か形あるものを作りたい、と思って作り始めたのが「imolist!」です。
私のサイトの「FORUM×ATOS」で実際に動かしていますので、ご興味のある方はご覧ください。当初はフォーラム上に「開発メモ」(のようなもの)を書いていたのですが、あまり適切ではないとは思っていましたので、以後ブログで書くことにします。
続きを読む
私のサイトの「FORUM×ATOS」で実際に動かしていますので、ご興味のある方はご覧ください。当初はフォーラム上に「開発メモ」(のようなもの)を書いていたのですが、あまり適切ではないとは思っていましたので、以後ブログで書くことにします。
続きを読む