コンピュータ理工学部 ネットワークメディア学科 宮森 恒 准教授

情報が氾濫する現代社会、「情報の信頼性」を見分けるための支援システムの構築を

高度情報化社会の昨今、とりわけインターネット上には
信用できる情報と信用できない情報が混在し、
判別が難しいのが現状だ。
その判別を、いかにしてコンピュータにアシストさせるか。
ある情報を、コンピュータに『信頼できる情報』と比較させることで、
その手助けをする仕組みを模索する。

コンピュータ理工学部 ネットワークメディア学科 宮森 恒 准教授

情報の「質の判定」は、信頼できるサイトと比較して行うのがここでの基本的な考え方です。

 インターネットには、政治経済、科学・技術から生活、芸能文化まであらゆる分野にわたり、膨大な情報があふれています。しかし、「信用できる役に立つ情報」と「うわさ話やデマのような信用できない情報」が混在しているために、それらを見分けるのはたいへんに難しいのが現状です。グーグルやヤフーのような検索サイトも、「情報の質」自体を分析して信頼度の高い順に表示しているわけではなく、「他の多くのウェブサイトからリンクを張られているサイトだから、そのサイトの情報はきっと信頼度が高く役に立つのだろう」という基本的な考え方で表示順を決めているのにすぎません。「情報の質」を、その意味内容を踏まえてコンピュータが判別することは現状の技術では不可能です。

 そこで、こんなふうに考えてみました。

 信頼度が判定できない情報は、信頼度がはっきりしている情報とコンピュータに比較させることで、人間が信頼度を判断する手助けができるのではないか。コンピュータは、人間のように文章を読んだり画像を見て、その意味や価値を理解する能力は持っていないけれども、大量の情報を瞬時に処理することは得意だからです。

レシピの基準

■レシピの基準
「おすすめ肉じゃが」のレシピのデータ(表1)を、「基準」としたデータ(表2)と比較すると、結果(表3)が出てくる。「基準」は、薄味好きの人が登録した肉じゃがのデータ67件を平均して算出した。

たとえば好みの料理レシピを選ぶには、自分なりの「基準」を設定しておけばいいのです。

 「レシピ比較 味コレ!」も、こうした考え方をベースに作ったシステムです。インターネットには、料理レシピのサイトやブログは膨大な数が存在しますが、信頼できるレシピか、あるいは自分の好みに合ったレシピか、といったことを判断するのに、一読しただけでは困難で、まして料理の初心者には実質的に不可能です。かといって、その都度実際に料理を作ってみて調べるわけにもいきません。

 システムを利用する人には、あらかじめ自分が信頼している料理レシピや、自分の好みに合った料理レシピを「基準」として設定しておいてもらい、調べたいレシピとコンピュータに比較させるわけです。NHKのテレビ番組「きょうの料理」のレシピや、料理研究家・小林ケンタロウさんのレシピを、まるごと信頼して「基準」としてもいいですし、自分の好みに合ったレシピをいくつも集めておいて、料理ごとの平均値を「基準」としてもかまいません。

 レシピは「要素(材料、調味料など)、分量、重要度」の3つの組がいくつか集まった情報と考えて、「要素」ごとに比較をさせます。表2は、薄味が好きな人が登録した肉じゃがのレシピ67件のデータを「要素」ごとに平均して、「基準」として設定したものです。「重要度」は多くのレシピで使われている「要素(材料)」ほど高くなります。すべてのレシピで1回使われていたら、平均も「1」になります。図1は「おすすめ肉じゃが」というあるレシピを、薄味好きの人の「基準」(表2)と比較した結果で、砂糖としょうゆが「基準」の2倍以上あり、特に味付けに関係する砂糖が8倍以上あるため、「砂糖がかなり強めの味付けになりそうです」という注意書きが出てきました。図2は濃い味好きの人の「基準」と比較した結果で、基準の2倍以上や2分の1以下の味付けに関係する「要素」はないので、「平均的な味付けになりそうです」という表示が出てきました。

 このように、現在の「レシピ比較 味コレ!」は、ユーザーの好みから大きくかけ離れたレシピや、材料表記がいい加減で信頼性が疑わしいレシピが指定されると、その場でかなり確実に「注意喚起」してくれるシステムとなっています。

 課題としてはいろいろありますが、大きく3つほど挙げられます。

 まず、レシピの分析範囲です。現状のシステムは、材料部分のみを利用していますが、料理の味、おいしさは、材料や調味料の量だけでなく、作り方によっても大きく左右されます。信頼性の低いレシピを除外するだけでなく、「ユーザーの好みにマッチしたレシピ」を正確に検出するためには、今後はレシピの分析範囲を拡大する必要があると考えています。
 次に、多様な表記への対処です。サイトによって、計量カップの大きさやグラムなどの計量単位はまちまちで、ベーキングパウダーをBPと略号で表示しているものもあります。これらをいかにして自動変換させて統一表示するか、「少々」「適量」など調味料のあいまいな表示をどのように解釈し処理するか、といった問題も解決していかなくてはなりません。

 最後に、使いやすさの向上です。例えば、薄味、濃い味、減塩など典型的な「基準」をいくつもシステム内で用意しておき、ユーザーは自分の好みに関するアンケートに答えさえすれば、もっとも近い「基準」を簡単に登録できるなど、ユーザーの手間を減らす工夫も必要だと思います。

 このような改良を重ねることで、将来は、「基準」を登録していない未知の料理でも、類似した料理のレシピと比較・推測して、一定の判定結果を出せるところまでできることが理想です。

図3:視聴者反応の例

■図3:視聴者反応の例
アメリカンフットボールの試合を見ながら、ネットでチャットをしている人が一定時間内に書き込みをした回数(横軸は時刻)。タッチダウンやインターセプトなど試合を左右する場面で書き込みが多いことがわかる。

コンピュータによる情報の意味・内容の分析と個々人の価値基準に応じた利用法を構築することが、私の研究目標です。

 このほか、ネットとテレビをうまく組み合わせれば、より視聴者の好みやニーズに合った番組を作ることができると考え、通信・放送コンテンツの融合も研究しています。たとえば、番組を見ている視聴者にネットのチャットサイトにコメントを書き込んでもらいます。おもしろかった場面、感動したシーンほど書き込み数は多くなるので、その増減をもとにハイライト番組を作ることができます。従来のハイライトの作り方だと、たとえばアメリカンフットボールの試合では、試合の構造や内容をモデル化して解析しているため、タッチダウンやインターセプトなどのシーンばかりになりますが、この手法だと視聴者の反応を利用するため、試合の合間のチアリーダーによるアトラクションの場面なども入ってきます。

 また、視聴者が番組を見ていて、ふと疑問が浮かんだり、もっと知りたいことが出てきたときに、番組を一時停止して、関連するホームページを表示するといったシステムも実現可能です。ただ、これらの技術が実用化するには、通信と放送のコンテンツを融合利用する際の法制度等を改善、整備していく必要があり、実際の普及にはまだ少し時間がかかりそうです。

 昨春、本学に赴任するまでは、独立行政法人情報通信研究機構で映像コンテンツの分析・検索や、テレビとネットの融合的利用法、高信頼情報の流通などを研究してきました。いまもっとも興味があるのは、デジタル情報(表現メディア)の意味・内容をコンピュータが的確に解釈できるようにし、個々のユーザーの価値基準に合った情報を効率よく分析・利用する方法です。情報の発信・流通が大量になされている現代だからこそ、情報の質への的確な評価とそれに基づいた流通が大切だと考えているからです。課題は多くまだまだ険しい道のりですが、大量のデータを扱うことが得意なコンピュータを利用するからこそ実現できる、新しい情報の分析・利用法を探求していきたいと考えています。

図1:うす味好きの人の基準との比較

■図1:うす味好きの人の基準との比較
「おすすめ肉じゃが」のレシピを、薄味好きの人の「基準」と比較した結果。砂糖としょうゆは「基準」の2倍以上なので、赤く表示され、「砂糖がかなり強めの味付けになりそうです」という注意書きが出てくる。

図2:濃い味好きの人の基準との比較

■図2:濃い味好きの人の基準との比較
「おすすめ肉じゃが」のレシピを、濃い味好きの人の「基準」と比較した結果。「基準」の2倍以上や2分の1以下の材料はないので、「平均的な味付けになりそうです」という表示が出てくる。

PAGE TOP