比べて見つけるおふくろの味—情報の「質」を見極める新しい情報比較手法—

コンピュータ理工学部 ネットワークメディア学科 宮森 恒 准教授

情報の「質」を見極める新しい情報比較手法

 インターネットや新聞、雑誌などのメディアには、膨大な量のさまざまな情報が溢れています。宮森恒先生の研究テーマは“メディアインテリジェンス”。メディアの中でも、TVなどの放送番組とインターネットを対象に、文字情報や画像情報に着目して、情報の質を見分けることで、それらを賢く便利に利用する研究をされています。新しい情報比較技術(特許出願済み)を使った「レシピ比較 味コレ!」を中心に、最近の研究についてお聞きしました。

情報の「質」を効率良く見分けるには?

 インターネットにはたくさんのデジタル情報が溢れていますが、現在は「質が高くて役に立つ情報」と、「根拠のない噂やデマといった質の低い情報」が混在している状態です。そのため、検索サイトなどで情報を探し出せても、それが信頼できるものか、自分が求める妥当なものかどうかははっきりしません。そこで、信頼性が不確かな情報と、信頼性がはっきりしている別の情報とをコンピュータでうまく比較することで、情報の質を効率よく見極める手助けができないかと考えました。

その料理レシピ、自分に合っているかわかりますか?

 料理レシピの例で考えてみましょう。インターネットでは、一般の人が簡単に投稿できるレシピサイトやブログなどで、さまざまな料理レシピが公開されています。しかし、あまりにも多くのレシピがあると、どれもおいしそうで、1つ1つ自分に合ったレシピかどうかを判断するのは難しいですよね。そこで、それらが自分に合ったレシピかの判断を助ける「レシピ比較 味コレ!」という試作システムを作りました。

 利用者は、あらかじめ自分が信頼する(自分に合った)料理レシピを「基準」として設定しておきます。そして、投稿サイトやブログで見つけた調べたいレシピと、その「基準」とを比較します。

 図1は、「おすすめ肉じゃが」というレシピを、うす味が好きな人が登録した「基準」(うす味のレシピが登録されています)と比べた結果です。図1の棒グラフでは、「基準レシピ」の各材料の分量を1とした、「おすすめ肉じゃが」の割合を表示しています。基準に対して2倍以上、あるいは、1/2以下になる材料は赤色や黄色に色を変えて表示しているので、どの材料がどのくらい基準と異なるのかが一目で確認できます。ここでは砂糖としょうゆが赤く表示され、うす味好きな人には味が濃くなりすぎるようです。

 一方、図2は同じレシピを、濃い味が好きな人が登録した料理レシピを「基準」として比べた結果です。赤色や黄色の部分はなくなり「平均的な味付けになりそうです」と表示されています。「おすすめ肉じゃが」は、濃い味好きの人の基準ではぴったりの味付けになる可能性が高いことがわかるのです。

「味コレ!」の仕組み新しい情報比較手法を発明

 「味コレ!」では、対象の料理レシピを1つの情報とみます。さらにその情報を「要素、分量、重要度」の3つからなる組の「集合」と考えて、情報の比較を行います。表1は、「おすすめ肉じゃが」のデータです。「おすすめ肉じゃが」という1つの情報は、「にんじん、0.125本、1」といった「要素、分量、重要度」の3つからなる組がいくつも集まってできています。

 表2はうす味好きの人が登録した肉じゃがのデータ67件分の「平均」を「基準」として設定したものです。平均は材料ごとに計算します。また、67件の中により多く出現する材料ほど、重要度の値が大きくなります。これを見ると砂糖やじゃがいも、たまねぎがより重要な材料だということがわかります。

  「味コレ!」は、これら2つの「3つ組の集合」の「差」や「類似度」などを計算して比較を行います。表3は、表1の「おすすめ肉じゃが」と表2の「基準」を比較した結果です。割合の欄には、表2の各材料の分量を基準とした際の表1の分量の割合が (砂糖の場合は19.125g÷2.193g= 8.721)、重要度の欄には「基準」における材料の重要度が表示されています。単位が合わずに比較できないものや、表1のみに含まれる材料は、棒線(―)になっています。この場合、砂糖の重要度が最も大きく、基準に対する割合も最大のため、「砂糖がかなり強めの味付けになりそうです」というメッセージが表示されます。

 詳しい数式は省略しますが、以上の仕組みを使うことで、信頼性が不確かな情報が、信頼性のはっきりしている別の情報(基準となる情報)と、どの程度かけ離れているのか、あるいは似ているのかがわかり、調べたい情報が自分に合った情報かどうかの判断がしやすくなるのです。

表1・表2・表3

世界中のレシピを比較広がる対象

図1・図2

  「3つ組の集合」を使った情報比較の手法※1は、レシピ以外のものにも応用できます。ただ比較的単純に思える料理レシピの場合でも、「適量」、「少々」などのあいまいな分量表示への対応、計量カップ、グラムなどの単位の統一や変換、BPはベーキングパウダーの略といった省略を補う処理など、いろいろな工夫が必要です。そのため、3つ組の集合を検出する手法をアレンジする必要はあるでしょう。

 「レシピ比較 味コレ!」については、近いうちに日本の主なレシピサイトのデータをすべて扱えるようにしたいと思っています※2。また、海外のレシピサイトにも対象を広げていければと考えています。国による違いも出て、おもしろい結果が出るのではと今から楽しみです。基準の設定や比較の方法にも工夫する余地はたくさんありますから、試行錯誤を重ねながら、利用者が膨大なレシピの中から理想のレシピを判断できるようなシステムを完成させたいですね。

※1 この情報比較の手法は、インターネット上から信頼性の高い情報とそうでない情報を、利用者が効率よく見極めるための手法としてこれまでにないもの。

※2 現在はNHKの「みんなのきょうの料理」(http://www.kyounoryouri.jp/)と、日本最大の投稿型料理レシピサイト「クックパッド」(http://cookpad.com/)の約43万件のレシピを扱うことができる。

実況チャットによるオリジナルハイライト生成

 研究室では、情報の信頼性分析の他に、TVなどの放送番組とWebを対象にした横断検索や閲覧システムについても研究しています。その1つが“実況チャット”によるテレビ番組のオリジナルハイライト生成。“実況チャット”とは、テレビを視聴しながらWeb上のチャットコミュニティに、番組と並行したコメントをリアルタイムで書きこむもので、近年利用者数が増えています。この実況チャットを利用すると、自分の嗜好に合ったオリジナルなハイライトを自動生成することができるのです。チャットのコメントは、主に書き込み時刻、利用者 ID、書き込み内容から構成されますが、ある時間帯での書き込み数や特定フレーズ、アスキーアート※3等を利用すれば、盛り上がった場面や落胆した場面を効率よく見つけることができます。

 アメリカンフットボールの試合番組で実験すると、おもしろいことに、重要なプレー以外にも、珍しいグッズの紹介場面やチアガールの登場シーンなどがハイライトとして選択されました。これは、各シーンでチャットをしていた視聴者が、たくさんコメントを書き込んだことを表しています。映像中のテロップ(文字)や観客の歓声の変化などを利用する従来のハイライト生成方法では、このようなシーンは決して選ばれることはありません。視聴者の感情や反応をダイレクトに反映させることで、型にはまったものではなく、本当に盛り上がったシーンを、より忠実に再現することができると考えられます。

 さらに、自分がある番組で書き込みをしたときに、自分と同じように書き込みをした他の視聴者を、「類似視聴者」として記録しておくと、自分が録画しておいた、まだ見ていない別の番組を短時間でハイライト視聴したいときに(今週1週間の巨人阪神戦で一番盛り上がったシーンを2分で見たいなど)、類似視聴者の書き込みをもとにハイライトを生成すれば、自分の好みに近いハイライトを作ることができると考えられます。このように実況チャットを使うと、型にはまったものではなく、より自分の好みに近いハイライト生成が可能になるのです。

※3 顔文字など文字と記号で描かれた図像のこと。コンピュータの文字コードをアスキーコードと呼ぶことからこの名がついた。喜びの表現に用いられるものに「キターーーー( ゜∀゜) ーーーー!!!」、「アヒャッヒャ!ヽ( ゜∀゜)ノアッヒャッヒャ!」、落胆の表現に用いられるものに「(ノД`)アチャー」、「ヽ(`Д´)ノノウワアアン)」など。

アドバイス

疑問の数が増えるほど世の中は面白い

 研究のスタンスとして「研究の意義」を大切にしています。自分の研究が、どういう発 想でどういう技術を使って、どういうことができるようになるのかを説明できなければ いけないと考えているからです。これは社会に出ればなおさらです。大学在学中から「何 となく」、「人に言われたから」という姿勢ではなく、「使う人」にどういうメッセージを伝 えたいのかを意識して研究に取り組んでほしいと思います。

 データの検証作業など、実際の研究には地道な作業も多いですが、プログラミング技術の応用に対する好奇心がある人や、粘り強く物事に取り組める人には、ぜひ研究室の門をたたいてほしいですね。「大量のデータを適切に扱える力」を身につけることで広がる「コンピュータ理工学部の将来の魅力、可能性」を存分に伝えたいと思います。

コンピュータ理工学部 ネットワークメディア学科 宮森 恒 准教授

プロフィール

電気系のことを勉強したくて、電気工学よりも「フォーカスがはっきりしている」と電子通信を専攻。大学院ではネットワークとマルチメディアの研究室で「映像」を扱うグループに入った。初めての課題は「卓球をしているテスト画像の中から手の部分だけを自動的に切り出せ」。最初は簡単そうだと思ったこの課題で、複雑な映像信号から境目を決めてある映 像を取り出して処理する難しさを知った(ちなみに、この技術は未だに完成されていません)。レシピへの応用を思いついたのは、「ネット上のレシピを信じて料理を作ったら、ひどい味になった(ノД`)」という義母の話がきっかけ。大阪府立北野高等学校OB。

PAGE TOP