研究報告情報学基礎(FI) 2010-FI-97(11), 1-6, 2010-01-21
情報処理学会
http://arakilab.media.eng.hokudai.ac.jp/~araki/2009/2009-C-6.pdf
http://ci.nii.ac.jp/naid/110008003402

非タスク志向型対話システムにおいて、ユーザーが過去に話した対話内容と関連のある発言を再び行った際に、対話履歴からユーザー発話の要約を用いて応答するシステムを提案する。これによって、システムが会話上新たな情報を提供できなくなった時に飽きられる問題を緩和することができる。

ただし、後ろの方に行くと説明がだんだん雑になり、よくわからないところがある。締め切り間際だったのだろうか?
私の背景知識不足によるものかもしれないが。


[latexpage] まず、過去の対話内容に関連する発話が有効かどうかの調査を行い有効だという結果を得ている。

手法は以下の通り。

このシステムでは、まずユーザーがキーワードを入力するので、過去の対話ログから、このキーワードに関係した話題区間の抽出を行う。

このために、単語の「主題度」を定義する。これは松尾らの既存研究[3]内の概念を利用している。以下の式で算出する。

ユーザーから与えられたキーワードの主題度が一番高い発話$u(i)$(多分「文」のようなもの)を「基点」と定義する。
※ただし、ユーザーから与えられたキーワードが名詞の場合は、一度しか出現しない語でも直後の話題に大きく影響する場合があるので(例えば、アーティストの名前が一回だけ出て、あとはその作品が次々出るような場合)、キーワードが名詞の場合に限り主題度がなくてもキーワードが最も多く出現する回の最初の出現位置を基点とする。

次に、基点となる発話$u(i)$内の単語$\omega$の重要度を計算する。単なる、文の中での重要度の比率である。

これによって、話題区間が切り出されたものとする。

話題区間が切り出されたら、発話文を要約する。
これには、複数の語からなる短いフレーズを抜き出し、それをつなげていく。フレーズは次の式によってスコアリングを行う。

このスコアが1を越えたものについて、二階マルコフ辞書を用いて、可能なら各フレーズをつなげる。(大和田注:もうちょっと詳しく教えてほしい)

印象評価を実験してみたところ、好感度の向上が見られたとのこと。ただし、人間らしさ指標だけは低下した。脈絡のない応答の方が面白みがあると感じられることもあるらしい。

カテゴリー: Blog