会話システムのアーキテクチャ

会話システムは複雑なデータを扱い,制御も複雑なので,アーキテクチャは重要である.はじめは,設計がしやすい階層的なアーキテクチャが用いられたが,やがて黒板モデルが用いられるようになった.

  • SHRDLUのころは,構文解析・意味解析・タスクドメインでの情報検索/問題解決という階層的なアーキテクチャと逐次処理の方式が用いられた. 実装の見通しはよいが,融通のきいた柔軟な制御は困難であった.聞きながら話す,といったことをするためには,階層モデルではできない.
  • Peedyではさまざまな工夫により階層的アーキテクチャをとりつつも柔軟な応答を実現している。音声言語認識では、タスク遂行で重要になる人名などの固有名詞辞書に力を入れている。また、実際のやり取りで使われる短い表現をテンプレートマッチングで処理している。そのほかにもタスクに依存した語彙や口語表現の処理などが行われている.対話マネジメントについては,取扱いの容易な状態遷移モデルを基本にしている.前方照応など談話構造に応じた処理を行うために文脈的な変数を用いている.エピソード記憶に対話の過程で発生したイベントを記憶している.過去のインタラクションに依存.頻繁に採択される選択肢,情動の記憶を行う.
  • Rea.Justine Cassellのグループによる不動産紹介タスクを行う会話エージェント.ユーザが来ると姿勢や顔の向きでユーザの来場をacknowledgeする.Reaはいくつかのモダリティでフィードバック(バックチャンネル)を与える.うなずき,周辺言語(例えば,”mmhmm”),あるいは”I see”といた発話.部分的にしかわかっていないときは,眉をあげる.ターンテーキング.Reaはターンを持つ話者をtrackし,ターン(発話権)を持っているときだけ発話する.一方,Reaは発話への割り込みはいつでも許している.その他,あいさつや強調など.例えば,強調はビートを伴うといった知識を使って,発話のどの部分が強調されているかを検出できる.ReaはKQMLのアーキテクチャを用いている. http://bit.ly/ehm2jz
  • BEAT (Behavior Expression Animation toolkit)[Cassell 2004]は,目標指向の[Cassell 1999]と対照的に,システム指向.behavior生成のためのツールキットとしてBEATが紹介されたのちそれを使ったアニメーションが説明されている. http://bit.ly/eTsiOT
  • Helmut Prendinger, Mitsuru Ishizuka (2004)のLife-Like Characters.ビデオ一覧はこちら http://bit.ly/h0dh4q

コメントを残す

メールアドレスが公開されることはありません。 * が付いている欄は必須項目です