News Outline Background Publications Download
Galatea
Galatea@IIPL.JAIST
Agent Manager
Research(Emotional-Agent)
Research(Head-Movement)
Publications
Video Demonstrations
Contact us
JAIST
IIPL

感情や個性を持つ擬人化音声対話エージェントの実現に向けて

( はじめに )

  • 将来の人間と機械とのコミュニケーションにおいては、機械があたかも一個の人間のように話し、聞き、振舞うことの実現が必要であると考える。 例えば、人間が伝えたい情報を十分に引き出すためには、機械も人間のように存在感があり、人格を持ち、個性や感情を反映して振舞うような人間らしさが必要であると筆者らは考えている。
  • また、近年デジタルペットなどさまざまな個性豊かなキャタクタが登場し、エンターテイメント市場において、その地位を確立しつつある。 これはキャラクタの工学的な利用価値だけではなく、個性の付与によって生み出される面白さに価値が見出されている一例といえる。
  • この個性の演出方法として、筆者らは機械の振舞を数理的モデルで表現することで、振舞から見出される感情や個性をパラメトリックに扱うことを試みている。

( これまでの試み )

[Kawamoto2000Interaction] HMMによる振舞のモデル化

  • 2人の話者A(ユーザー、外部), B(システム)の対話において、Aの発話に対して、Bが応答・振舞を決めるとき、
    • 「Bの現在の状態や経験」を基に、
    • 「Aから得られた情報」を利用して、
    • 「適切な応答・振舞を決定」する
    問題を考える。
  • この問題に対して、中身は見えないけど人間らしく振舞うモデル、つまり人間の内部状態をある程度ブラックボックス的に扱うモデルを考える。
  • また、人間の心が状態の変化で表現されると仮定するならば、Aの発話に対して、Bが応答・振舞を決めることは、
    • 「Bの状態・モデル」}を基に、
    • 「Aからの入力系列」}を利用して、
    • 「適切な応答・振舞を尤度最大の基準で推定する」}問題ととらえる
    ことで、隠れマルコフモデル(Hidden Markov Model; HMM)を適用できると考えた。

[Kawamoto2001Interaction] 声の好みによるモデル切り替え

  • 既報[Kawamoto2000Interaction]のモデルでは、どのユーザに対しても同じ1つのモデルで応対していた。試作したシステムは音声と映像を出力するが、システムが受け取る情報は音声のみであるので、ユーザ側の映像を伝送しないテレビ電話のような状況である。人間同士の対話の場合、このような電話による対話でも、相手の声によって応対が変わりうる。そこで、ユーザの声によってシステムの応対モデルの切替機構を新たに実装した。
  • 応対の変化要因もさまざま考えられるが、今回は声の好みに着目する。 その際、システムにとっての声の好みを認識する必要がある。この認識には、 話者認識で実績のある GMM (Gaussian Mixture Model) を利用する。
  • ある人の声の好みをモデル化するために、
    • さまざまな話者の音声を1人の被験者に聞いてもらい、その声が好みかどうかを主観評価し、
    • 主観評価値の同じ音声データを集めて GMM を学習する。
  • これにより、被験者の音声の好みに対応するモデルを生成する。また、各主観評価値に対応した応対モデルも生成する。

( 発表文献 )

  • [Kawamoto2001Interaction]
    川本 真一, 山崎 義人, 高坂 大輔, 坂井 伸圭, 田村 紗雪, 松下 善則, 中井 満, 下平 博 , 嵯峨山 茂樹, ``声の好みによって確率的に振舞が変化する擬人化対話エージェント,'' Interaction 2001, Mar 2001.
  • [Kawamoto2000Interaction]
    川本 真一, 井波 暢人, 加藤 裕, 槻尾 洋志, 藤永 勝久, 山崎 義人, 横山 国宏, 中井 満 , 下平 博 , 嵯峨山 茂樹, ``確率的な振舞を伴う擬人化対話エージェント,'' Interaction2000 論文集, pp.61-62, Feb 2000.