
逐次的な知識獲得による
音声対話システムの自律進化
他人と話すことを通じて新たな知識を学び取れるのは、人間が持つ知的な機能のひとつです。特に、世の中一般の事実には限らず、その場でその人と話をすることで学び取れることも多いでしょう。現在の対話システムの知識は、事前にデータから学習したり、人手で構築したりしたものが使われています。「話すにつれて賢くなるシステム」を目指します。
相手の言外の情報まで読める
マルチモーダル対話システム
文章人間は相手の話した言葉が直接意味する内容だけでなく、相手の様子や話し方も含めて理解します。つまり対話を理解するには、言語的な内容だけではなく、表情や声の調子も考慮する必要があります。画像情報や韻律情報、さらには脳波や皮膚電位などの生体信号も駆使して、対話相手がどう感じているかを推定する技術を開発しています。


様々なレイヤでの誤りや
破綻に対処する音声対話処理
音声言語を使ったコミュニケーションでは、システム間の通信のレイヤと同様、チャネル、信号、意図、対話の各レイヤで対話者の行為が共同行為となっている必要があります。つまり誤りや破綻はこのうちのどこかのレイヤでの齟齬により生じます。誤りは音声や言語を使う際には不可避ですので、齟齬の原因を同定し対処することで、誤りにも頑健な音声対話システムを目指します。
音声対話系の統一的モデリングに基づく
ユーザへのモデル自動適応
ロボットなどの音声対話システムが、会話を通じてユーザに「慣れていく」機能を開発しています。例えば、ユーザの音声を正確に聞き取れるようになる,ユーザが使う言葉や意味を齟齬なく理解できるようになる、という機能です。これは、会話を通じてシステム内部にある音声認識などのモデルをユーザへ適応することに対応します。音声対話そのものを統一的にモデリングし、パタン認識技術や機械学習技術を駆使することで本機能の実現を目指します。

紹介記事等
人型ロボットを使ったシステムのデモビデオ
※一般の方にもわかりやすいと思います
夢ナビ記事
報道記事
2022年3月
ResOU – 言語・生体情報から「ユーザはシステムとの対話を楽しんでいるか?」を推定する技術の開発
JAIST – 言語・生体情報から「ユーザはシステムとの対話を楽しんでいるか?」を推定する技術の開発
EurekAlert! – Physiological signals could be the key to “Emotionally Intelligent” AI, scientists say
2020年10月
ResOU – 「空気を読んで話す」対話システム研究用データセットHazumi を公開
朝日新聞 – 人工知能は忖度できるのか 「空気」読むAIめざすわけ
EurekAlert! – Hazumi datasets for dialogue systems that recognize human sentiment released
2017年12月
ResOU – AIが対話の流れから単語を学ぶ手法を開発
産経新聞 – AIが人間と対話し「未知の単語」学ぶ…テーラーメイドのソフト開発に期待
EurekAlert! – Technique to allow AI to learn words in the flow of dialogue developed