HAIシンポジウム2015: 強化学習と期待効用最大化と階層ディリクレ過程に基づくロボットによる最適支援行動選択と場所の分節化

発表番号	G-13
発表タイトル	強化学習と期待効用最大化と階層ディリクレ過程に基づくロボットによる最適支援行動選択と場所の分節化
筆者氏名・所属	牧野知也（岡山県立大学）岩橋直人（岡山県立大学）國島丈夫（岡山県立大学）中村友昭（電気通信大学）長井隆行（電気通信大学）
アブストラクト	本論文では強化学習を用いてロボットに行動範囲内の状態を学習させ、人間の行動と強化学習の学習結果を元に行動先を予測させる。そして、予測した結果から期待効用最大化に基づいて人間の行動を支援する最適な行動を選択する手法を提案する。これによりロボットは指示を受けることなく人間の行動先である目的地の途中にある扉を開けるなどの行動支援を行うことができるようになる。
論文	PDFファイル

G-13: 強化学習と期待効用最大化と階層ディリクレ過程に基づくロボットによる最適支援行動選択と場所の分節化