発表番号P-31
発表タイトル 無報酬な環境での深層強化学習によるロボットの行動獲得
筆者氏名・所属 妹尾 卓磨(慶應義塾大学)
大澤 正彦(慶應義塾大学,日本学術振興会特別研究員)
今井 倫太(慶應義塾大学)
アブストラクト エージェントが他者の情報を探索的に獲得することはHAIにおいて重要だが、報酬の定義できない探索タスクなので、従来の強化学習では困難であった。しかし、Pathakらは無報酬なゲーム環境の探索を行えるIntrinsic Curiosity Module (ICM) という手法を提案している。そこで、本研究では他者の情報を探索的に獲得するエージェントを目指して、ロボットの行動獲得をICMを利用して行い、無報酬な実環境の探索について考察する。
論文 PDFファイル