発表番号 | P-31 |
発表タイトル | 無報酬な環境での深層強化学習によるロボットの行動獲得 |
筆者氏名・所属 |
妹尾 卓磨(慶應義塾大学) 大澤 正彦(慶應義塾大学,日本学術振興会特別研究員) 今井 倫太(慶應義塾大学) |
アブストラクト | エージェントが他者の情報を探索的に獲得することはHAIにおいて重要だが、報酬の定義できない探索タスクなので、従来の強化学習では困難であった。しかし、Pathakらは無報酬なゲーム環境の探索を行えるIntrinsic Curiosity Module (ICM) という手法を提案している。そこで、本研究では他者の情報を探索的に獲得するエージェントを目指して、ロボットの行動獲得をICMを利用して行い、無報酬な実環境の探索について考察する。 |
論文 | PDFファイル |