発表番号G-18
発表タイトル 予測可能性を用いたエージェント間の暗黙の社会的規範に基づく協調行動の創発
筆者氏名・所属 山口 拓巳 (静岡大学)
竹内 勇剛 (静岡大学)
アブストラクト 本研究は,協調行動の基盤として「予測可能性」に着目し,報酬最大化に依存しない社会的規範の創発を検討した.行動方策の時間的一貫性をKLダイバージェンスとして定義した行動コストをモデルベース強化学習に組み込み,マルチエージェント環境での検証を行った結果,行動コストを導入した条件では,全てのエージェントが走行タイル端を走るという共通の行動様式が自発的に獲得され,衝突を回避する安定した協調行動が形成された.これにより他者モデルや明示的なコミュニケーションなしに,予測可能性が暗黙の社会的規範の創発を支えうることを示唆した.
論文 PDFファイル