発表番号P2-40
発表タイトル グラフニューラルネットワークを用いた多人数会話における発話バランス推定の試み
筆者氏名・所属 吉井 一総 (工学院大学工学研究科情報学専攻)
吉田 直人 (工学院大学情報学部情報デザイン学科)
アブストラクト 本研究では,多人数対話における話者関与の度合いは定性的で教師信号を得にくい点に着目し,参加者の正面映像から顔向き・身体方向・発話状態から疑似ラベルを生成して,GNNの注意機構を自己教師ありで学習させた.検証に際して対話映像が収録されたデータセットを用い,正解値として俯瞰映像から関与の度合いを5段階で主観的に評価させた.比較にはこの主観評定値と重み付き隣接行列の行和を代表値に用い,それぞれを順位化して一致率を比較した.結果として最下位の一致率は42.3%であり,消極的発話者支援への活用可能性が示唆された.
論文 PDFファイル