発表番号 | II-2B-6 |
発表タイトル | 認識に使用する顔領域の違いによる読唇性能の比較 |
筆者氏名・所属 |
池田大輔 (豊橋技術科学大学) 桂田浩一 (豊橋技術科学大学) 入部百合絵 (豊橋技術科学大学) 新田恒雄 (豊橋技術科学大学) |
アブストラクト | 本研究ではエージェントの発話認識の一手法として,顔画像からの読唇について検討する.従来の読唇に関する研究では固定した顔領域(口唇領域,顔全体等)を用いて認識を行うのが一般的である.しかし実際の発話を考えた場合,唇の形状のみが変化する音素や,顎や皺の形状が広い範囲で変化する音素など,音素ごとに変化する顔領域が異なる.そこで本研究では,顔全体,口周辺,口唇の各領域を用いた母音・子音認識実験を行い,母音・子音ごとに最適な顔領域を分析する. |
論文 | PDFファイル |