発表番号II-2B-6
発表タイトル 認識に使用する顔領域の違いによる読唇性能の比較
筆者氏名・所属 池田大輔 (豊橋技術科学大学)
桂田浩一 (豊橋技術科学大学)
入部百合絵 (豊橋技術科学大学)
新田恒雄 (豊橋技術科学大学)
アブストラクト 本研究ではエージェントの発話認識の一手法として,顔画像からの読唇について検討する.従来の読唇に関する研究では固定した顔領域(口唇領域,顔全体等)を用いて認識を行うのが一般的である.しかし実際の発話を考えた場合,唇の形状のみが変化する音素や,顎や皺の形状が広い範囲で変化する音素など,音素ごとに変化する顔領域が異なる.そこで本研究では,顔全体,口周辺,口唇の各領域を用いた母音・子音認識実験を行い,母音・子音ごとに最適な顔領域を分析する.
論文 PDFファイル