HAI-2013: マルチモーダル声質変換を用いた読唇から発話への試み

発表番号	P2
発表タイトル	マルチモーダル声質変換を用いた読唇から発話への試み
筆者氏名・所属	澤田耕平 (岐阜大学) 川嶋大義 (岐阜大学) 竹原正矩 (岐阜大学) 田村哲嗣 (岐阜大学) 速水悟 (岐阜大学)
アブストラクト	声質変換 (Voice Conversion: VC) とは,言語情報を保持したまま非言語情報を変換する技術であり,人間のコミュニケーション能力を拡張することにつながる．しかし,VCには雑音によって変換音声の品質が低下するという問題がある．そこで,本稿では,VCの実用化に向けて口唇画像情報を用いたマルチモーダルVCを提案する．実験では,クリーン環境と雑音環境において,音声情報のみのVCとマルチモーダルVCの変換精度の比較を行った．
論文	PDFファイル

P2: マルチモーダル声質変換を用いた読唇から発話への試み