発表番号P2
発表タイトル マルチモーダル声質変換を用いた読唇から発話への試み
筆者氏名・所属 澤田 耕平 (岐阜大学)
川嶋 大義 (岐阜大学)
竹原 正矩 (岐阜大学)
田村 哲嗣 (岐阜大学)
速水 悟 (岐阜大学)
アブストラクト 声質変換 (Voice Conversion: VC) とは,言語情報を保持したまま非言語情報を変換する技術であり,人間のコミュニケーション能力を拡張することにつながる.しかし,VCには雑音によって変換音声の品質が低下するという問題がある.そこで,本稿では,VCの実用化に向けて口唇画像情報を用いたマルチモーダルVCを提案する.実験では,クリーン環境と雑音環境において,音声情報のみのVCとマルチモーダルVCの変換精度の比較を行った.
論文 PDFファイル