発表番号 | P2 |
発表タイトル | マルチモーダル声質変換を用いた読唇から発話への試み |
筆者氏名・所属 |
澤田 耕平 (岐阜大学) 川嶋 大義 (岐阜大学) 竹原 正矩 (岐阜大学) 田村 哲嗣 (岐阜大学) 速水 悟 (岐阜大学) |
アブストラクト | 声質変換 (Voice Conversion: VC) とは,言語情報を保持したまま非言語情報を変換する技術であり,人間のコミュニケーション能力を拡張することにつながる.しかし,VCには雑音によって変換音声の品質が低下するという問題がある.そこで,本稿では,VCの実用化に向けて口唇画像情報を用いたマルチモーダルVCを提案する.実験では,クリーン環境と雑音環境において,音声情報のみのVCとマルチモーダルVCの変換精度の比較を行った. |
論文 | PDFファイル |