音声情報処理

授業目的
メディア情報処理の重要な要素である音声認識・合成・対話技術に焦点をあて,その基礎となる音声情報処理技術を習得する.
到達目標
フーリエ変換の応用としてのケプストラム分析,それに基づく音程(ピッチ)分析,スペクトル概形分析,また音声特有のスペクトル分析である線形予測分析法を習得する.さらに各論として,隠れマルコフモデルに基づく音声認識,波形編集による音声合成,状態遷移モデルによる音声対話の制御技術について理解し,応用できる.
授業計画
第1回(1) 序論,音声とは何か?
【事前学習】当日分の図表等資料を印刷し予習する.(1時間)
【事後学習】講義ノートと資料を照合し内容を整理する.理解を深める.(2時間)
第2回(2) 音声のスペクトル分析
【事前学習】前回までの内容を復習.当日分の図表等資料を印刷し予習する.(1時間)
【事後学習】講義ノートと資料を照合し内容を整理する.理解を深める.(2時間)
第3回(3) ケプストラム分析
【事前学習】前回までの内容を復習.当日分の図表等資料を印刷し予習する.(1時間)
【事後学習】講義ノートと資料を照合し内容を整理する.理解を深める.(2時間)
第4回(4) 線形予測分析
【事前学習】前回までの内容を復習.当日分の図表等資料を印刷し予習する.(1時間)
【事後学習】講義ノートと資料を照合し内容を整理する.理解を深める.(2時間)
第5回(5) 音程(ピッチ)分析
【事前学習】前回までの内容を復習.当日分の図表等資料を印刷し予習する.(1時間)
【事後学習】講義ノートと資料を照合し内容を整理する.理解を深める.(2時間)
第6回(6) スペクトル概形分析
【事前学習】前回までの内容を復習.当日分の図表等資料を印刷し予習する.(1時間)
【事後学習】講義ノートと資料を照合し内容を整理する.理解を深める.(2時間)
第7回(7) 基礎項目まとめ
【事前/事後学習】(1)~(6)回のノートを見直し,理解不足の点を確認・補完する.(3時間)
第8回(8) 隠れマルコフモデルに基づく音声認識1 (特徴抽出)
【事前学習】当日分の図表等資料を印刷し予習する.(1時間)
【事後学習】講義ノートと資料を照合し内容を整理する.理解を深める.(2時間)
第9回(9) 隠れマルコフモデルに基づく音声認識2 (音響処理)
【事前学習】前回までの内容を復習.当日分の図表等資料を印刷し予習する.(1時間)
【事後学習】講義ノートと資料を照合し内容を整理する.理解を深める.(2時間)
第10回(10) 隠れマルコフモデルに基づく音声認識3 (言語処理)
【事前学習】前回までの内容を復習.当日分の図表等資料を印刷し予習する.(1時間)
【事後学習】講義ノートと資料を照合し内容を整理する.理解を深める.(2時間)
第11回(11) 波形編集に基づく音声合成
【事前学習】前回までの内容を復習.当日分の図表等資料を印刷し予習する.(1時間)
【事後学習】講義ノートと資料を照合し内容を整理する.理解を深める.(2時間)
第12回(12) 状態遷移モデルによる音声対話の制御
【事前学習】前回までの内容を復習.当日分の図表等資料を印刷し予習する.(1時間)
【事後学習】講義ノートと資料を照合し内容を整理する.理解を深める.(2時間)
第13回(13) 音声による人間と機械の対話システム
【事前学習】前回までの内容を復習.当日分の図表等資料を印刷し予習する.(1時間)
【事後学習】講義ノートと資料を照合し内容を整理する.理解を深める.(2時間)
第14回(14) 応用項目まとめ
【事前/事後学習】(8)~(13)回のノートを見直し,理解不足の点を確認・補完する.(3時間)
第15回(15) 総復習
【事前/事後学習】再度全体のノートを見直し,理解不足の点を確認・補完する.(3時間)
【授業外学修】他科目の先習は必要ないが,併せて「音声信号処理実習」を履修することで,理解を深めることができる.1年次に「微分積分学I 」,2年次に「メディア信号処理」を先習しておくことが望ましい.