講演・口頭発表等 - 酒向 慎司
-
信頼度尺度に基づく音声認識誤りの検出および訂正
山口 辰彦, 酒向 慎司, 山本 博史, 菊井 玄一郎
日本音響学会2003年秋季研究発表会 日本音響学会
開催年月日: 2003年09月
記述言語:日本語 会議種別:口頭発表(一般)
開催地:大同工業大学 滝春校舎
-
山口 辰彦, 酒向 慎司, 山本 博史, 菊井 玄一郎
電子情報通信学会 第65回音声研究会(SP) 電子情報通信学会
開催年月日: 2003年08月
記述言語:日本語 会議種別:口頭発表(一般)
開催地:はこだて未来大学
本稿では,N-gramでは表現できない広範囲の文脈に依存した言語知識をモデル化するために,用例文を用いた新しい言語モデルである用例文モデルの提案を行う.用例文モデルでは収集された用例文の中から,最も単語列および音順列の近いものが候補として選択される.この後,N-gramでの認識結果と用例文モデルでの結果を対応する単語ごとに比較し,N-gramでの認識結果が誤りである可能性が高い単語に対しては積極的に用例文モデルでの結果を採用し,誤りである可能性が低い単語に対しては用例文モデルでの結果が信頼性の高いものである場合のみ用例文モデルでの結果を採用する.この各単語に対する判定に対しては,N-gramでの認識結果から得られる信頼度尺度と,用例文モデルで用いられる単語列および音順列の近さの尺度である編集距離を入力とするサポートベクターマシン(SVM)を用いる.本手法は旅行対話表現集コーパスを用いた実験において約20%の誤認識率の改善が見られ,有効性が確認できた.
-
酒向 慎司, 宮島 千代美, 徳田 恵一, 北村 正
情報処理学会 第51回音楽情報科学研究会 情報処理学会
開催年月日: 2003年08月
記述言語:日本語 会議種別:口頭発表(一般)
開催地:東京大学 本郷キャンパス
隠れマルコフモデルに基づく音声合成方式を歌声合成に拡張することにより構築した歌声合成システムについて述べる.本システムでは,歌い手の声の質と基本周波数パターンに関する特徴をモデル化するため,スペクトルと基本周波数パターンをHMMにより同時にモデル化している.特に,自然な歌声を合成する上で重要な要素となる音符の音階や音長の基本周波数パターンへの影響を精度良くモデル化するため,楽譜から得られる音階と音長を考慮したコンテキスト依存モデルを構築している.これらのモデルに対して決定木によるコンテキストクラスタリング行うことで,未知の楽曲からの歌声合成が可能となっている.実験から,歌い手の特徴を再現し,なめらかで自然性の高い歌声の合成が可能であることを示す.
-
極低ビットレート音声符号化システムにおける決定木を用いたコードブックの自動決定
星屋 剛宏, 酒向 慎司, 全 炳河, 徳田 恵一, 益子 貴史, 小林 隆夫, 北村 正
日本音響学会2003年春季研究発表会 日本音響学会
-
徳田 恵一, 水谷 伸晃, 酒向 慎司, 石松 喜伸, 吉村 貴克, 河井 恒
日本音響学会2003年春季研究発表会 日本音響学会
-
HMMに基づいた極低ビットレート音声符号化システムの性能改善
星屋 剛宏, 酒向 慎司, 全 炳河, 徳田 恵一, 益子 貴史, 小林 隆夫, 北村 正
日本音響学会2002年秋季研究発表会 日本音響学会
開催年月日: 2002年09月
記述言語:日本語 会議種別:口頭発表(一般)
開催地:秋田大学 手形キャンパス
-
誤り単語の検出・訂正システムの統合と評価
酒向 慎司, 山本 博史, 菊井 玄一郎
日本音響学会2002年秋季研究発表会 日本音響学会
開催年月日: 2002年09月
記述言語:日本語 会議種別:口頭発表(一般)
開催地:秋田大学 手形キャンパス
-
井上 涼子, 柳生 雄午, 酒向 慎司, 宮島 千代美, 徳田 恵一, 北村 正
第1回情報科学技術フォーラム(FIT2002) 情報処理学会,電子情報通信学会 情報・システムソサイエティ,電子情報通信学会 ヒューマンコミュニケーショングループ
-
石川 ちさと, 伊藤 正典, 酒向 慎司, 宮島 千代美, 徳田 恵一, 北村 正
第1回情報科学技術フォーラム(FIT2002) 情報処理学会,電子情報通信学会 情報・システムソサイエティ,電子情報通信学会 ヒューマンコミュニケーショングループ
-
主成分分析を用いた基本動作HMMによるジェスチャー認識
柳生 雄午, 酒向 慎司, 宮島 千代美, 徳田 恵一, 北村 正
第63回全国大会情報処理学会全国大会 情報処理学会
開催年月日: 2001年09月
記述言語:日本語 会議種別:口頭発表(一般)
開催地:山口大学 吉田地区キャンパス
-
中谷 博美, 酒向 慎司, 徳田 恵一, 北村 正
2001年電子情報通信学会総合大会 電子情報通信学会
-
HMMに基づいた極低ビットレート音声符号化におけるピッチ情報のベクトル量子化
川角 佳弘, 酒向 慎司, 徳田 恵一, 益子 貴史, 小林 隆夫, 北村 正
日本音響学会2001年春季研究発表会 日本音響学会
-
酒向 慎司, 近藤 重一, 益子 貴史, 徳田 恵一, 小林 隆夫, 北村 正
日本音響学会2001年春季研究発表会 日本音響学会
-
酒向 慎司, 徳田 恵一, 益子 貴史, 小林 隆夫, 北村 正
電子情報通信学会2000年総合大会 電子情報通信学会
-
ピクセルベースアプローチによるHMMに基づいた唇動画像の生成
酒向 慎司, 徳田 恵一, 益子 貴史, 小林 隆夫, 北村 正
電子情報通信学会 パターン認識・メディア理解研究会 電子情報通信学会
開催年月日: 1999年11月
記述言語:日本語 会議種別:口頭発表(一般)
開催地:琉球大学
隠れマルコフモデル(HMM)に基づき,任意の入カテキストから実画像に近い唇動画像を生成するシステムを提案する.我々がこれまでに提案してきたHMMに基づく音声合成法により,高品質なテキスト音声合成システムが実現されているが,これと同一の枠組みを,ピクセルベースの唇画像生成に適用する.音素単位でモデル化された唇動画像HMMを連結し,尤度最大化基準によりHMMの各状態から最適な画像系列を求める.この際,静的特徴量(唇の形状)のみでなく,動的特徴量(唇の動き)を考慮することにより,なめらかに変化する唇動画像を合成することができる.本研究では,新たに作成した日本語連続文章による大規模な唇動画像データベースを用いて,唇動画像合成システムを構築した.任意の入力テキストから合成された唇動画像では,実写画像に近い唇の動きを確認することができた.