講演・口頭発表等 - 酒向 慎司
-
歌詞の韻律を用いた自動作曲
中妻 啓, 酒向 慎司, 小野 順貴, 嵯峨山 茂樹
日本音響学会2007年春季研究発表会 日本音響学会
開催年月日: 2007年03月
記述言語:日本語 会議種別:口頭発表(一般)
開催地:芝浦工業大学 豊洲キャンパス
-
HMM音声合成ツールキットver.2.0
全 炳河, 能勢 隆, 山岸 順一, 酒向 慎司, 徳田 恵一
日本音響学会2007年春季研究発表会 日本音響学会
開催年月日: 2007年03月
記述言語:日本語 会議種別:口頭発表(一般)
開催地:芝浦工業大学 豊洲キャンパス
-
視聴覚センサと擬人化音声対話エージェントによるソフトウエアロボット
酒向 慎司, 西本 卓也, 嵯峨山 茂樹
シンポジウム「実世界を核とした情報技術の新展開」 21世紀COE情報科学技術戦略コア
開催年月日: 2006年09月
記述言語:日本語 会議種別:口頭発表(一般)
開催地:東京大学 本郷キャンパス 浅野地区
-
確率文脈自由文法を用いた音楽演奏MIDIデータのリズム・テンポの認識
山本 遼, 酒向 慎司, 嵯峨山 茂樹
日本音響学会2006年秋季研究発表会 日本音響学会
開催年月日: 2006年09月
記述言語:日本語 会議種別:口頭発表(一般)
開催地:金沢大学 角間キャンパス
本論文ではオンライン手書き数式認識のための新しい手法を提案する.我々は,手書き数式を,ストローク列を生成する確率文脈自由文法としてモデル化し,数式の文法構造と2次元構造,シンボル内の構造を全て1つの文法で統一的に記述する手法を提案する.この手法によりシンボル認識・構造認識・数式文法解析といった独立の認識ステップを経ずに,これらの情報を同時に利用して数式認識を行うことができ,頑健な数式認識が期待できる.また数式の2次元構造モデルとして,さまざまな形状の非終端記号を統一的に扱うために,隠れ筆記領域という概念を提案し,これを用いて「シンボル形状に依存しない位置」をモデル化する.このモデルはデータからのパラメタ学習が可能であるため,十分な学習データが存在すれば頑健なモデルとなる期待がある.同一筆者が入力した,学術論文における中程度複雑さの8種80数式による評価実験の結果,数式のシンボル・構造の同時推定によってシンボル分割・認識精度が向上することが確かめられた.隠れ筆記領域は学習データが非常に限定されていた中で,シンボルのベースライン正解率約95%が得られた.
-
HMM音声合成の話者モデル作成の効率化に関する検討
酒向 慎司, 西本 卓也, 嵯峨山 茂樹
日本音響学会2006年秋季研究発表会 日本音響学会
開催年月日: 2006年09月
記述言語:日本語 会議種別:口頭発表(一般)
開催地:金沢大学 角間キャンパス
-
100時間ワークショップによる融合教育研究プラットフォームの開発
大武 美保子, 金田 憲二, 鴨志田 良和, 深野 亮, 白木 孝義, 伊藤 聡, 石黒 勝彦, 白井 達也, 斎藤 秀雄, 堀田 勇樹, 南里 卓也, 下畠 康幸, 吉本 晴洋, 酒向 慎司, 杉 正夫, 小谷 潔, 米田 隆一, 林 淳哉, 野口 博史, 田浦 健次朗, 大津 展之, 佐藤 知正
日本機械学会ロボティクスメカトロニクス講演会2006 日本機械学会
開催年月日: 2006年05月
記述言語:日本語 会議種別:口頭発表(一般)
開催地:早稲田大学理工学部大久保キャンパス
The importance of integrating different discipline of information science and technology is growing for the realization of information system which works robust in real world. Such system should be achieved by integrating super robust algorithm, large-scale dependable network and devices or interfaces which sense and/or actuate in the real world. It is necessary to encourage collaboration among specialists of different disciplines, since it is difficult to cover all area in information science and technology by only one person or group. In order to support collaboration among various kinds of experts, the autonomous collaborative environment for project based learning was developed. The environment comprises the workshop protocol and the community site. The workshop named "A Hundred Hour Workshop" for graduate students who belong to different departments was carried out during summer holidays. The community site named "WS100H.NET" was developed for supporting and analyzing autonomous collaboration process. Novel interdisciplinary technology, fusion of recognition and parallel computation was successfully developed. Collaboration process among the participants was autonomous with minimal facilitation by the tutor in the environment.
-
複合ウェーブレットモデルによる音声合成の検討
槐 武也, 松本 恭輔, 酒向 慎司, 嵯峨山 茂樹
日本音響学会2006年春季研究発表会 日本音響学会
開催年月日: 2006年03月
記述言語:日本語 会議種別:口頭発表(一般)
開催地:日本大学 駿河台キャンパス
-
ストローク単位の確率文脈自由文法を用いたオンライン手書き数式認識
山本 遼, 酒向 慎司, 西本 卓也, 嵯峨山 茂樹
電子情報通信学会パターン認識メディア理解研究会 電子情報通信学会
開催年月日: 2006年02月
記述言語:日本語 会議種別:口頭発表(一般)
開催地:産業技術総合研究所 本部
本論文ではオンライン手書き数式認識のための新しい手法を提案する.我々は,手書き数式を,ストローク列を生成する確率文脈自由文法としてモデル化し,数式の文法構造と2次元構造,シンボル内の構造を全て1つの文法で統一的に記述する手法を提案する.この手法によりシンボル認識・構造認識・数式文法解析といった独立の認識ステップを経ずに,これらの情報を同時に利用して数式認識を行うことができ,頑健な数式認識が期待できる.また数式の2次元構造モデルとして,さまざまな形状の非終端記号を統一的に扱うために,隠れ筆記領域という概念を提案し,これを用いて「シンボル形状に依存しない位置」をモデル化する.このモデルはデータからのパラメタ学習が可能であるため,十分な学習データが存在すれば頑健なモデルとなる期待がある.同一筆者が入力した,学術論文における中程度複雑さの8種80数式による評価実験の結果,数式のシンボル・構造の同時推定によってシンボル分割・認識精度が向上することが確かめられた.隠れ筆記領域は学習データが非常に限定されていた中で,シンボルのベースライン正解率約95%が得られた.
-
槐 武也, 松本 恭輔, 酒向 慎司, 嵯峨山 茂樹
電子情報通信学会 第78回音声研究会(SP) 電子情報通信学会
開催年月日: 2005年10月
記述言語:日本語 会議種別:口頭発表(一般)
開催地:東京大学 本郷キャンパス
本稿では、パラメトリックな音声分析合成モデルとして、複合ウェーブレットモデル(Composite Wavelet Model、以下CWM)法を提案し、その有効性について議論する。従来の巡回型フィルタによる音声合成では、その時間特性が音声品質低下の一要因である可能性があり、提案法ではこれを改善することが期待できる。提案法では音声のスペクトル包絡を混合ガウス関数モデル(GMM)で近似することで少数のパラメータによって表現する。合成時にはこのGMMの逆フーリエ変換である複合Gaborウェーブレットを基本波形として、これをピッチ周期ごとに重ね合わせて有声音を合成する。検証のため、提案法により音声を分析合成し、時間特性が改善されていることを確認した。
-
早口合成音声に対する聴取者の慣れの効果の検討
西本 卓也, 酒向 慎司, 嵯峨山 茂樹, 大島 一恵, 小田 浩一, 渡辺 隆行
日本音響学会2005年秋季研究発表会 日本音響学会
開催年月日: 2005年09月
記述言語:日本語 会議種別:口頭発表(一般)
開催地:東北大学 川内キャンパス
-
HMM音声合成手法による早口音声合成の検討
酒向 慎司, 西本 卓也, 嵯峨山 茂樹
日本音響学会2005年秋季研究発表会 日本音響学会
開催年月日: 2005年09月
記述言語:日本語 会議種別:口頭発表(一般)
開催地:東北大学 川内キャンパス
-
西本 卓也, 酒向 慎司, 嵯峨山 茂樹, 小田 浩一, 渡辺 隆行
電子情報通信学会 第25回福祉情報科学研究会 電子情報通信学会
開催年月日: 2005年05月
記述言語:日本語 会議種別:口頭発表(一般)
開催地:屋久島環境文化村センター
視覚障害者はスクリーンリーダなどの利用において, 速い話速でありながら聞き取りやすい合成音声を求めている.我々は, テキスト音声合成エンジンGalateaTalkと早口音声コーパスを用いて, 聞き取りやすい早口の合成音声を実現した.また, 4桁の乱数の読み上げ音声を聴取する実験を行い, 早口コーパスから学習した統計量を用いることで早口でかつ十分な音質の合成音声を得られること, 早口音声の聴取タスクにおいては短時間の訓練によって大きな学習効果が得られ, その効果は時間が経過しても持続すること, などの知見を得た.
-
実世界システムにおける視聴覚センシングとその統合
酒向 慎司
情報科学技術戦略コア融合プロジェクト合同ワークショップ 21世紀COE情報科学技術戦略コア
開催年月日: 2005年03月
記述言語:日本語 会議種別:口頭発表(一般)
開催地:東京大学 本郷キャンパス
-
HMM歌声合成における楽譜情報を用いたラベル設計
桑原 宏明, 都築 亮介, 全 炳河, 酒向 慎司, 徳田 恵一, 北村 正
日本音響学会2004年秋季研究発表会 日本音響学会
開催年月日: 2004年09月
記述言語:日本語 会議種別:口頭発表(一般)
開催地:琉球大学
-
柳 哲, 井上 涼子, 柳生 雄午, 酒向 慎司, 宮島 千代美, 徳田 恵一, 北村 正
電子情報通信学会2003年ソサイエティ大会 電子情報通信学会
-
信頼度尺度に基づく音声認識誤りの検出および訂正
山口 辰彦, 酒向 慎司, 山本 博史, 菊井 玄一郎
日本音響学会2003年秋季研究発表会 日本音響学会
開催年月日: 2003年09月
記述言語:日本語 会議種別:口頭発表(一般)
開催地:大同工業大学 滝春校舎
-
山口 辰彦, 酒向 慎司, 山本 博史, 菊井 玄一郎
電子情報通信学会 第65回音声研究会(SP) 電子情報通信学会
開催年月日: 2003年08月
記述言語:日本語 会議種別:口頭発表(一般)
開催地:はこだて未来大学
本稿では,N-gramでは表現できない広範囲の文脈に依存した言語知識をモデル化するために,用例文を用いた新しい言語モデルである用例文モデルの提案を行う.用例文モデルでは収集された用例文の中から,最も単語列および音順列の近いものが候補として選択される.この後,N-gramでの認識結果と用例文モデルでの結果を対応する単語ごとに比較し,N-gramでの認識結果が誤りである可能性が高い単語に対しては積極的に用例文モデルでの結果を採用し,誤りである可能性が低い単語に対しては用例文モデルでの結果が信頼性の高いものである場合のみ用例文モデルでの結果を採用する.この各単語に対する判定に対しては,N-gramでの認識結果から得られる信頼度尺度と,用例文モデルで用いられる単語列および音順列の近さの尺度である編集距離を入力とするサポートベクターマシン(SVM)を用いる.本手法は旅行対話表現集コーパスを用いた実験において約20%の誤認識率の改善が見られ,有効性が確認できた.
-
酒向 慎司, 宮島 千代美, 徳田 恵一, 北村 正
情報処理学会 第51回音楽情報科学研究会 情報処理学会
開催年月日: 2003年08月
記述言語:日本語 会議種別:口頭発表(一般)
開催地:東京大学 本郷キャンパス
隠れマルコフモデルに基づく音声合成方式を歌声合成に拡張することにより構築した歌声合成システムについて述べる.本システムでは,歌い手の声の質と基本周波数パターンに関する特徴をモデル化するため,スペクトルと基本周波数パターンをHMMにより同時にモデル化している.特に,自然な歌声を合成する上で重要な要素となる音符の音階や音長の基本周波数パターンへの影響を精度良くモデル化するため,楽譜から得られる音階と音長を考慮したコンテキスト依存モデルを構築している.これらのモデルに対して決定木によるコンテキストクラスタリング行うことで,未知の楽曲からの歌声合成が可能となっている.実験から,歌い手の特徴を再現し,なめらかで自然性の高い歌声の合成が可能であることを示す.
-
極低ビットレート音声符号化システムにおける決定木を用いたコードブックの自動決定
星屋 剛宏, 酒向 慎司, 全 炳河, 徳田 恵一, 益子 貴史, 小林 隆夫, 北村 正
日本音響学会2003年春季研究発表会 日本音響学会