講演・口頭発表等 - 酒向 慎司
-
音声合成のための話者モデルにおける話者再現性の分析
後藤 哲平, 酒向 慎司, 趙 國, 山下 洋一
日本音響学会2010年研究発表会 日本音響学会
開催年月日: 2010年09月
記述言語:日本語 会議種別:口頭発表(一般)
開催地:関西大学
-
HMM歌唱合成のための歌唱データベースの構築
酒向 慎司, 北村 正
日本音響学会2010年研究発表会 日本音響学会
開催年月日: 2010年09月
記述言語:日本語 会議種別:ポスター発表
開催地:関西大学
-
楽譜を考慮した統計的演奏者モデル化手法と演奏者識別による評価
奥村 健太, 酒向 慎司, 北村 正
日本音響学会2010年研究発表会 日本音響学会
開催年月日: 2010年09月
記述言語:日本語 会議種別:口頭発表(一般)
開催地:関西大学
-
音楽の印象推定モデルにおける個人性の適用に関する検討
西尾 圭一郎, 酒向 慎司, 北村 正
第12回日本感性工学会大会 日本感性工学会
開催年月日: 2010年09月
記述言語:日本語 会議種別:口頭発表(一般)
開催地:東京工業大学 大岡山キャンパス
-
状態共有型HMMに基づく音楽音響信号からの自動和音認識の検討
伊藤 綾, 酒向 慎司, 北村 正
第9回情報科学技術フォーラム 情報処理学会,電子情報通信学会 情報・システムソサイエティ,電子情報通信学会 ヒューマンコミュニケーショングループ
開催年月日: 2010年09月
記述言語:日本語 会議種別:口頭発表(一般)
開催地:九州大学 伊都キャンパス
計算機やネットワークの普及により,音楽コンテンツの多様化・大規模化が進むなかで,より柔軟な音楽検索やコンテンツ作成支援のための環境はまだ十分ではなく,音響信号の内容そのものを音楽的な側面で解析する技術が求められている.本稿では音楽の内容を表す情報として和音進行に注目し,音響信号からの自動和音認識を扱う.これは一般に和声解析や自動採譜に寄与する技術である一方で,音楽検索や音楽分類への応用も期待できる.自動和音認識ではクロマベクトルを特徴量とした隠れマルコフモデル(HMM)がよく用いられるが,本稿では前後関係を考慮した環境依存HMMを用い,クラスタリングによるモデルパラメータの共有の有効性を検討する.
-
伊藤 大介, 酒向 慎司, 北村 正
第9回情報科学技術フォーラム 情報処理学会,電子情報通信学会 情報・システムソサイエティ,電子情報通信学会 ヒューマンコミュニケーショングループ
開催年月日: 2010年09月
記述言語:日本語 会議種別:口頭発表(一般)
開催地:九州大学 伊都キャンパス
計算機が人の意図を理解する事で,人と機械のコミュニケーションはより円滑なものになると期待される.近年では,音声認識によって得られた言語情報から意図を推定する研究が数多く行われている叫しかし,言語庸報だけでは的確な意図の推定は難しいといえる.たとえば,「はい」という発話は,相手の発話に同意する場合にも,相手の発話が聞き取れなかった場合にも用いられるが,それらの示す意図が違うのは明らかである.人同士のコミュニケーションにおいて,意図を伝える視聴覚情報の割合に関して諸説があるが,文献図によると,言語情報によって伝わる話し手の意思は全体の約35%であり,残りの65%は話し方,動作,その人の身体的特徴などの非言語情報によって伝わるとされている,このような背景から,我々は,言語情報に加えて複数の視聴覚情報から意図を推定する手法を検討している.本稿では,その基礎検討として,音響特徴である基本周波数パターンからの意図推定の可能性について検討した.自由対話における音声から,意図に寄与するであろう特徴量を分散分析によって調査した.
-
HMMに基づく手の動きと形状特徴のストリーム別クラスタリングを用いた手話認識手法
有賀 光希, 酒向 慎司, 北村 正
第9回情報科学技術フォーラム 情報処理学会,電子情報通信学会 情報・システムソサイエティ,電子情報通信学会 ヒューマンコミュニケーショングループ
開催年月日: 2010年09月
記述言語:日本語 会議種別:口頭発表(一般)
開催地:九州大学 伊都キャンパス
手話は主に手や指の様々な動き(手指動作)によって意味を成すが,これらの動作は単語ごとに独立したものではなく,単語間で共通する基本動作の逐次的な連鎖から様々な単語を表現していると言える.また手指動作は,おおまかに大域的な手の位置変化(動き)と局所的な掌の形状変化(形状)という性質の異なる2つの表現要素があり,それぞれの基本動作が時間的に遷移していくと考えられる.このような視点から手話認識を考えると,個々の単語を個別にモデル化するよりも,動き要素と形状要素それぞれの基本動作モデルを単語間で共有する方が効率的であるが,表現要素ごとに基本動作をどう分類するかが問題となる.本研究では複数の単語に含まれる共通要素を,手話の動画像から学習される統計モデルに基づいて,手の動き特徴と形状特徴それぞれにっいて個別に自動分類することを目指す.そのために,動きと形状の2つのストリームについて単語単位で隠れマルコフモデル(Hidden Marcov Model; HMM)を学習し,単語全体の状態パラメータをストリーム別にクラスタリングする.
-
楽譜を考慮した演奏者の統計的モデル化手法の改善と演奏者識別による評価
奥村 健太, 酒向 慎司, 北村 正
情報処理学会 第86回音楽情報科学研究会 情報処理学会
開催年月日: 2010年07月
記述言語:日本語 会議種別:口頭発表(一般)
開催地:つくばグランドホテル
個性を備えた演奏は,楽譜の演奏指示に対して演奏者の意図による逸脱が加わることで生じると考えられる.我々はそのような逸脱の振る舞いが確率的な偏りを持つと仮定し,実演奏とその楽譜に基づいて両者の依存関係を統計学習する手法を提案してきた.従来法では楽譜から扱える演奏指示の種類が限られており,演奏指示の限られる楽曲には柔軟な対応ができないことが課題となっていたが,本稿では音符単位で付与できる演奏指示情報を拡充し,より楽曲に適合したモデルの生成について検討した.また,演奏者モデルの木構造についてもより効率的な生成手法を検討し,得られた演奏者モデルに未知の演奏における演奏者を識別させる評価を行った.これによって提案手法の有効性を検討し,今後の課題についても述べる.
-
デモンストレーション:音楽情報処理の研究紹介IX
中野 倫靖, 大沼 翔, 金 泰憲, 黒沢 佳史, 斉藤 優理, 斎藤 佳紀, 奥村 健太, 田中 駿二, 浜中 雅俊, 帆足 啓一郎, 森山 剛, 吉田 周平, 吉谷 幹人, 安藤 大地
情報処理学会 第86回音楽情報科学研究会 情報処理学会
開催年月日: 2010年07月
記述言語:日本語 会議種別:ポスター発表
開催地:つくばグランドホテル
-
酒向 慎司, 水野 理央, 北村 正
情報処理学会 第85回音楽情報科学研究会 情報処理学会
開催年月日: 2010年05月
記述言語:日本語 会議種別:口頭発表(一般)
開催地:東北大学 青葉山キャンパス
本報告では,管楽器アンサンブル奏者が自分たちの好みと希望に合わせた編曲楽譜を自動生成・支援するシステムを目的として,メロディ構造や各楽器の演奏難易度に基づいて入力メロディのパートを分配する問題を経路探索問題として定めた.伴奏・副旋律を生成する手法と組み合わせた編曲システムを実装し,得られた楽譜を用いて,アンサンブル演奏者による主観評価を実施した.評価結果を元に今後の課題と展望について考察する.
-
有賀 光希, 酒向 慎司, 北村 正
電子情報通信学会 第53回福祉情報科学研究会 電子情報通信学会
開催年月日: 2010年05月
記述言語:日本語 会議種別:口頭発表(一般)
開催地:新潟大学 駅南キャンパス
手話認識における主要な課題として,適切な特徴抽出やモデリングがある.特徴量としては手などの特徴部位の軌跡情報などが,モデルとしては隠れマルコフモデル(HMM)がよく用いられる.特徴量は動画像から抽出することにより,センサ等の装着による利用者の負担を軽減することが期待できるが,一方でカメラに対する人物の位置や体格差次第で同じ動作でも手の軌跡の座標値が大きく異なることがあり,実用上の課題となる.そこで,両手の中間点を原点とする座標系に変換した上で,体格差やカメラとの距離差を是正するためスケールの正規化を行う.また別種の問題として,個人差や文脈などの影響から同じ手話単語であっても発話ごとに動作の振る舞いが異なる可能性があり,このような性質を反映させて扱えるような柔軟なモデル構造の生成も重要である.そこで,HMMをこのような構造に対応させるため,複数の発話間で類似する部分は共通の状態を割り当て,それ以外の部分はその発話固有の状態として割り当てることができるような状態遷移構造を生成する.評価実験として単語認識を行い,人物および動作の多様性を考慮したことによるそれぞれの有効性を検討する.
-
加速度センサを用いたSOMに基づく非日常動作の検出
渡邊 将基, 酒向 慎司, 北村 正
電子情報通信学会2010年総合大会 電子情報通信学会
開催年月日: 2010年03月
記述言語:日本語 会議種別:ポスター発表
開催地:東北大学 川内キャンパス
-
感情音声が脳波に及ぼす影響に関する基礎的研究
坪内 元治, 酒向 慎司, 北村 正
電子情報通信学会2010年総合大会 電子情報通信学会
開催年月日: 2010年03月
記述言語:日本語 会議種別:ポスター発表
開催地:東北大学 川内キャンパス
-
車両フロント領域を用いた階層化部分空間に基づく車種認識
大倉 聖也, 酒向 慎司, 北村 正
電子情報通信学会2010年総合大会 電子情報通信学会
開催年月日: 2010年03月
記述言語:日本語 会議種別:ポスター発表
開催地:東北大学 川内キャンパス
-
相互相関関数を用いた混合音の音高・楽器推定
杉山 雄一, 酒向 慎司, 北村 正
電子情報通信学会2010年総合大会 電子情報通信学会
開催年月日: 2010年03月
記述言語:日本語 会議種別:口頭発表(一般)
開催地:東北大学 川内キャンパス
-
骨導音声を用いたGMMに基づく話者識別
趙 洪岩, 酒向 慎司, 北村 正
電子情報通信学会2010年総合大会 電子情報通信学会
開催年月日: 2010年03月
記述言語:日本語 会議種別:口頭発表(一般)
開催地:東北大学 川内キャンパス
-
酒向 慎司, 北村 正
電子情報通信学会 第52回福祉情報科学研究会 電子情報通信学会
開催年月日: 2010年03月
記述言語:日本語 会議種別:口頭発表(一般)
開催地:NTT 武蔵野研究開発センター
動画像から手話を認識することは,センサー等の特殊な装置の使用やその身体的拘束を伴わない方法として有効であるが,撮像されている人物から手話の動作特徴を的確に取得する必要がある.しかし,手話動作において,両手が交差することなどよって特徴となる部位が隠れてしまう状況は避けられず,とくに単眼カメラの映像から手動作の軌跡を正確に抽出することは難しいと言える.しかし,そのような状況を回避するために,多数のカメラを用いることは先に述べた装置の特殊化にも繋がる点で問題である.本報告では,特徴部位が隠れることも手話動作の特徴としてとらえるという着想から,手話動作を表す特徴部位の可視状態と不可視状態が混在した一連の現象を説明することができるモデル化方法として,多空間分布に基づいた隠れマルコフモデル(multi-space distribution hidden Markov model: MSD-HMM)を適用した手法を提案する.手話単語データべースを用いた実験によって,MSD-HMMによるモデル化が機能していることを示し,単語認識実験によってその有効性を確認するとともに,今後の課題について述べる.
-
西尾 圭一郎, 酒向 慎司, 北村 正
情報処理学会創立50周年記念全国大会 情報処理学会
-
稲垣 有紗, 酒向 慎司, 北村 正
情報処理学会創立50周年記念全国大会 情報処理学会