研究者詳細 - 酒向　慎司

講演・口頭発表等 - 酒向　慎司

分割表示 256 件中 61 - 80 件目／全件表示 >>

楽譜情報を考慮したSCRF に基づく音響信号と楽譜のアライメント

野口綾子, 酒向慎司, 北村正

日本音響学会2017年春季研究発表会日本音響学会

開催年月日： 2017年03月

記述言語：日本語会議種別：口頭発表（一般）

開催地：明治大学生田キャンパス

SVMによる非語の正誤判定を用いた音韻検査の自動化の検討

多々納俊治, 縄手雅彦, 伊藤史人, 酒向慎司

電子情報通信学会 HCGシンポジウム2016 電子情報通信学会

開催年月日： 2016年12月

記述言語：英語会議種別：口頭発表（一般）

開催地：高知市文化プラザかるぽーと

Vowel duration dependent hidden Markov model for automatic lyrics recognition 国際会議

Shohei Awata, Shinji Sako, Tadashi Kitamura

th Joint Meeting of the Acoustical Society of America and Acoustical Society of Japan Acouustical SOciety of America, Acoustical Society of Japan

開催年月日： 2016年11月 - 2016年12月

記述言語：英語会議種別：ポスター発表

開催地：Honolulu, Hawaii

Recently, due to the spread of music distribution service, a large amount of music is available on the Internet. Accordingly, it is generally increasing the demand of music information retrieval (MIR). In the field of MIR research, there are several researches to extract meaningful information from music audio signals. However, automatic lyrics recognition is still a challenging problem because the variation of singing voice is much larger than that of speaking voice and a large database of singing voice is not available. In the relevant study, lyrics recognition was performed by extending the framework of speech recognition using hidden Markov model (HMM). However, accuracy rate was not sufficient. To recognize singing voice precisely, one promising approach is utilizing musical features. This study considers the task of recognizing syllable from a cappella singing voice. To respond to the variation of the length of a phoneme, we construct the duration dependent HMM. A large database of singing voice is essential for training the acoustic model. We use synthetic singing voice by HMM based singing voice synthesis system to solve the lack of the database of a cappella singing voice. We confirmed the effectiveness of our method.

Segmental Conditional Random FieldsAudio-to-Score Alignment Distinguishing Percussion Sounds From Other Instruments 国際会議

Ayako Noguchi, Shinji Sako, Tadashi Kitamura

th Joint Meeting of the Acoustical Society of America and Acoustical Society of Japan Acouustical SOciety of America, Acoustical Society of Japan

開催年月日： 2016年11月 - 2016年12月

記述言語：英語会議種別：ポスター発表

開催地：Honolulu, Hawaii

Audio-to-score alignment is useful technique because it can be widely applied to many practical applications for musical performance. However, it is still open problem due to the complexity of audio signal especially in the polyphonic music. Additionally, performing in real-time is also important in practical situation. In this study, we propose a new alignment method based on segmental conditional random fields (SCRFs). The attractive feature of this method is utilizing to distinguish percussion sounds from the other instruments. In general, percussion sounds have a role in managing whole music. Moreover, performers can pick up the percussion sounds from the others by hearing whole sound thanks to their unique features of the sound. In the field of score alignment, hidden Markov models (HMMs) or CRFs was used in previous studies including our previous one. In summary, these methods were formulated as a matching problem of the state sequence of mixed notes with the audio feature sequence. In this study, we extend our previous method by combining an additional state which represents percussion sounds. Furthermore, we introduce the balancing factor to control the importance of classifying feature functions. We confirmed the effectiveness of our method by conducting experiments using RWC music database.

HMMを用いた手話の非手指信号認識の基礎検討

加藤里奈, 酒向慎司, 北村正

電子情報通信学会第85回福祉情報科学研究会電子情報通信学会

開催年月日： 2016年07月

記述言語：日本語会議種別：口頭発表（一般）

開催地：山梨大学

手話は手や指の動きにより単語の意味を表す手指信号(Manual Signals)と、頭部動作や表情などによって文法や副詞を表す非手指信号(Non-Manual Signals、以下NMS)から構成される。手指信号と比較しNMSの体系化は難しく、NMSの認識に関する研究は少ない。しかし、手話文全体を理解するためには、手指信号だけでなくNMSの認識も重要である。先行研究では手話文中に出現する頭部動作4種類(頷き、顎上げ、顎下げ、首振り)の認識実験を行ったが、話者の手話経験がなかったことから、現実的な評価データとは異なっていた可能性が考えられる。本研究では手話通訳士を対象としたHMMを用いたNMSの認識を試みる。

CiNii Articles

HMMを用いた手話の非手指信号の認識

加藤里奈, 酒向慎司, 北村正

電子情報通信学会2016年総合大会学生ポスターセッション電子情報通信学会

開催年月日： 2016年03月

記述言語：日本語会議種別：ポスター発表

開催地：九州大学伊都キャンパス

近年，聴覚障害者と健聴者との対話支援を目的としたコンピュータによる手話認識の研究が行われている．手話は手や指の動きにより単語の意味を表す手指信号(Finger Signals)と，頭部動作や表情などによって文法や副詞を表す非手指信号(Non Manual Signals，以下 NMS)から構成される．手指信号と比較しNMSの体系化は難しく，NMSの認識に関する研究は少ない．しかし，手話文全体を理解するためには，手指信号だけでなく NMS の認識も重要である．先行研究では手話文中に出現する頭部動作 4種類 (頷き，顎上げ，顎下げ，首振り) の認識実験を行ったが，話者の手話経験がなかったことから，現実的な評価データとは異なっていた可能性が考えられる．本研究では手話通訳士を対象としたHMMを用いたNMSの認識を試みる．

空間的定位に基づく前後の状況を考慮した歩行者の経路選択行動モデル

大廻佳代, 酒向慎司, 北村正

電子情報通信学会2016年総合大会学生ポスターセッション電子情報通信学会

開催年月日： 2016年03月

記述言語：日本語会議種別：ポスター発表

開催地：九州大学伊都キャンパス

経路選択行動とは，交差点に接続される経路の中から，進む経路を選択することである．経路選択行動をモデル化し，一般的に通行されやすい経路を把握することは，歩行者空間を効果的に整備・管理・運営する上で有効である．従来研究では，空間的定位を用いた汎用性の高い歩行者の経路選択行動モデルが提案されている．従来法において，現在の選択は前後の状況に依存せず独立であると仮定されている．しかし，歩行者は選択前後の経路を俯瞰的に把握して経路選択を行うと考えられるため，本研究では，経路選択行動前後の状況を考慮して従来法を拡張し，汎用性を保ちつつ，経路選択行動の予測精度を向上させることを検討する．

マルチモーダル情報を用いた落語の役柄交替検出

細江花, 酒向慎司, 北村正

電子情報通信学会2016年総合大会学生ポスターセッション電子情報通信学会

開催年月日： 2016年03月

記述言語：日本語会議種別：ポスター発表

開催地：九州大学伊都キャンパス

現在，文字媒体だけでなく映像による情報取得が身近になったが，聴覚障がい者など音声による取得が難しい人は字幕から情報を取得することが多い．しかし，字幕付与の作業が追い付いておらず，より効率的に付与する方法が望まれる．これまでに，落語の役柄交替の検出に関して様々な研究がなされており，川嶋らの研究では，演者の頭部動作の変化量から身体動作と発話のタイミングのモデルが提案されている．そこで，本研究では関連研究の提案したモデルをもとに，発話権の移動が最適化されていると考えられる落語を用い，マルチモーダル情報の特徴量の変化から役柄交替のタイミングを検出し，役柄交替検出に有効となり得るか検討する．

音長を考慮した音響モデルによる歌声の自動歌詞認識

粟田渉平, 酒向慎司, 北村正

電子情報通信学会2016年総合大会学生ポスターセッション電子情報通信学会

開催年月日： 2016年03月

記述言語：日本語会議種別：ポスター発表

開催地：九州大学伊都キャンパス

近年，膨大な数の楽曲を提供する楽曲配信サービスが音楽販売の主流となり，音楽情報検索の需要が高まっている．楽曲を特定するための重要な情報として，曲名，歌手，ジャンル，旋律，歌詞が挙げられる．歌詞認識は，楽曲の歌唱パートの歌詞を書き起こすものであり，音楽情報検索の研究分野の一つである．歌詞認識は，第一段階として伴奏のない歌声のみの楽曲を対象にして行われている．歌詞認識は音声認識技術を拡張して行われているが，大規模な歌声データベースの不足により，音響モデルを歌声から学習することは困難である．従来研究では，朗読音声で学習した音響モデルを少量の歌声で適応学習して歌声に対応させた．しかし，歌声は様々な長さの音韻の引き伸ばしにより挿入誤りが増加するため，音韻の引き伸ばしに頑健な音響モデルが必要である．本研究では，音韻の引き伸ばしに対応するために，様々な音長の歌声データを歌声合成によって確保する．さらに，その歌声データを使用して，音長に応じて母音のモデルを分けた音響モデルを構築する．

柔軟な楽曲検索のための時間変化を考慮した楽曲の印象推定

寺島大樹, 酒向慎司, 北村正

電子情報通信学会2016年総合大会学生ポスターセッション電子情報通信学会

開催年月日： 2016年03月

記述言語：日本語会議種別：ポスター発表

開催地：九州大学伊都キャンパス

近年，キーワードを用いた楽曲検索の他にもさまざまな検索手法が研究されている．そのひとつの手法として印象に基づく検索があり，具体的なタイトルなどがわからない時に有効である．従来の印象に基づく検索に関する研究は，楽曲の印象が時間によって変化することを考慮していないという問題があった．しかし，音楽は時間とともに印象が変化していくと考えられ，また過去の印象の影響を受けると考えられる．そのためこれらを考慮した楽曲検索の手法を検討する．本研究では印象の時間変化を印象値時系列として表す．楽曲を細かく分けたフレームごとに印象を推定することで印象時系列を生成し，DPマッチングを用いることで印象の時間変化と過去の印象による影響を考慮した楽曲検索を行う．

地震前兆検出のための環境電磁波の自動ラベリングと複数地点への適用による汎用性の検証

曽我昌士, 酒向慎司, 北村正

電子情報通信学会2016年総合大会学生ポスターセッション電子情報通信学会

開催年月日： 2016年03月

記述言語：日本語会議種別：ポスター発表

開催地：九州大学伊都キャンパス

地震被害を軽減するには発生時期を事前に把握することも重要である．地震直前の 2週間以内に環境電磁波の異常放射が観測されることが知られているため，これを検出して地震の発生を予測する研究が行われている．環境電磁波は，1日周期で放射レベルが変動する定常状態，地震に起因する異常 (地震前兆)，その他の要因による異常 (異常) が重畳した信号が観察される．これらの特徴を隠れマルコフモデル (HMM) や混合ガウスモデル(GMM) でモデル化し，地震前兆を検出する方法が提案されている．しかし，従来法では異常・地震前兆のモデル学習に必要なデータを視察でラベリングするため，大量の観測データを用いるにはラベリングの自動化が望まれる．また，地域によって観測データの量や地震発生数に差があり，地震GMMが十分に学習できない地域もある．これは，学習データが豊富な地域で作成された統計モデルを代用できれば，検出を行えると考えられる．そこで本研究では，統計モデルと地震の発生情報を用いて観測データのラベリングを自動化する．そして，地点毎に地震前兆検出を行い，自動ラベリングの汎用性を検証し，作成された統計モデルを他地点で代用して，特定地点で作成された統計モデルの汎用性を検証する．

自動ジャズアレンジのための事例に基づくメロディ変形

佐藤直人, 酒向慎司, 北村正

情報処理学会第76回全国大会情報処理学会

開催年月日： 2016年03月

記述言語：日本語会議種別：口頭発表（一般）

開催地：慶應義塾大学矢上キャンパス

本研究では原曲メロディの自動ジャズアレンジを目的とし、事例を用いてリズムと音高に関するジャズ特有の変化パターンをモデル化することにより、メロディをジャズ風に変形させる手法を提案する。提案手法では、原曲とジャズアレンジされた曲のペアからなる事例データを用意し、セグメンテーションと抽象化により、原曲とアレンジ後の対応付けを行う。入力された原曲メロディが変化し得るリズムと音高のアレンジパターンを事例データから探索し、動的計画法により最適なアレンジ系列を出力する。

Kinect v2による手話動作の3要素に基づく実時間手話認識

波多野美歌, 酒向慎司, 北村正

電子情報通信学会第83回福祉情報科学研究会電子情報通信学会

開催年月日： 2016年03月

記述言語：日本語会議種別：口頭発表（一般）

開催地：筑波技術大学

手話認識の研究は途上であり，小語彙を対象としたものに留まっている．その理由として，音声言語のように表記体系が確立されていないことが挙げられる．さらに，大規模な手話認識用のデータベースが存在しないことも挙げられるが，手話の音韻学的知識の活用によって，手話単語の効率的なモデル化が期待できる．そこで本研究では，手話電子辞書の表記に基づき，手話単語を手形状，手の位置，動きの3要素によって定義し，手話単語認識システムを構成した．手話動作からの特徴量の取得にはKinect v2を用いた．複雑な形状変化を伴うため，3要素の中で特に実時間化が困難である手形状の認識には，輪郭線による認識手法を導入した．また，大量の単語データを必要としない方法で学習を行い，本認識システムの評価実験として，手話通訳士を起用した手話単語の認識実験を行った．

CiNii Articles

統計モデルに基づく環境電磁波の自動ラベリングと地震前兆検出

曽我昌士, 酒向慎司, 北村正

第38回情報理論とその応用シンポジウム電子情報通信学会情報理論とその応用サブソサイエティ

開催年月日： 2015年11月

記述言語：日本語会議種別：口頭発表（一般）

開催地：下電ホテル（岡山県倉敷市児島）

打楽器音を考慮した音響信号と楽譜のアライメント

野口綾子, 酒向慎司, 北村正

情報処理学会第109回音楽情報科学研究会情報処理学会

開催年月日： 2015年11月

記述言語：日本語会議種別：口頭発表（一般）

開催地：金沢大学サテライトプラザ

本稿では，人間に合わせて計算機に伴奏を出力させることで合奏や演奏に関する支援を行うことを目標として，音響信号と楽譜のオンラインアライメントの精度の向上のためのモデルを提案する．本研究ではポピュラー音楽に焦点をあてており，その全体の演奏を取りまとめる重要な役割として打楽器がある．打楽器音は他の楽器音とは全く異なる響きを持ち，また打楽器音を含む和音のオンセットは他の楽器音のみからなる和音のオンセットよりもアライメントにおける重要度が高くなると予想されるため，他の楽器音とは区別した方が良いのではないかと考えられる．しかし従来法では，打楽器音を他の楽器音と同じ枠組みで扱っており，楽器種の違いを区別することができなかった．そこで本研究では，打楽器音の有無によってオンセットの重みを変えるよう従来モデルのアライメントアルゴリズムの拡張を行った．提案モデルによって楽器種を区別し，最適な重みづけを行った実験の結果，全ての許容誤差においてアライメント精度の向上と提案モデルの有効性を確認した．

旋律の特徴を反映した自動メロディ生成における特徴量の検討

林勇佑, 酒向慎司, 北村正

情報処理学会第109回音楽情報科学研究会情報処理学会

開催年月日： 2015年11月

記述言語：日本語会議種別：口頭発表（一般）

開催地：金沢大学サテライトプラザ

本研究では，遺伝的アルゴリズムを用いた自動メロディ生成を取り扱っている．この際，生成されるメロディに，リズムや音高の変化などといったユーザの希望を適切に反映するために，ユーザにとって「このような楽曲を作りたい」という目標となるメロディとなる目標旋律を直接入力に用いた．これにより，ユーザが直感的に入力することを可能となり，ユーザーの希望をより適切に反映する手法を提案した．目標旋律は，メロディをランダム生成する際の音符列生成確率の最適化と，楽曲から抽出した特徴量の最適化に使用する．主観評価実験を行った結果，本研究で提案した目標旋律を用いて特徴量の最適化を行う手法の有効性が確認できた．しかし，目標旋律の音高変化の特徴が生成されたメロディに十分に反映されていないなどといった問題があり，その解決のために使用する特徴量の新規追加や削除を行い，主観評価実験によってその有効性を確認した．

統計モデルと楽譜情報に基づく指標を用いた演奏表情の比較分析

奥村健太, 酒向慎司, 北村正

第17回日本感性工学会大会感性工学会

開催年月日： 2015年09月

記述言語：日本語会議種別：口頭発表（一般）

開催地：文化学園大学　新都心キャンパス

There is a complex phenomenon in the performance expression of Western music. It is difficult even for performers themselves to describe the causality of "score directions" and "instrument operation" clearly and objectively. In this paper, we propose a method that can help to elucidate the factors contributing to performance expression. It is based on a technique to obtain the systematized structure of the statistical models. The model associates the feature quantities of performance expression and the combination of simple musical directions that can be surely retrieved from the score. In this method, degrees to which those directions contribute to the performance expression are also defined. It allows the application of standard multivariate analysis techniques for comparative analysis of the expressions between performances. Evaluation showed the utility of the proposed method in contributing to an objective understanding of the factors that performers emphasized for control of expression in their performances.

CiNii Articles

手話認識のための輪郭特徴を用いた手形状認識

波多野美歌, 酒向慎司, 北村正

電子情報通信学会第79回福祉情報科学研究会電子情報通信学会

開催年月日： 2015年06月

記述言語：日本語会議種別：口頭発表（一般）

開催地：新潟大学駅南キャンパス

手話は音韻学的に主に手の位置，手の動き，手形状の3 要素から構成されていると言われている．本研究ではこの考えに基づき，Kinect v2センサから得られた手座標や深度画像を，3要素における抽象化されたパターンに変換し，手話単語の学習・認識を行う手話認識システムの検討を進めてきた．本稿では3要素の認識のうち，複雑な形状変化を伴うため実時間での認識が困難であった，手形状の認識について検討を行う．本研究では実時間性を重視し，Keoghらによって提案された輪郭線ベースの手法を用いた手形状認識を行う．この手法では1つの領域を囲む輪郭線を認識対象とし，複数の輪郭線から学習された識別器を用いて認識を行う．本稿では，全国手話検定5級の出題単語400語を認識対象とした手話認識システムを想定し，400語に含まれる手形状23種類の認識実験を行う．

CiNii Articles

楽譜と表情を関連付けた統計モデルに基づく楽器演奏の類似性指標

奥村健太, 酒向慎司, 北村正

第29回人工知能学会全国大会人工知能学会

開催年月日： 2015年05月 - 2015年06月

記述言語：日本語会議種別：ポスター発表

開催地：公立はこだて未来大学

CiNii Articles

自動ジャズアレンジのための事例に基づくリズム転写

佐藤直人, 酒向慎司, 北村正

情報処理学会第107回音楽情報科学研究会情報処理学会

開催年月日： 2015年05月

記述言語：日本語会議種別：ポスター発表

開催地：電気通信大学

本研究では原曲メロディの自動ジャズアレンジを目的とし，その第一段階としてジャズアレンジの重要な要素であるリズムを変形させる手法を提案する．提案手法では，原曲とジャズアレンジされた曲のペアからなる事例データを用いて，ジャズ特有のリズム変化のパターンをモデル化することにより，原曲のメロディをジャズ特有のリズムに変形させる．生成実験の結果，ジャズらしいリズムの 1 つである Swing が多く見られ，統一性のあるジャズアレンジ結果が得られた．

前のページ - 次のページ

このページの先頭へ▲

<酒向 慎司>

講演・口頭発表等 - 酒向 慎司

<酒向　慎司>

講演・口頭発表等 - 酒向　慎司