Papers - UENO Sei
-
Data generation for speaker diarization by speaker transition information Reviewed
Keigo Ichikawa, Sei Ueno, and Akinobu Lee
Asia Pacific Signal and Information Processing Association (APSIPA) 2024.12
Language:English Publishing type:Research paper (international conference proceedings)
Other Link: https://www.apsipa2023.org/tprogram.html
-
大規模事前学習モデルによる笑い声表現を用いたspeech-laugh音声の生成
木全亮太朗, 上乃 聖, 李 晃伸
日本音響学会講演論文集 2024.09
Language:Japanese Publishing type:Research paper (other academic)
-
Refining Synthesized Speech Using Speaker Information and Phone Masking for Data Augmentation of Speech Recognition Reviewed
Sei Ueno, Akinobu Lee, Tatsuya Kawahara
IEEE/ACM Transactions on Audio, Speech, and Language Processing 32 3924 - 3933 2024.09
Authorship:Lead author, Corresponding author Language:English Publishing type:Research paper (scientific journal)
DOI: 10.1109/TASLP.2024.3451982
Other Link: https://repository.kulib.kyoto-u.ac.jp/dspace/handle/2433/289487
-
Multi-setting acoustic feature training for data augmentation of speech recognition Reviewed
Sei Ueno, Akinobu Lee
Acoustical Science and Technology 45 ( 4 ) 195 - 203 2024.07
Authorship:Lead author, Corresponding author Language:English Publishing type:Research paper (scientific journal)
DOI: https://doi.org/10.1250/ast.e23.70
Other Link: https://www.jstage.jst.go.jp/article/ast/45/4/45_e23.70/_article/-char/ja
-
センチメント分析を用いた感情を重視した物語の階層的要約手法
酒井 健壱, 上乃 聖, 李 晃伸
言語処理学会 第30回年次大会 発表論文集 1119 - 1124 2024.03
Language:Japanese Publishing type:Research paper (other academic)
Other Link: https://www.anlp.jp/proceedings/annual_meeting/2024/index.html
-
経験情報収集および伝達を主目的とする雑談対話による関係性維持支援システム
志満津 奈央, 上乃 聖, 李 晃伸
言語処理学会 第30回年次大会 発表論文集 1394 - 1399 2024.03
Language:Japanese Publishing type:Research paper (other academic)
Other Link: https://www.anlp.jp/proceedings/annual_meeting/2024/index.html
-
大規模言語モデルを用いたEmotional Support Conversation システムの構築とその評価
藤田 敦也, 上乃 聖, 李 晃伸
言語処理学会 第30回年次大会 発表論文集 1378 - 1383 2024.03
Language:Japanese Publishing type:Research paper (other academic)
Other Link: https://www.anlp.jp/proceedings/annual_meeting/2024/index.html
-
Synthesis of non-native voice with native-like accent using voice conversion
Iago Lourenço Correa, Sei Ueno, and Akinobu Lee
2024.03
Language:Japanese Publishing type:Research paper (conference, symposium, etc.)
Other Link: https://acoustics.jp/annualmeeting/program/
-
LLM によるテキスト生成を用いた音声合成による音声認識のドメイン適応
上乃 聖, 李 晃伸
日本音響学会講演論文集 2024.03
Authorship:Lead author, Corresponding author Language:Japanese Publishing type:Research paper (other academic)
-
Cocktail Machine Speech Chain: 重複あり音声を用いた音声認識・音声合成モデルの統一的学習
松永 裕太, 高道 慎之介, 上乃 聖, 猿渡 洋
日本音響学会講演論文集 2024.03
Language:Japanese Publishing type:Research paper (other academic)
-
3 話者以上の話者交替情報を用いたSpeaker Diarization のためのデータ生成
市川 奎吾, 上乃 聖, 李 晃伸
日本音響学会講演論文集 2024.03
Language:Japanese Publishing type:Research paper (other academic)
-
日本語日常会話の潜在的な発話スタイルに基づく対話シーンに応じた音声合成
嶋崎 純一, 上乃 聖, 李 晃伸
日本音響学会講演論文集 2024.03
Authorship:Lead author, Corresponding author Language:Japanese Publishing type:Research paper (other academic)
-
暗黙的な非線形処理を導入した拡散モデルを用いた音声合成
岡本 海, 上乃 聖, 李 晃伸
日本音響学会講演論文集 2024.03
Language:Japanese Publishing type:Research paper (other academic)
-
豊かなノンバーバルコミュニケーションのためのHMDを用いた没入型音声対話システム
宮下 陸, 上乃 聖, 李 晃伸
HAIシンポジウム 2024.03
Language:Japanese Publishing type:Research paper (other academic)
-
CG エージェントを用いた音声対話システムにおける空間共有感のための自己投影法
東 省吾, 上乃 聖, 李 晃伸
HAIシンポジウム 2024.03
Language:Japanese Publishing type:Research paper (other academic)
-
カウンセリングにおける悩み構造の言語化を支援する音声対話システム
鈴木 香保, 上乃 聖, 李 晃伸
HAIシンポジウム 2024.03
Language:Japanese Publishing type:Research paper (other academic)
-
Accent-Preserving Voice Conversion between Native-Nonnative Speakers for Second Language Learning Reviewed
Iago Lourenço Correa, Sei Ueno, and Akinobu Lee
Asia Pacific Signal and Information Processing Association (APSIPA) 1179 - 1186 2023.11
Language:English Publishing type:Research paper (international conference proceedings)
DOI: https://doi.org/10.1109/APSIPAASC58517.2023.10317245
Other Link: https://www.apsipa2023.org/tprogram.html
-
発話交替頻度を導入した実対話音声に対するSpeaker Diarizationのためのデータ生成
市川 奎吾, 上乃 聖, 李晃伸
日本音響学会講演論文集 2023.09
Language:Japanese Publishing type:Research paper (conference, symposium, etc.)
-
異なるスタイルの笑い声生成のための有声音・無声音間隔の制御
木全 亮太朗, 上乃 聖, 李晃伸
日本音響学会講演論文集 2023.09
Language:Japanese Publishing type:Research paper (conference, symposium, etc.)
-
時間軸-周波数軸上の幅を持たせる音声合成を用いた音声認識のデータ拡張
上乃聖, 李晃伸
日本音響学会講演論文集 2023.09
Authorship:Lead author Language:Japanese Publishing type:Research paper (conference, symposium, etc.)
-
CGアバター対話における音声からの頭部動作および表情の自動生成
藤岡 侑貴, 上乃 聖, 李晃伸
人工知能学会全国大会 2023.06
Language:Japanese Publishing type:Research paper (conference, symposium, etc.)
-
Continuous Integrate-and-Fire を用いた音声区間検出とターン終了検知のマルチタスク学習
池口 弘尚, 東 佑樹, 上乃 聖,李 晃伸
日本音響学会講演論文集 2023.03
Language:Japanese Publishing type:Research paper (conference, symposium, etc.)
-
複数設定のスペクトログラムを用いた音声合成に基づく音声認識のデータ拡張
上乃聖, 李晃伸
日本音響学会講演論文集 2023.03
Authorship:Lead author Language:Japanese Publishing type:Research paper (conference, symposium, etc.)
-
連続的な感情表出を用いたカウンセリング対話エージェントの評価
川又 朱莉, 上乃 聖, 李 晃伸
HAIシンポジウム 2023.03
Language:Japanese Publishing type:Research paper (conference, symposium, etc.)
-
多様な笑い声生成のための有声音・無声音間隔の制御
木全亮太朗, 上乃 聖, 李 晃伸
情報処理学会全国大会講演論文集 2023.03
Language:Japanese Publishing type:Research paper (conference, symposium, etc.)
-
Non-autoregressive Error Correction for CTC-based ASR with Phone-conditioned Masked LM Reviewed
Hayato Futami, Hirofumi Inaguma, Sei Ueno, Masato Mimura, Shinsuke Sakai, Tatsuya Kawahara
INTERSPEECH 3889 - 3893 2022.09
Language:English Publishing type:Research paper (international conference proceedings)
-
音声認識のデータ拡張のための話者情報およびマスクを用いた合成音声の周波数スペクトログラム強調
上乃 聖,李 晃伸,河原 達也
日本音響学会講演論文集 1149 - 1150 2022.09
Authorship:Lead author, Corresponding author Language:Japanese Publishing type:Research paper (other academic)
-
Phone-informed refinement of synthesized mel spectrogram for data augmentation in speech recognition Reviewed
Sei Ueno and Tatsuya Kawahara
International Conference on Acoustics, Speech, and Signal Processing (ICASSP) 8572 - 8576 2022.05
Authorship:Lead author, Corresponding author Language:English Publishing type:Research paper (international conference proceedings)
-
Data Augmentation Approaches for Automatic Speech Recognition Using Text-to-Speech
Sei Ueno
2022.03
Authorship:Lead author, Corresponding author Language:English Publishing type:Doctoral thesis
-
音声認識のデータ拡張のための音素情報を用いた合成音声の強調
上乃 聖,河原 達也
日本音響学会講演論文集 887 - 888 2022.03
Authorship:Lead author, Corresponding author Language:Japanese Publishing type:Research paper (other academic)
-
Data Augmentation for ASR Using TTS Via a Discrete Representation Reviewed
Sei Ueno, Masato Mimura, Shinsuke Sakai, and Tatsuya Kawahara
IEEE Automatic Speech Recognition and Understanding Workshop (ASRU) 68 - 74 2021.12
Authorship:Lead author, Corresponding author Language:English Publishing type:Research paper (international conference proceedings)
-
音声認識のデータ拡張のための合成音声の周波数スペクトログラム強調
上乃 聖,河原 達也
研究報告音声言語情報処理(SLP) 2021-SLP-139 ( 28 ) 1 - 6 2021.11
Authorship:Lead author, Corresponding author Language:Japanese Publishing type:Research paper (conference, symposium, etc.)
-
Synthesizing Waveform Sequence-to-sequence to Augment Training Data for Sequence-to-sequence Speech Recognition Reviewed
Sei Ueno, Masato Mimura, Shinsuke Sakai, and Tatsuya Kawahara
Acoustical Science and Technology 42 ( 6 ) 333 - 343 2021.11
Authorship:Lead author, Corresponding author Language:English Publishing type:Research paper (scientific journal)
DOI: https://doi.org/10.1250/ast.42.333
Other Link: https://www.jstage.jst.go.jp/article/ast/42/6/42_E2108/_article
-
wav2vec 2.0を用いた音声合成による音声認識のデータ拡張
上乃 聖,河原 達也
日本音響学会講演論文集 857 - 858 2021.09
Authorship:Lead author, Corresponding author Language:Japanese Publishing type:Research paper (other academic)
-
vq-wav2vecによる離散IDを扱う音声認識のデータ拡張
上乃 聖,三村 正人,河原 達也
日本音響学会講演論文集 825 - 826 2021.03
Authorship:Lead author, Corresponding author Language:Japanese Publishing type:Research paper (other academic)
-
複数話者を対象とした非自己回帰型ニューラル音声合成
上乃 聖,三村 正人,河原 達也
日本音響学会講演論文集 825 - 826 2021.03
Authorship:Lead author, Corresponding author Language:Japanese Publishing type:Research paper (other academic)
-
ELECTRAによる音声認識仮説のリスコアリング
二見 颯,稲熊 寛文,上乃 聖,三村 正人,坂井 信輔,河原 達也
日本音響学会講演論文集 827 - 828 2021.03
Language:Japanese Publishing type:Research paper (other academic)
-
BERTによるSequence-to-Sequence音声認識への知識蒸留
二見 颯,稲熊 寛文,上乃 聖,三村 正人,坂井 信輔,河原 達也
研究報告音声言語情報処理(SLP) 2020-SLP-134 ( 2 ) 1 - 6 2020.11
Language:Japanese Publishing type:Research paper (conference, symposium, etc.)
-
Endto-End Speech-to-Dialog-Act Recognition Reviewed
Viet-Trung Dang, Tianyu Zhao, Sei Ueno, Hirofumi Inaguma, Tatsuya Kawahara
INTERSPEECH 3910 - 3914 2020.10
Language:English Publishing type:Research paper (international conference proceedings)
-
End-to-End Speech Emotion Recognition Combined with Acoustic-to-Word ASR Model Reviewed
Han Feng, Sei Ueno, Tatsuya Kawahara
INTERSPEECH 501 - 505 2020.10
Language:English Publishing type:Research paper (international conference proceedings)
-
Distilling the Knowledge of BERT for Sequence-to-Sequence ASR Reviewed
Hayato Futami, Hirofumi Inaguma, Sei Ueno, Masato Mimura, Shinsuke Sakai, Tatsuya Kawahara
INTERSPEECH 3635 - 3639 2020.10
Language:English Publishing type:Research paper (international conference proceedings)
-
Speech Corpus of Ainu Folklore and End-to-end Speech Recognition for Ainu Language Reviewed
Speech Corpus of Ainu Folklore and End-to-end Speech Recognition for Ainu Language
Proceedings of the Twelfth Language Resources and Evaluation Conference 2622 - 2628 2020.05
Language:English Publishing type:Research paper (international conference proceedings)
-
end-to-end音声合成を用いた end-to-end音声認識のための学習データ拡張
三村 正人,上乃 聖,坂井 信輔,河原 達也
日本音響学会講演論文集 1269 - 1270 2020.03
Language:Japanese Publishing type:Research paper (other academic)
-
自動字幕作成システムにおけるモデルの拡張
秋田祐哉, 上乃聖, 三村正人, 河原達也
研究報告アクセシビリティ(AAC) 2020-AAC-12 1 - 4 2020.03
Language:Japanese Publishing type:Research paper (conference, symposium, etc.)
-
双方向transformer言語モデルによる音声認識仮説のリスコアリング
二見颯, 上乃聖, 三村正人, 坂井信輔, 河原達也
情報処理学会全国大会講演論文集 175 - 176 2020.03
Language:Japanese Publishing type:Research paper (other academic)
-
民話を対象としたアイヌ語音声コーパスとEnd-to-End音声認識
松浦 孝平,上乃 聖,三村 正人,坂井 信輔,河原 達也
研究報告音声言語情報処理(SLP) 2019-SLP-130 ( 16 ) 1 - 6 2019.11
Language:Japanese Publishing type:Research paper (conference, symposium, etc.)
-
音声波形を入力とする単語単位End-to-End音声認識
上乃聖, 三村正人, 坂井信輔, 河原達也
研究報告音声言語情報処理(SLP) 2019-SLP-129 ( 2 ) 1 - 5 2019.10
Authorship:Lead author, Corresponding author Language:Japanese Publishing type:Research paper (conference, symposium, etc.)
-
Wave2Word: 音声波形を入力とする単語単位End-to-End音声認識
上乃 聖,三村 正人,坂井 信輔,河原 達也
日本音響学会講演論文集 801 - 802 2019.09
Authorship:Lead author, Corresponding author Language:Japanese Publishing type:Research paper (other academic)
-
End-to-Endアイヌ語音声認識におけるクロスリンガル話者拡張敵対学習
松浦 孝平,上乃 聖,三村 正人,坂井 信輔,河原 達也
日本音響学会講演論文集 799 - 800 2019.09
Language:Japanese Publishing type:Research paper (other academic)
-
Multi-speaker Sequence-to-sequence Speech Synthesis for Data Augmentation in Acoustic-to-word Speech Recognition Reviewed
Sei Ueno, Masato Mimura, Shinsuke Sakai, Tatsuya Kawahara
IEEE International Conference on Acoustics, Speech, and Signal Processing (ICASSP) 6161 - 6165 2019.05
Authorship:Lead author, Corresponding author Language:English Publishing type:Research paper (international conference proceedings)
-
多数話者コーパスを用いたEnd-to-End音声合成による単語単位End-to-End音声認識のデータ拡張
上乃 聖,三村 正人,坂井 信輔,河原 達也
日本音響学会講演論文集 865 - 866 2019.03
Authorship:Lead author, Corresponding author Language:Japanese Publishing type:Research paper (other academic)
-
End-to-Endモデルに基づくアイヌ語の音声認識
松浦 孝平,三村 正人,上乃 聖,坂井 信輔,河原 達也
日本音響学会講演論文集 867 - 868 2019.03
Language:Japanese Publishing type:Research paper (other academic)
-
音声認識を用いた字幕作成システムの改良
秋田祐哉, 上乃聖, 三村正人, 河原達也
研究報告アクセシビリティ(AAC) 2019-AAC-9 ( 34 ) 1 - 5 2019.03
Language:Japanese Publishing type:Research paper (conference, symposium, etc.)
-
Leveraging sequence-to-sequence Speech Synthesis for Enhancing Acoustic-to-word Speech Recognition Reviewed
Masato Mimura, Sei Ueno, Hirofumi Inaguma, Shinsuke Sakai, and Tatsuya Kawahara
IEEE Spoken Language Technology Workshop (SLT) 477 - 484 2018.12
Language:English Publishing type:Research paper (international conference proceedings)
-
End-to-End音声合成を用いた単語単位End-to-End音声認識のデータ拡張
上乃聖, 三村正人, 坂井信輔, 河原達也
研究報告音声言語情報処理(SLP) 2018-SLP-125 ( 2 ) 1 - 5 2018.12
Authorship:Lead author, Corresponding author Language:Japanese Publishing type:Research paper (conference, symposium, etc.)
-
単語単位エンコーダデコーダ音声認識モデルの転移学習を用いた適応
上乃 聖,森谷 崇史,三村 正人,坂井 信輔,篠原 雄介,山口 義和,青野 裕司,河原 達也
日本音響学会講演論文集 917 - 918 2018.09
Authorship:Lead author, Corresponding author Language:Japanese Publishing type:Research paper (other academic)
-
「日本語話し言葉コーパス」を用いた多数話者End-to-End音声合成
上乃 聖,三村 正人,河原 達也
日本音響学会講演論文集 919 - 920 2018.09
Authorship:Lead author, Corresponding author Language:Japanese Publishing type:Research paper (other academic)
-
End-to-End音声合成を用いた単語単位End-to-End音声認識の学習データ拡張
上乃 聖,三村 正人,河原 達也
日本音響学会講演論文集 1085 - 1086 2018.09
Authorship:Lead author, Corresponding author Language:Japanese Publishing type:Research paper (other academic)
-
Encoder Transfer for Attention-based Acoustic-to-word Speech Recognition Reviewed
Sei Ueno, Takafumi Moriya, Mimura Mimura, Shinsuke Sakai, YoshikazuYamaguchi, Yushi Aono, and Tatsuya Kawahara
INTERSPEECH 2424 - 2428 2018.09
Authorship:Lead author, Corresponding author Language:English Publishing type:Research paper (international conference proceedings)
-
Multi-task Learning with Augmentation Strategy for Acoustic-to-word Attention-based Encoder-decoder Speech Recognition Reviewed
Takafumi Moriya, Sei Ueno, Yusuke Shinohara, Marc Delcroix, Yoshikazu Yamaguchi, Yushi Aono
INTERSPEECH 2399 - 2403 2018.09
Language:English Publishing type:Research paper (international conference proceedings)
-
転移学習による注意機構付き単語単位音声認識の適応
上乃聖, 森谷崇史, 三村正人, 坂井信輔, 篠原雄介, 山口義和, 青野裕司, 河原達也
信学技報 118 ( 198 ) 7 - 8 2018.08
Authorship:Lead author, Corresponding author Language:Japanese Publishing type:Research paper (conference, symposium, etc.)
-
Acoustic-to-word Attention-based Model Complemented with Character-level CTC-based Model Reviewed
Sei Ueno, Hirofumi Inaguma, Masato Mimura, Tatsuya Kawahara
IEEE International Conference on Acoustics, Speech, and Signal Processing (ICASSP) 5804 - 5808 2018.04
Authorship:Lead author, Corresponding author Language:English Publishing type:Research paper (international conference proceedings)
-
文字単位のモデルを併用した単語単位のEnd-to-End音声認識
上乃 聖,稲熊 寛文,三村 正人,河原 達也
日本音響学会講演論文集 1505 - 1506 2018.03
Authorship:Lead author, Corresponding author Language:Japanese Publishing type:Research paper (other academic)
-
CTCによる文字単位のモデルを併用したattentionによる単語単位の end-to-end音声認識
上乃聖, 稲熊寛文, 三村正人, 河原達也
研究報告音声言語情報処理(SLP) 2018-SLP-120 ( 16 ) 1 - 6 2018.02
Authorship:Lead author, Corresponding author Language:Japanese Publishing type:Research paper (conference, symposium, etc.)