Details of a Researcher

Papers - UENO Sei

Division display >> ／ All the affair displays 1 - 64 of about 64

Data generation for speaker diarization by speaker transition information Reviewed

Keigo Ichikawa, Sei Ueno, and Akinobu Lee

Asia Pacific Signal and Information Processing Association (APSIPA) 2024.12

Language：English Publishing type：Research paper (international conference proceedings)

Other Link： https://www.apsipa2023.org/tprogram.html

大規模事前学習モデルによる笑い声表現を用いたspeech-laugh音声の生成

木全亮太朗, 上乃聖, 李晃伸

日本音響学会講演論文集 2024.09

Language：Japanese Publishing type：Research paper (other academic)

Refining Synthesized Speech Using Speaker Information and Phone Masking for Data Augmentation of Speech Recognition Reviewed

Sei Ueno, Akinobu Lee, Tatsuya Kawahara

IEEE/ACM Transactions on Audio, Speech, and Language Processing 32 3924 - 3933 2024.09

Authorship：Lead author,　Corresponding author Language：English Publishing type：Research paper (scientific journal)

DOI： 10.1109/TASLP.2024.3451982

Other Link： https://repository.kulib.kyoto-u.ac.jp/dspace/handle/2433/289487

Multi-setting acoustic feature training for data augmentation of speech recognition Reviewed

Sei Ueno, Akinobu Lee

Acoustical Science and Technology 45 ( 4 ) 195 - 203 2024.07

Authorship：Lead author,　Corresponding author Language：English Publishing type：Research paper (scientific journal)

DOI： https://doi.org/10.1250/ast.e23.70

Other Link： https://www.jstage.jst.go.jp/article/ast/45/4/45_e23.70/_article/-char/ja

センチメント分析を用いた感情を重視した物語の階層的要約手法

酒井健壱, 上乃聖, 李晃伸

言語処理学会第30回年次大会発表論文集 1119 - 1124 2024.03

Language：Japanese Publishing type：Research paper (other academic)

Other Link： https://www.anlp.jp/proceedings/annual_meeting/2024/index.html

経験情報収集および伝達を主目的とする雑談対話による関係性維持支援システム

志満津奈央, 上乃聖, 李晃伸

言語処理学会第30回年次大会発表論文集 1394 - 1399 2024.03

Language：Japanese Publishing type：Research paper (other academic)

Other Link： https://www.anlp.jp/proceedings/annual_meeting/2024/index.html

大規模言語モデルを用いたEmotional Support Conversation システムの構築とその評価

藤田敦也, 上乃聖, 李晃伸

言語処理学会第30回年次大会発表論文集 1378 - 1383 2024.03

Language：Japanese Publishing type：Research paper (other academic)

Other Link： https://www.anlp.jp/proceedings/annual_meeting/2024/index.html

Synthesis of non-native voice with native-like accent using voice conversion

Iago Lourenço Correa, Sei Ueno, and Akinobu Lee

2024.03

Language：Japanese Publishing type：Research paper (conference, symposium, etc.)

Other Link： https://acoustics.jp/annualmeeting/program/

LLM によるテキスト生成を用いた音声合成による音声認識のドメイン適応

上乃聖, 李晃伸

日本音響学会講演論文集 2024.03

Authorship：Lead author,　Corresponding author Language：Japanese Publishing type：Research paper (other academic)

Cocktail Machine Speech Chain: 重複あり音声を用いた音声認識・音声合成モデルの統一的学習

松永裕太, 高道慎之介, 上乃聖, 猿渡洋

日本音響学会講演論文集 2024.03

Language：Japanese Publishing type：Research paper (other academic)

3 話者以上の話者交替情報を用いたSpeaker Diarization のためのデータ生成

市川奎吾, 上乃聖, 李晃伸

日本音響学会講演論文集 2024.03

Language：Japanese Publishing type：Research paper (other academic)

日本語日常会話の潜在的な発話スタイルに基づく対話シーンに応じた音声合成

嶋崎純一, 上乃聖, 李晃伸

日本音響学会講演論文集 2024.03

Authorship：Lead author,　Corresponding author Language：Japanese Publishing type：Research paper (other academic)

暗黙的な非線形処理を導入した拡散モデルを用いた音声合成

岡本海, 上乃聖, 李晃伸

日本音響学会講演論文集 2024.03

Language：Japanese Publishing type：Research paper (other academic)

豊かなノンバーバルコミュニケーションのためのHMDを用いた没入型音声対話システム

宮下陸, 上乃聖, 李晃伸

HAIシンポジウム 2024.03

Language：Japanese Publishing type：Research paper (other academic)

CG エージェントを用いた音声対話システムにおける空間共有感のための自己投影法

東省吾, 上乃聖, 李晃伸

HAIシンポジウム 2024.03

Language：Japanese Publishing type：Research paper (other academic)

カウンセリングにおける悩み構造の言語化を支援する音声対話システム

鈴木香保, 上乃聖, 李晃伸

HAIシンポジウム 2024.03

Language：Japanese Publishing type：Research paper (other academic)

Accent-Preserving Voice Conversion between Native-Nonnative Speakers for Second Language Learning Reviewed

Iago Lourenço Correa, Sei Ueno, and Akinobu Lee

Asia Pacific Signal and Information Processing Association (APSIPA) 1179 - 1186 2023.11

Language：English Publishing type：Research paper (international conference proceedings)

DOI： https://doi.org/10.1109/APSIPAASC58517.2023.10317245

Other Link： https://www.apsipa2023.org/tprogram.html

発話交替頻度を導入した実対話音声に対するSpeaker Diarizationのためのデータ生成

市川奎吾, 上乃聖, 李晃伸

日本音響学会講演論文集 2023.09

Language：Japanese Publishing type：Research paper (conference, symposium, etc.)

異なるスタイルの笑い声生成のための有声音・無声音間隔の制御

木全亮太朗, 上乃聖, 李晃伸

日本音響学会講演論文集 2023.09

Language：Japanese Publishing type：Research paper (conference, symposium, etc.)

時間軸-周波数軸上の幅を持たせる音声合成を用いた音声認識のデータ拡張

上乃聖, 李晃伸

日本音響学会講演論文集 2023.09

Authorship：Lead author Language：Japanese Publishing type：Research paper (conference, symposium, etc.)

CGアバター対話における音声からの頭部動作および表情の自動生成

藤岡侑貴, 上乃聖, 李晃伸

人工知能学会全国大会 2023.06

Language：Japanese Publishing type：Research paper (conference, symposium, etc.)

Continuous Integrate-and-Fire を用いた音声区間検出とターン終了検知のマルチタスク学習

池口弘尚, 東佑樹, 上乃聖，李晃伸

日本音響学会講演論文集 2023.03

Language：Japanese Publishing type：Research paper (conference, symposium, etc.)

複数設定のスペクトログラムを用いた音声合成に基づく音声認識のデータ拡張

上乃聖, 李晃伸

日本音響学会講演論文集 2023.03

Authorship：Lead author Language：Japanese Publishing type：Research paper (conference, symposium, etc.)

連続的な感情表出を用いたカウンセリング対話エージェントの評価

川又朱莉, 上乃聖, 李晃伸

HAIシンポジウム 2023.03

Language：Japanese Publishing type：Research paper (conference, symposium, etc.)

多様な笑い声生成のための有声音・無声音間隔の制御

木全亮太朗, 上乃聖, 李晃伸

情報処理学会全国大会講演論文集 2023.03

Language：Japanese Publishing type：Research paper (conference, symposium, etc.)

Non-autoregressive Error Correction for CTC-based ASR with Phone-conditioned Masked LM Reviewed

Hayato Futami, Hirofumi Inaguma, Sei Ueno, Masato Mimura, Shinsuke Sakai, Tatsuya Kawahara

INTERSPEECH 3889 - 3893 2022.09

Language：English Publishing type：Research paper (international conference proceedings)

音声認識のデータ拡張のための話者情報およびマスクを用いた合成音声の周波数スペクトログラム強調

上乃聖，李晃伸，河原達也

日本音響学会講演論文集 1149 - 1150 2022.09

Authorship：Lead author,　Corresponding author Language：Japanese Publishing type：Research paper (other academic)

Phone-informed refinement of synthesized mel spectrogram for data augmentation in speech recognition Reviewed

Sei Ueno and Tatsuya Kawahara

International Conference on Acoustics, Speech, and Signal Processing (ICASSP) 8572 - 8576 2022.05

Authorship：Lead author,　Corresponding author Language：English Publishing type：Research paper (international conference proceedings)

Data Augmentation Approaches for Automatic Speech Recognition Using Text-to-Speech

Sei Ueno

2022.03

Authorship：Lead author,　Corresponding author Language：English Publishing type：Doctoral thesis

DOI： https://doi.org/10.14989/doctor.k24027

音声認識のデータ拡張のための音素情報を用いた合成音声の強調

上乃聖，河原達也

日本音響学会講演論文集 887 - 888 2022.03

Authorship：Lead author,　Corresponding author Language：Japanese Publishing type：Research paper (other academic)

Data Augmentation for ASR Using TTS Via a Discrete Representation Reviewed

Sei Ueno, Masato Mimura, Shinsuke Sakai, and Tatsuya Kawahara

IEEE Automatic Speech Recognition and Understanding Workshop (ASRU) 68 - 74 2021.12

Authorship：Lead author,　Corresponding author Language：English Publishing type：Research paper (international conference proceedings)

音声認識のデータ拡張のための合成音声の周波数スペクトログラム強調

上乃聖，河原達也

研究報告音声言語情報処理（SLP） 2021-SLP-139 ( 28 ) 1 - 6 2021.11

Authorship：Lead author,　Corresponding author Language：Japanese Publishing type：Research paper (conference, symposium, etc.)

Synthesizing Waveform Sequence-to-sequence to Augment Training Data for Sequence-to-sequence Speech Recognition Reviewed

Sei Ueno, Masato Mimura, Shinsuke Sakai, and Tatsuya Kawahara

Acoustical Science and Technology 42 ( 6 ) 333 - 343 2021.11

Authorship：Lead author,　Corresponding author Language：English Publishing type：Research paper (scientific journal)

DOI： https://doi.org/10.1250/ast.42.333

Other Link： https://www.jstage.jst.go.jp/article/ast/42/6/42_E2108/_article

wav2vec 2.0を用いた音声合成による音声認識のデータ拡張

上乃聖，河原達也

日本音響学会講演論文集 857 - 858 2021.09

Authorship：Lead author,　Corresponding author Language：Japanese Publishing type：Research paper (other academic)

vq-wav2vecによる離散IDを扱う音声認識のデータ拡張

上乃聖，三村正人，河原達也

日本音響学会講演論文集 825 - 826 2021.03

Authorship：Lead author,　Corresponding author Language：Japanese Publishing type：Research paper (other academic)

複数話者を対象とした非自己回帰型ニューラル音声合成

上乃聖，三村正人，河原達也

日本音響学会講演論文集 825 - 826 2021.03

Authorship：Lead author,　Corresponding author Language：Japanese Publishing type：Research paper (other academic)

ELECTRAによる音声認識仮説のリスコアリング

二見颯，稲熊寛文，上乃聖，三村正人，坂井信輔，河原達也

日本音響学会講演論文集 827 - 828 2021.03

Language：Japanese Publishing type：Research paper (other academic)

BERTによるSequence-to-Sequence音声認識への知識蒸留

二見颯，稲熊寛文，上乃聖，三村正人，坂井信輔，河原達也

研究報告音声言語情報処理（SLP） 2020-SLP-134 ( 2 ) 1 - 6 2020.11

Language：Japanese Publishing type：Research paper (conference, symposium, etc.)

Endto-End Speech-to-Dialog-Act Recognition Reviewed

Viet-Trung Dang, Tianyu Zhao, Sei Ueno, Hirofumi Inaguma, Tatsuya Kawahara

INTERSPEECH 3910 - 3914 2020.10

Language：English Publishing type：Research paper (international conference proceedings)

DOI： https://doi.org/10.21437/Interspeech.2020-1062

End-to-End Speech Emotion Recognition Combined with Acoustic-to-Word ASR Model Reviewed

Han Feng, Sei Ueno, Tatsuya Kawahara

INTERSPEECH 501 - 505 2020.10

Language：English Publishing type：Research paper (international conference proceedings)

DOI： https://doi.org/10.21437/Interspeech.2020-1180

Distilling the Knowledge of BERT for Sequence-to-Sequence ASR Reviewed

Hayato Futami, Hirofumi Inaguma, Sei Ueno, Masato Mimura, Shinsuke Sakai, Tatsuya Kawahara

INTERSPEECH 3635 - 3639 2020.10

Language：English Publishing type：Research paper (international conference proceedings)

DOI： https://doi.org/10.21437/Interspeech.2020-1179

Speech Corpus of Ainu Folklore and End-to-end Speech Recognition for Ainu Language Reviewed

Speech Corpus of Ainu Folklore and End-to-end Speech Recognition for Ainu Language

Proceedings of the Twelfth Language Resources and Evaluation Conference 2622 - 2628 2020.05

Language：English Publishing type：Research paper (international conference proceedings)

end-to-end音声合成を用いた end-to-end音声認識のための学習データ拡張

三村正人，上乃聖，坂井信輔，河原達也

日本音響学会講演論文集 1269 - 1270 2020.03

Language：Japanese Publishing type：Research paper (other academic)

自動字幕作成システムにおけるモデルの拡張

秋田祐哉, 上乃聖, 三村正人, 河原達也

研究報告アクセシビリティ（AAC） 2020-AAC-12 1 - 4 2020.03

Language：Japanese Publishing type：Research paper (conference, symposium, etc.)

双方向transformer言語モデルによる音声認識仮説のリスコアリング

二見颯, 上乃聖, 三村正人, 坂井信輔, 河原達也

情報処理学会全国大会講演論文集 175 - 176 2020.03

Language：Japanese Publishing type：Research paper (other academic)

民話を対象としたアイヌ語音声コーパスとEnd-to-End音声認識

松浦孝平，上乃聖，三村正人，坂井信輔，河原達也

研究報告音声言語情報処理（SLP） 2019-SLP-130 ( 16 ) 1 - 6 2019.11

Language：Japanese Publishing type：Research paper (conference, symposium, etc.)

音声波形を入力とする単語単位End-to-End音声認識

上乃聖, 三村正人, 坂井信輔, 河原達也

研究報告音声言語情報処理（SLP） 2019-SLP-129 ( 2 ) 1 - 5 2019.10

Authorship：Lead author,　Corresponding author Language：Japanese Publishing type：Research paper (conference, symposium, etc.)

Wave2Word: 音声波形を入力とする単語単位End-to-End音声認識

上乃聖，三村正人，坂井信輔，河原達也

日本音響学会講演論文集 801 - 802 2019.09

Authorship：Lead author,　Corresponding author Language：Japanese Publishing type：Research paper (other academic)

End-to-Endアイヌ語音声認識におけるクロスリンガル話者拡張敵対学習

松浦孝平，上乃聖，三村正人，坂井信輔，河原達也

日本音響学会講演論文集 799 - 800 2019.09

Language：Japanese Publishing type：Research paper (other academic)

Multi-speaker Sequence-to-sequence Speech Synthesis for Data Augmentation in Acoustic-to-word Speech Recognition Reviewed

Sei Ueno, Masato Mimura, Shinsuke Sakai, Tatsuya Kawahara

IEEE International Conference on Acoustics, Speech, and Signal Processing (ICASSP) 6161 - 6165 2019.05

Authorship：Lead author,　Corresponding author Language：English Publishing type：Research paper (international conference proceedings)

多数話者コーパスを用いたEnd-to-End音声合成による単語単位End-to-End音声認識のデータ拡張

上乃聖，三村正人，坂井信輔，河原達也

日本音響学会講演論文集 865 - 866 2019.03

Authorship：Lead author,　Corresponding author Language：Japanese Publishing type：Research paper (other academic)

End-to-Endモデルに基づくアイヌ語の音声認識

松浦孝平，三村正人，上乃聖，坂井信輔，河原達也

日本音響学会講演論文集 867 - 868 2019.03

Language：Japanese Publishing type：Research paper (other academic)

音声認識を用いた字幕作成システムの改良

秋田祐哉, 上乃聖, 三村正人, 河原達也

研究報告アクセシビリティ（AAC） 2019-AAC-9 ( 34 ) 1 - 5 2019.03

Language：Japanese Publishing type：Research paper (conference, symposium, etc.)

Leveraging sequence-to-sequence Speech Synthesis for Enhancing Acoustic-to-word Speech Recognition Reviewed

Masato Mimura, Sei Ueno, Hirofumi Inaguma, Shinsuke Sakai, and Tatsuya Kawahara

IEEE Spoken Language Technology Workshop (SLT) 477 - 484 2018.12

Language：English Publishing type：Research paper (international conference proceedings)

DOI： https://doi.org/10.1109/SLT.2018.8639589

End-to-End音声合成を用いた単語単位End-to-End音声認識のデータ拡張

上乃聖, 三村正人, 坂井信輔, 河原達也

研究報告音声言語情報処理（SLP） 2018-SLP-125 ( 2 ) 1 - 5 2018.12

Authorship：Lead author,　Corresponding author Language：Japanese Publishing type：Research paper (conference, symposium, etc.)

単語単位エンコーダデコーダ音声認識モデルの転移学習を用いた適応

上乃聖，森谷崇史，三村正人，坂井信輔，篠原雄介，山口義和，青野裕司，河原達也

日本音響学会講演論文集 917 - 918 2018.09

Authorship：Lead author,　Corresponding author Language：Japanese Publishing type：Research paper (other academic)

「日本語話し言葉コーパス」を用いた多数話者End-to-End音声合成

上乃聖，三村正人，河原達也

日本音響学会講演論文集 919 - 920 2018.09

Authorship：Lead author,　Corresponding author Language：Japanese Publishing type：Research paper (other academic)

End-to-End音声合成を用いた単語単位End-to-End音声認識の学習データ拡張

上乃聖，三村正人，河原達也

日本音響学会講演論文集 1085 - 1086 2018.09

Authorship：Lead author,　Corresponding author Language：Japanese Publishing type：Research paper (other academic)

Encoder Transfer for Attention-based Acoustic-to-word Speech Recognition Reviewed

Sei Ueno, Takafumi Moriya, Mimura Mimura, Shinsuke Sakai, YoshikazuYamaguchi, Yushi Aono, and Tatsuya Kawahara

INTERSPEECH 2424 - 2428 2018.09

Authorship：Lead author,　Corresponding author Language：English Publishing type：Research paper (international conference proceedings)

Multi-task Learning with Augmentation Strategy for Acoustic-to-word Attention-based Encoder-decoder Speech Recognition Reviewed

Takafumi Moriya, Sei Ueno, Yusuke Shinohara, Marc Delcroix, Yoshikazu Yamaguchi, Yushi Aono

INTERSPEECH 2399 - 2403 2018.09

Language：English Publishing type：Research paper (international conference proceedings)

DOI： https://doi.org/10.21437/Interspeech.2018-1866

転移学習による注意機構付き単語単位音声認識の適応

上乃聖, 森谷崇史, 三村正人, 坂井信輔, 篠原雄介, 山口義和, 青野裕司, 河原達也

信学技報 118 ( 198 ) 7 - 8 2018.08

Authorship：Lead author,　Corresponding author Language：Japanese Publishing type：Research paper (conference, symposium, etc.)

Acoustic-to-word Attention-based Model Complemented with Character-level CTC-based Model Reviewed

Sei Ueno, Hirofumi Inaguma, Masato Mimura, Tatsuya Kawahara

IEEE International Conference on Acoustics, Speech, and Signal Processing (ICASSP) 5804 - 5808 2018.04

Authorship：Lead author,　Corresponding author Language：English Publishing type：Research paper (international conference proceedings)

文字単位のモデルを併用した単語単位のEnd-to-End音声認識

上乃聖，稲熊寛文，三村正人，河原達也

日本音響学会講演論文集 1505 - 1506 2018.03

Authorship：Lead author,　Corresponding author Language：Japanese Publishing type：Research paper (other academic)

CTCによる文字単位のモデルを併用したattentionによる単語単位の end-to-end音声認識

上乃聖, 稲熊寛文, 三村正人, 河原達也

研究報告音声言語情報処理（SLP） 2018-SLP-120 ( 16 ) 1 - 6 2018.02

Authorship：Lead author,　Corresponding author Language：Japanese Publishing type：Research paper (conference, symposium, etc.)

PREV - NEXT

To the head of this page.▲

<UENO Sei>

Papers - UENO Sei