Papers - UENO Sei

Division display >> /  All the affair displays  1 - 64 of about 64
  • Data generation for speaker diarization by speaker transition information Reviewed

    Keigo Ichikawa, Sei Ueno, and Akinobu Lee

    Asia Pacific Signal and Information Processing Association (APSIPA)   2024.12

     More details

    Language:English   Publishing type:Research paper (international conference proceedings)  

    Other Link: https://www.apsipa2023.org/tprogram.html

  • 大規模事前学習モデルによる笑い声表現を用いたspeech-laugh音声の生成

    木全亮太朗, 上乃 聖, 李 晃伸

    日本音響学会講演論文集   2024.09

     More details

    Language:Japanese   Publishing type:Research paper (other academic)  

  • Refining Synthesized Speech Using Speaker Information and Phone Masking for Data Augmentation of Speech Recognition Reviewed

    Sei Ueno, Akinobu Lee, Tatsuya Kawahara

    IEEE/ACM Transactions on Audio, Speech, and Language Processing   32   3924 - 3933   2024.09

     More details

    Authorship:Lead author, Corresponding author   Language:English   Publishing type:Research paper (scientific journal)  

    DOI: 10.1109/TASLP.2024.3451982

    Other Link: https://repository.kulib.kyoto-u.ac.jp/dspace/handle/2433/289487

  • Multi-setting acoustic feature training for data augmentation of speech recognition Reviewed

    Sei Ueno, Akinobu Lee

    Acoustical Science and Technology   45 ( 4 )   195 - 203   2024.07

     More details

    Authorship:Lead author, Corresponding author   Language:English   Publishing type:Research paper (scientific journal)  

    DOI: https://doi.org/10.1250/ast.e23.70

    Other Link: https://www.jstage.jst.go.jp/article/ast/45/4/45_e23.70/_article/-char/ja

  • センチメント分析を用いた感情を重視した物語の階層的要約手法

    酒井 健壱, 上乃 聖, 李 晃伸

    言語処理学会 第30回年次大会 発表論文集   1119 - 1124   2024.03

     More details

    Language:Japanese   Publishing type:Research paper (other academic)  

    Other Link: https://www.anlp.jp/proceedings/annual_meeting/2024/index.html

  • 経験情報収集および伝達を主目的とする雑談対話による関係性維持支援システム

    志満津 奈央, 上乃 聖, 李 晃伸

    言語処理学会 第30回年次大会 発表論文集   1394 - 1399   2024.03

     More details

    Language:Japanese   Publishing type:Research paper (other academic)  

    Other Link: https://www.anlp.jp/proceedings/annual_meeting/2024/index.html

  • 大規模言語モデルを用いたEmotional Support Conversation システムの構築とその評価

    藤田 敦也, 上乃 聖, 李 晃伸

    言語処理学会 第30回年次大会 発表論文集   1378 - 1383   2024.03

     More details

    Language:Japanese   Publishing type:Research paper (other academic)  

    Other Link: https://www.anlp.jp/proceedings/annual_meeting/2024/index.html

  • Synthesis of non-native voice with native-like accent using voice conversion

    Iago Lourenço Correa, Sei Ueno, and Akinobu Lee

    2024.03

     More details

    Language:Japanese   Publishing type:Research paper (conference, symposium, etc.)  

    Other Link: https://acoustics.jp/annualmeeting/program/

  • LLM によるテキスト生成を用いた音声合成による音声認識のドメイン適応

    上乃 聖, 李 晃伸

    日本音響学会講演論文集   2024.03

     More details

    Authorship:Lead author, Corresponding author   Language:Japanese   Publishing type:Research paper (other academic)  

  • Cocktail Machine Speech Chain: 重複あり音声を用いた音声認識・音声合成モデルの統一的学習

    松永 裕太, 高道 慎之介, 上乃 聖, 猿渡 洋

    日本音響学会講演論文集   2024.03

     More details

    Language:Japanese   Publishing type:Research paper (other academic)  

  • 3 話者以上の話者交替情報を用いたSpeaker Diarization のためのデータ生成

    市川 奎吾, 上乃 聖, 李 晃伸

    日本音響学会講演論文集   2024.03

     More details

    Language:Japanese   Publishing type:Research paper (other academic)  

  • 日本語日常会話の潜在的な発話スタイルに基づく対話シーンに応じた音声合成

    嶋崎 純一, 上乃 聖, 李 晃伸

    日本音響学会講演論文集   2024.03

     More details

    Authorship:Lead author, Corresponding author   Language:Japanese   Publishing type:Research paper (other academic)  

  • 暗黙的な非線形処理を導入した拡散モデルを用いた音声合成

    岡本 海, 上乃 聖, 李 晃伸

    日本音響学会講演論文集   2024.03

     More details

    Language:Japanese   Publishing type:Research paper (other academic)  

  • 豊かなノンバーバルコミュニケーションのためのHMDを用いた没入型音声対話システム

    宮下 陸, 上乃 聖, 李 晃伸

    HAIシンポジウム   2024.03

     More details

    Language:Japanese   Publishing type:Research paper (other academic)  

  • CG エージェントを用いた音声対話システムにおける空間共有感のための自己投影法

    東 省吾, 上乃 聖, 李 晃伸

    HAIシンポジウム   2024.03

     More details

    Language:Japanese   Publishing type:Research paper (other academic)  

  • カウンセリングにおける悩み構造の言語化を支援する音声対話システム

    鈴木 香保, 上乃 聖, 李 晃伸

    HAIシンポジウム   2024.03

     More details

    Language:Japanese   Publishing type:Research paper (other academic)  

  • Accent-Preserving Voice Conversion between Native-Nonnative Speakers for Second Language Learning Reviewed

    Iago Lourenço Correa, Sei Ueno, and Akinobu Lee

    Asia Pacific Signal and Information Processing Association (APSIPA)   1179 - 1186   2023.11

     More details

    Language:English   Publishing type:Research paper (international conference proceedings)  

    DOI: https://doi.org/10.1109/APSIPAASC58517.2023.10317245

    Other Link: https://www.apsipa2023.org/tprogram.html

  • 発話交替頻度を導入した実対話音声に対するSpeaker Diarizationのためのデータ生成

    市川 奎吾, 上乃 聖, 李晃伸

    日本音響学会講演論文集   2023.09

     More details

    Language:Japanese   Publishing type:Research paper (conference, symposium, etc.)  

  • 異なるスタイルの笑い声生成のための有声音・無声音間隔の制御

    木全 亮太朗, 上乃 聖, 李晃伸

    日本音響学会講演論文集   2023.09

     More details

    Language:Japanese   Publishing type:Research paper (conference, symposium, etc.)  

  • 時間軸-周波数軸上の幅を持たせる音声合成を用いた音声認識のデータ拡張

    上乃聖, 李晃伸

    日本音響学会講演論文集   2023.09

     More details

    Authorship:Lead author   Language:Japanese   Publishing type:Research paper (conference, symposium, etc.)  

  • CGアバター対話における音声からの頭部動作および表情の自動生成

    藤岡 侑貴, 上乃 聖, 李晃伸

    人工知能学会全国大会   2023.06

     More details

    Language:Japanese   Publishing type:Research paper (conference, symposium, etc.)  

  • Continuous Integrate-and-Fire を用いた音声区間検出とターン終了検知のマルチタスク学習

    池口 弘尚, 東 佑樹, 上乃 聖,李 晃伸

    日本音響学会講演論文集   2023.03

     More details

    Language:Japanese   Publishing type:Research paper (conference, symposium, etc.)  

  • 複数設定のスペクトログラムを用いた音声合成に基づく音声認識のデータ拡張

    上乃聖, 李晃伸

    日本音響学会講演論文集   2023.03

     More details

    Authorship:Lead author   Language:Japanese   Publishing type:Research paper (conference, symposium, etc.)  

  • 連続的な感情表出を用いたカウンセリング対話エージェントの評価

    川又 朱莉, 上乃 聖, 李 晃伸

    HAIシンポジウム   2023.03

     More details

    Language:Japanese   Publishing type:Research paper (conference, symposium, etc.)  

  • 多様な笑い声生成のための有声音・無声音間隔の制御

    木全亮太朗, 上乃 聖, 李 晃伸

    情報処理学会全国大会講演論文集   2023.03

     More details

    Language:Japanese   Publishing type:Research paper (conference, symposium, etc.)  

  • Non-autoregressive Error Correction for CTC-based ASR with Phone-conditioned Masked LM Reviewed

    Hayato Futami, Hirofumi Inaguma, Sei Ueno, Masato Mimura, Shinsuke Sakai, Tatsuya Kawahara

    INTERSPEECH   3889 - 3893   2022.09

     More details

    Language:English   Publishing type:Research paper (international conference proceedings)  

  • 音声認識のデータ拡張のための話者情報およびマスクを用いた合成音声の周波数スペクトログラム強調

    上乃 聖,李 晃伸,河原 達也

    日本音響学会講演論文集   1149 - 1150   2022.09

     More details

    Authorship:Lead author, Corresponding author   Language:Japanese   Publishing type:Research paper (other academic)  

  • Phone-informed refinement of synthesized mel spectrogram for data augmentation in speech recognition Reviewed

    Sei Ueno and Tatsuya Kawahara

    International Conference on Acoustics, Speech, and Signal Processing (ICASSP)   8572 - 8576   2022.05

     More details

    Authorship:Lead author, Corresponding author   Language:English   Publishing type:Research paper (international conference proceedings)  

  • Data Augmentation Approaches for Automatic Speech Recognition Using Text-to-Speech

    Sei Ueno

    2022.03

     More details

    Authorship:Lead author, Corresponding author   Language:English   Publishing type:Doctoral thesis  

    DOI: https://doi.org/10.14989/doctor.k24027

  • 音声認識のデータ拡張のための音素情報を用いた合成音声の強調

    上乃 聖,河原 達也

    日本音響学会講演論文集   887 - 888   2022.03

     More details

    Authorship:Lead author, Corresponding author   Language:Japanese   Publishing type:Research paper (other academic)  

  • Data Augmentation for ASR Using TTS Via a Discrete Representation Reviewed

    Sei Ueno, Masato Mimura, Shinsuke Sakai, and Tatsuya Kawahara

    IEEE Automatic Speech Recognition and Understanding Workshop (ASRU)   68 - 74   2021.12

     More details

    Authorship:Lead author, Corresponding author   Language:English   Publishing type:Research paper (international conference proceedings)  

  • 音声認識のデータ拡張のための合成音声の周波数スペクトログラム強調

    上乃 聖,河原 達也

    研究報告音声言語情報処理(SLP)   2021-SLP-139 ( 28 )   1 - 6   2021.11

     More details

    Authorship:Lead author, Corresponding author   Language:Japanese   Publishing type:Research paper (conference, symposium, etc.)  

  • Synthesizing Waveform Sequence-to-sequence to Augment Training Data for Sequence-to-sequence Speech Recognition Reviewed

    Sei Ueno, Masato Mimura, Shinsuke Sakai, and Tatsuya Kawahara

    Acoustical Science and Technology   42 ( 6 )   333 - 343   2021.11

     More details

    Authorship:Lead author, Corresponding author   Language:English   Publishing type:Research paper (scientific journal)  

    DOI: https://doi.org/10.1250/ast.42.333

    Other Link: https://www.jstage.jst.go.jp/article/ast/42/6/42_E2108/_article

  • wav2vec 2.0を用いた音声合成による音声認識のデータ拡張

    上乃 聖,河原 達也

    日本音響学会講演論文集   857 - 858   2021.09

     More details

    Authorship:Lead author, Corresponding author   Language:Japanese   Publishing type:Research paper (other academic)  

  • vq-wav2vecによる離散IDを扱う音声認識のデータ拡張

    上乃 聖,三村 正人,河原 達也

    日本音響学会講演論文集   825 - 826   2021.03

     More details

    Authorship:Lead author, Corresponding author   Language:Japanese   Publishing type:Research paper (other academic)  

  • 複数話者を対象とした非自己回帰型ニューラル音声合成

    上乃 聖,三村 正人,河原 達也

    日本音響学会講演論文集   825 - 826   2021.03

     More details

    Authorship:Lead author, Corresponding author   Language:Japanese   Publishing type:Research paper (other academic)  

  • ELECTRAによる音声認識仮説のリスコアリング

    二見 颯,稲熊 寛文,上乃 聖,三村 正人,坂井 信輔,河原 達也

    日本音響学会講演論文集   827 - 828   2021.03

     More details

    Language:Japanese   Publishing type:Research paper (other academic)  

  • BERTによるSequence-to-Sequence音声認識への知識蒸留

    二見 颯,稲熊 寛文,上乃 聖,三村 正人,坂井 信輔,河原 達也

    研究報告音声言語情報処理(SLP)   2020-SLP-134 ( 2 )   1 - 6   2020.11

     More details

    Language:Japanese   Publishing type:Research paper (conference, symposium, etc.)  

  • Endto-End Speech-to-Dialog-Act Recognition Reviewed

    Viet-Trung Dang, Tianyu Zhao, Sei Ueno, Hirofumi Inaguma, Tatsuya Kawahara

    INTERSPEECH   3910 - 3914   2020.10

     More details

    Language:English   Publishing type:Research paper (international conference proceedings)  

    DOI: https://doi.org/10.21437/Interspeech.2020-1062

  • End-to-End Speech Emotion Recognition Combined with Acoustic-to-Word ASR Model Reviewed

    Han Feng, Sei Ueno, Tatsuya Kawahara

    INTERSPEECH   501 - 505   2020.10

     More details

    Language:English   Publishing type:Research paper (international conference proceedings)  

    DOI: https://doi.org/10.21437/Interspeech.2020-1180

  • Distilling the Knowledge of BERT for Sequence-to-Sequence ASR Reviewed

    Hayato Futami, Hirofumi Inaguma, Sei Ueno, Masato Mimura, Shinsuke Sakai, Tatsuya Kawahara

    INTERSPEECH   3635 - 3639   2020.10

     More details

    Language:English   Publishing type:Research paper (international conference proceedings)  

    DOI: https://doi.org/10.21437/Interspeech.2020-1179

  • Speech Corpus of Ainu Folklore and End-to-end Speech Recognition for Ainu Language Reviewed

    Speech Corpus of Ainu Folklore and End-to-end Speech Recognition for Ainu Language

    Proceedings of the Twelfth Language Resources and Evaluation Conference   2622 - 2628   2020.05

     More details

    Language:English   Publishing type:Research paper (international conference proceedings)  

  • end-to-end音声合成を用いた end-to-end音声認識のための学習データ拡張

    三村 正人,上乃 聖,坂井 信輔,河原 達也

    日本音響学会講演論文集   1269 - 1270   2020.03

     More details

    Language:Japanese   Publishing type:Research paper (other academic)  

  • 自動字幕作成システムにおけるモデルの拡張

    秋田祐哉, 上乃聖, 三村正人, 河原達也

    研究報告アクセシビリティ(AAC)   2020-AAC-12   1 - 4   2020.03

     More details

    Language:Japanese   Publishing type:Research paper (conference, symposium, etc.)  

  • 双方向transformer言語モデルによる音声認識仮説のリスコアリング

    二見颯, 上乃聖, 三村正人, 坂井信輔, 河原達也

    情報処理学会全国大会講演論文集   175 - 176   2020.03

     More details

    Language:Japanese   Publishing type:Research paper (other academic)  

  • 民話を対象としたアイヌ語音声コーパスとEnd-to-End音声認識

    松浦 孝平,上乃 聖,三村 正人,坂井 信輔,河原 達也

    研究報告音声言語情報処理(SLP)   2019-SLP-130 ( 16 )   1 - 6   2019.11

     More details

    Language:Japanese   Publishing type:Research paper (conference, symposium, etc.)  

  • 音声波形を入力とする単語単位End-to-End音声認識

    上乃聖, 三村正人, 坂井信輔, 河原達也

    研究報告音声言語情報処理(SLP)   2019-SLP-129 ( 2 )   1 - 5   2019.10

     More details

    Authorship:Lead author, Corresponding author   Language:Japanese   Publishing type:Research paper (conference, symposium, etc.)  

  • Wave2Word: 音声波形を入力とする単語単位End-to-End音声認識

    上乃 聖,三村 正人,坂井 信輔,河原 達也

    日本音響学会講演論文集   801 - 802   2019.09

     More details

    Authorship:Lead author, Corresponding author   Language:Japanese   Publishing type:Research paper (other academic)  

  • End-to-Endアイヌ語音声認識におけるクロスリンガル話者拡張敵対学習

    松浦 孝平,上乃 聖,三村 正人,坂井 信輔,河原 達也

    日本音響学会講演論文集   799 - 800   2019.09

     More details

    Language:Japanese   Publishing type:Research paper (other academic)  

  • Multi-speaker Sequence-to-sequence Speech Synthesis for Data Augmentation in Acoustic-to-word Speech Recognition Reviewed

    Sei Ueno, Masato Mimura, Shinsuke Sakai, Tatsuya Kawahara

    IEEE International Conference on Acoustics, Speech, and Signal Processing (ICASSP)   6161 - 6165   2019.05

     More details

    Authorship:Lead author, Corresponding author   Language:English   Publishing type:Research paper (international conference proceedings)  

  • 多数話者コーパスを用いたEnd-to-End音声合成による単語単位End-to-End音声認識のデータ拡張

    上乃 聖,三村 正人,坂井 信輔,河原 達也

    日本音響学会講演論文集   865 - 866   2019.03

     More details

    Authorship:Lead author, Corresponding author   Language:Japanese   Publishing type:Research paper (other academic)  

  • End-to-Endモデルに基づくアイヌ語の音声認識

    松浦 孝平,三村 正人,上乃 聖,坂井 信輔,河原 達也

    日本音響学会講演論文集   867 - 868   2019.03

     More details

    Language:Japanese   Publishing type:Research paper (other academic)  

  • 音声認識を用いた字幕作成システムの改良

    秋田祐哉, 上乃聖, 三村正人, 河原達也

    研究報告アクセシビリティ(AAC)   2019-AAC-9 ( 34 )   1 - 5   2019.03

     More details

    Language:Japanese   Publishing type:Research paper (conference, symposium, etc.)  

  • Leveraging sequence-to-sequence Speech Synthesis for Enhancing Acoustic-to-word Speech Recognition Reviewed

    Masato Mimura, Sei Ueno, Hirofumi Inaguma, Shinsuke Sakai, and Tatsuya Kawahara

    IEEE Spoken Language Technology Workshop (SLT)   477 - 484   2018.12

     More details

    Language:English   Publishing type:Research paper (international conference proceedings)  

    DOI: https://doi.org/10.1109/SLT.2018.8639589

  • End-to-End音声合成を用いた単語単位End-to-End音声認識のデータ拡張

    上乃聖, 三村正人, 坂井信輔, 河原達也

    研究報告音声言語情報処理(SLP)   2018-SLP-125 ( 2 )   1 - 5   2018.12

     More details

    Authorship:Lead author, Corresponding author   Language:Japanese   Publishing type:Research paper (conference, symposium, etc.)  

  • 単語単位エンコーダデコーダ音声認識モデルの転移学習を用いた適応

    上乃 聖,森谷 崇史,三村 正人,坂井 信輔,篠原 雄介,山口 義和,青野 裕司,河原 達也

    日本音響学会講演論文集   917 - 918   2018.09

     More details

    Authorship:Lead author, Corresponding author   Language:Japanese   Publishing type:Research paper (other academic)  

  • 「日本語話し言葉コーパス」を用いた多数話者End-to-End音声合成

    上乃 聖,三村 正人,河原 達也

    日本音響学会講演論文集   919 - 920   2018.09

     More details

    Authorship:Lead author, Corresponding author   Language:Japanese   Publishing type:Research paper (other academic)  

  • End-to-End音声合成を用いた単語単位End-to-End音声認識の学習データ拡張

    上乃 聖,三村 正人,河原 達也

    日本音響学会講演論文集   1085 - 1086   2018.09

     More details

    Authorship:Lead author, Corresponding author   Language:Japanese   Publishing type:Research paper (other academic)  

  • Encoder Transfer for Attention-based Acoustic-to-word Speech Recognition Reviewed

    Sei Ueno, Takafumi Moriya, Mimura Mimura, Shinsuke Sakai, YoshikazuYamaguchi, Yushi Aono, and Tatsuya Kawahara

    INTERSPEECH   2424 - 2428   2018.09

     More details

    Authorship:Lead author, Corresponding author   Language:English   Publishing type:Research paper (international conference proceedings)  

  • Multi-task Learning with Augmentation Strategy for Acoustic-to-word Attention-based Encoder-decoder Speech Recognition Reviewed

    Takafumi Moriya, Sei Ueno, Yusuke Shinohara, Marc Delcroix, Yoshikazu Yamaguchi, Yushi Aono

    INTERSPEECH   2399 - 2403   2018.09

     More details

    Language:English   Publishing type:Research paper (international conference proceedings)  

    DOI: https://doi.org/10.21437/Interspeech.2018-1866

  • 転移学習による注意機構付き単語単位音声認識の適応

    上乃聖, 森谷崇史, 三村正人, 坂井信輔, 篠原雄介, 山口義和, 青野裕司, 河原達也

    信学技報   118 ( 198 )   7 - 8   2018.08

     More details

    Authorship:Lead author, Corresponding author   Language:Japanese   Publishing type:Research paper (conference, symposium, etc.)  

  • Acoustic-to-word Attention-based Model Complemented with Character-level CTC-based Model Reviewed

    Sei Ueno, Hirofumi Inaguma, Masato Mimura, Tatsuya Kawahara

    IEEE International Conference on Acoustics, Speech, and Signal Processing (ICASSP)   5804 - 5808   2018.04

     More details

    Authorship:Lead author, Corresponding author   Language:English   Publishing type:Research paper (international conference proceedings)  

  • 文字単位のモデルを併用した単語単位のEnd-to-End音声認識

    上乃 聖,稲熊 寛文,三村 正人,河原 達也

    日本音響学会講演論文集   1505 - 1506   2018.03

     More details

    Authorship:Lead author, Corresponding author   Language:Japanese   Publishing type:Research paper (other academic)  

  • CTCによる文字単位のモデルを併用したattentionによる単語単位の end-to-end音声認識

    上乃聖, 稲熊寛文, 三村正人, 河原達也

    研究報告音声言語情報処理(SLP)   2018-SLP-120 ( 16 )   1 - 6   2018.02

     More details

    Authorship:Lead author, Corresponding author   Language:Japanese   Publishing type:Research paper (conference, symposium, etc.)  

To the head of this page.▲