上乃 聖 (ウエノ セイ)

UENO Sei

写真a

学位

  • 博士 (情報学) ( 2022年03月   京都大学 )

  • 修士 ( 2019年03月   京都大学 )

  • 学士 ( 2017年03月   同志社大学 )

研究分野

  • 情報通信 / 知能情報学  / 音声認識,音声合成

出身学校

  • 同志社大学   理工学部   情報システムデザイン学科   卒業

    2013年04月 - 2017年03月

      詳細を見る

    国名:日本国

出身大学院

  • 京都大学   情報学研究科   知能情報学専攻   博士課程   修了

    2019年04月 - 2022年03月

      詳細を見る

    国名:日本国

  • 京都大学   情報学研究科   知能情報学専攻   修士課程   修了

    2017年04月 - 2019年03月

      詳細を見る

    国名:日本国

 

論文

  • Non-autoregressive Error Correction for CTC-based ASR with Phone-conditioned Masked LM 査読あり

    Hayato Futami, Hirofumi Inaguma, Sei Ueno, Masato Mimura, Shinsuke Sakai, Tatsuya Kawahara

    INTERSPEECH   3889 - 3893   2022年09月

     詳細を見る

    記述言語:英語   掲載種別:研究論文(国際会議プロシーディングス)  

  • 音声認識のデータ拡張のための話者情報およびマスクを用いた合成音声の周波数スペクトログラム強調

    上乃 聖,李 晃伸,河原 達也

    日本音響学会講演論文集   1149 - 1150   2022年09月

     詳細を見る

    担当区分:筆頭著者, 責任著者   記述言語:日本語   掲載種別:研究論文(その他学術会議資料等)  

  • Phone-informed refinement of synthesized mel spectrogram for data augmentation in speech recognition 査読あり

    Sei Ueno and Tatsuya Kawahara

    International Conference on Acoustics, Speech, and Signal Processing (ICASSP)   8572 - 8576   2022年05月

     詳細を見る

    担当区分:筆頭著者, 責任著者   記述言語:英語   掲載種別:研究論文(国際会議プロシーディングス)  

  • Data Augmentation Approaches for Automatic Speech Recognition Using Text-to-Speech

    Sei Ueno

    2022年03月

     詳細を見る

    担当区分:筆頭著者, 責任著者   記述言語:英語   掲載種別:学位論文(博士)  

    DOI: https://doi.org/10.14989/doctor.k24027

  • 音声認識のデータ拡張のための音素情報を用いた合成音声の強調

    上乃 聖,河原 達也

    日本音響学会講演論文集   887 - 888   2022年03月

     詳細を見る

    担当区分:筆頭著者, 責任著者   記述言語:日本語   掲載種別:研究論文(その他学術会議資料等)  

  • Data Augmentation for ASR Using TTS Via a Discrete Representation 査読あり

    Sei Ueno, Masato Mimura, Shinsuke Sakai, and Tatsuya Kawahara

    IEEE Automatic Speech Recognition and Understanding Workshop (ASRU)   68 - 74   2021年12月

     詳細を見る

    担当区分:筆頭著者, 責任著者   記述言語:英語   掲載種別:研究論文(国際会議プロシーディングス)  

  • 音声認識のデータ拡張のための合成音声の周波数スペクトログラム強調

    上乃 聖,河原 達也

    研究報告音声言語情報処理(SLP)   2021-SLP-139 ( 28 )   1 - 6   2021年11月

     詳細を見る

    担当区分:筆頭著者, 責任著者   記述言語:日本語   掲載種別:研究論文(研究会,シンポジウム資料等)  

  • Synthesizing Waveform Sequence-to-sequence to Augment Training Data for Sequence-to-sequence Speech Recognition 査読あり

    Sei Ueno, Masato Mimura, Shinsuke Sakai, and Tatsuya Kawahara

    Acoustical Science and Technology   42 ( 6 )   333 - 343   2021年11月

     詳細を見る

    担当区分:筆頭著者, 責任著者   記述言語:英語   掲載種別:研究論文(学術雑誌)  

    DOI: https://doi.org/10.1250/ast.42.333

    その他リンク: https://www.jstage.jst.go.jp/article/ast/42/6/42_E2108/_article

  • wav2vec 2.0を用いた音声合成による音声認識のデータ拡張

    上乃 聖,河原 達也

    日本音響学会講演論文集   857 - 858   2021年09月

     詳細を見る

    担当区分:筆頭著者, 責任著者   記述言語:日本語   掲載種別:研究論文(その他学術会議資料等)  

  • vq-wav2vecによる離散IDを扱う音声認識のデータ拡張

    上乃 聖,三村 正人,河原 達也

    日本音響学会講演論文集   825 - 826   2021年03月

     詳細を見る

    担当区分:筆頭著者, 責任著者   記述言語:日本語   掲載種別:研究論文(その他学術会議資料等)  

全件表示 >>

講演・口頭発表等

  • Non-autoregressive Error Correction for CTC-based ASR with Phone-conditioned Masked LM 国際会議

    Hayato Futami, Hirofumi Inaguma, Sei Ueno, Masato Mimura, Shinsuke Sakai, Tatsuya Kawahara

    INTERSPEECH  2022年09月 

     詳細を見る

    開催年月日: 2022年09月

    記述言語:英語   会議種別:ポスター発表  

    開催地:Virtual   国名:大韓民国  

  • 音声認識のデータ拡張のための話者情報およびマスクを用いた合成音声の周波数スペクトログラム強調

    上乃聖

    日本音響学会 研究発表会  2022年09月  一般社団法人 日本音響学会

     詳細を見る

    開催年月日: 2022年09月

    記述言語:日本語   会議種別:口頭発表(一般)  

    開催地:北海道科学大学   国名:日本国  

  • 音声認識のための音声合成を用いたデータ拡張 招待あり

    上乃聖

    電気・電子・情報関係学会 東海支部連合大会  2022年08月  電気・電子・情報関係学会 東海支部

     詳細を見る

    開催年月日: 2022年08月

    記述言語:日本語   会議種別:シンポジウム・ワークショップ パネル(指名)  

    開催地:オンライン   国名:日本国  

  • 自然言語推論を用いた文脈情報・ペルソナと一貫性を保つ対話応答選択

    義井健史,上乃聖,李晃伸

    NLP若手の会 (YANS) 第17回シンポジウム  2022年08月 

     詳細を見る

    開催年月日: 2022年08月

    記述言語:日本語   会議種別:ポスター発表  

    開催地:オンライン   国名:日本国  

  • 知識グラフに基づく話題の展開・掘り下げを統合した趣味対話生成

    藤田敦也,上乃聖,李晃伸

    NLP若手の会 (YANS) 第17回シンポジウム  2022年08月 

     詳細を見る

    開催年月日: 2022年08月

    記述言語:日本語   会議種別:ポスター発表  

    開催地:オンライン   国名:日本国  

  • Phone-informed refinement of synthesized mel spectrogram for data augmentation in speech recognition 国際会議

    Sei Ueno, Tatsuya Kawahara

    IEEE International Conference on Acoustics, Speech and Signal Processing (ICASSP)  2022年05月 

     詳細を見る

    開催年月日: 2022年05月

    記述言語:英語   会議種別:ポスター発表  

    開催地:Virtual   国名:シンガポール共和国  

  • 音声認識のデータ拡張のための音素情報を用いた合成音声の強調

    上乃 聖,河原 達也

    日本音響学会 研究発表会  2022年03月 

     詳細を見る

    開催年月日: 2022年03月

    記述言語:日本語   会議種別:口頭発表(一般)  

    国名:日本国  

  • Data Augmentation for ASR Using TTS Via a Discrete Representation 国際会議

    Sei Ueno, Masato Mimura, Shinsuke Sakai, Tatsuya Kawahara

    IEEE Automatic Speech Recognition and Understanding Workshop (ASRU)  2021年12月 

     詳細を見る

    開催年月日: 2021年12月

    記述言語:英語   会議種別:口頭発表(一般)  

    開催地:Virtual  

  • 音声認識のデータ拡張のための合成音声の周波数スペクトログラム強調

    上乃聖,河原達也

    情報処理学会研究報告  2021年12月  電子情報通信学会および日本音響学会 音声研究会

     詳細を見る

    開催年月日: 2021年12月

    記述言語:日本語   会議種別:口頭発表(一般)  

    開催地:オンライン   国名:日本国  

  • wav2vec 2.0を用いた音声合成による音声認識のデータ拡張

    上乃 聖,河原 達也

    日本音響学会 研究発表会  2021年09月 

     詳細を見る

    開催年月日: 2021年09月

    記述言語:日本語   会議種別:口頭発表(一般)  

    国名:日本国  

全件表示 >>

受賞

  • 山下記念研究賞

    2022年   情報処理学会   音声認識のデータ拡張のための合成音声の周波数スペクトログラム強調

     詳細を見る

    受賞区分:国内学会・会議・シンポジウム等の賞  受賞国:日本国

  • 学生論文賞

    2018年12月   情報処理学会   End-to-End 音声合成を用いた単語 単位 End-to-End 音声認識のデータ拡張

    上乃聖, 三村正人, 坂井信輔, 河原達也

     詳細を見る

    受賞区分:国内学会・会議・シンポジウム等の賞  受賞国:日本国

  • 学生優秀賞受賞

    2018年09月   日本音響学会   文字単位のモデルを併用した単語単 位の End-to-End 音声認識

    上乃聖, 稲熊寛文, 三村正人, 河原達也

     詳細を見る

    受賞区分:国内学会・会議・シンポジウム等の賞  受賞国:日本国

  • 学生ポスター賞

    2018年08月   電子情報通信学会   転移学習による注意機構付き単語単位音声認識の適応

    上乃聖, 森谷崇史, 三村正人, 坂井信輔, 篠原雄介, 山口義和, 青野裕司, 河原 達也

     詳細を見る

    受賞区分:国内学会・会議・シンポジウム等の賞  受賞国:日本国

 

学術貢献活動

  • IEICE Transactions on Information and Systems Review 国際学術貢献

    役割:査読

    IEICE Transactions on Information and Systems  2022年11月 - 2022年12月

     詳細を見る

    種別:査読等