研究者詳細 - 上乃　聖

論文 - 上乃　聖

分割表示 64 件中 21 - 40 件目／全件表示 >>

CGアバター対話における音声からの頭部動作および表情の自動生成

藤岡侑貴, 上乃聖, 李晃伸

人工知能学会全国大会 2023年06月

記述言語：日本語掲載種別：研究論文（研究会，シンポジウム資料等）

Continuous Integrate-and-Fire を用いた音声区間検出とターン終了検知のマルチタスク学習

池口弘尚, 東佑樹, 上乃聖，李晃伸

日本音響学会講演論文集 2023年03月

記述言語：日本語掲載種別：研究論文（研究会，シンポジウム資料等）

複数設定のスペクトログラムを用いた音声合成に基づく音声認識のデータ拡張

上乃聖, 李晃伸

日本音響学会講演論文集 2023年03月

担当区分：筆頭著者記述言語：日本語掲載種別：研究論文（研究会，シンポジウム資料等）

連続的な感情表出を用いたカウンセリング対話エージェントの評価

川又朱莉, 上乃聖, 李晃伸

HAIシンポジウム 2023年03月

記述言語：日本語掲載種別：研究論文（研究会，シンポジウム資料等）

多様な笑い声生成のための有声音・無声音間隔の制御

木全亮太朗, 上乃聖, 李晃伸

情報処理学会全国大会講演論文集 2023年03月

記述言語：日本語掲載種別：研究論文（研究会，シンポジウム資料等）

Non-autoregressive Error Correction for CTC-based ASR with Phone-conditioned Masked LM 査読あり

Hayato Futami, Hirofumi Inaguma, Sei Ueno, Masato Mimura, Shinsuke Sakai, Tatsuya Kawahara

INTERSPEECH 3889 - 3893 2022年09月

記述言語：英語掲載種別：研究論文（国際会議プロシーディングス）

音声認識のデータ拡張のための話者情報およびマスクを用いた合成音声の周波数スペクトログラム強調

上乃聖，李晃伸，河原達也

日本音響学会講演論文集 1149 - 1150 2022年09月

担当区分：筆頭著者,　責任著者記述言語：日本語掲載種別：研究論文（その他学術会議資料等）

Phone-informed refinement of synthesized mel spectrogram for data augmentation in speech recognition 査読あり

Sei Ueno and Tatsuya Kawahara

International Conference on Acoustics, Speech, and Signal Processing (ICASSP) 8572 - 8576 2022年05月

担当区分：筆頭著者,　責任著者記述言語：英語掲載種別：研究論文（国際会議プロシーディングス）

Data Augmentation Approaches for Automatic Speech Recognition Using Text-to-Speech

Sei Ueno

2022年03月

担当区分：筆頭著者,　責任著者記述言語：英語掲載種別：学位論文（博士）

DOI： https://doi.org/10.14989/doctor.k24027

音声認識のデータ拡張のための音素情報を用いた合成音声の強調

上乃聖，河原達也

日本音響学会講演論文集 887 - 888 2022年03月

担当区分：筆頭著者,　責任著者記述言語：日本語掲載種別：研究論文（その他学術会議資料等）

Data Augmentation for ASR Using TTS Via a Discrete Representation 査読あり

Sei Ueno, Masato Mimura, Shinsuke Sakai, and Tatsuya Kawahara

IEEE Automatic Speech Recognition and Understanding Workshop (ASRU) 68 - 74 2021年12月

担当区分：筆頭著者,　責任著者記述言語：英語掲載種別：研究論文（国際会議プロシーディングス）

音声認識のデータ拡張のための合成音声の周波数スペクトログラム強調

上乃聖，河原達也

研究報告音声言語情報処理（SLP） 2021-SLP-139 ( 28 ) 1 - 6 2021年11月

担当区分：筆頭著者,　責任著者記述言語：日本語掲載種別：研究論文（研究会，シンポジウム資料等）

Synthesizing Waveform Sequence-to-sequence to Augment Training Data for Sequence-to-sequence Speech Recognition 査読あり

Sei Ueno, Masato Mimura, Shinsuke Sakai, and Tatsuya Kawahara

Acoustical Science and Technology 42 ( 6 ) 333 - 343 2021年11月

担当区分：筆頭著者,　責任著者記述言語：英語掲載種別：研究論文（学術雑誌）

DOI： https://doi.org/10.1250/ast.42.333

その他リンク： https://www.jstage.jst.go.jp/article/ast/42/6/42_E2108/_article

wav2vec 2.0を用いた音声合成による音声認識のデータ拡張

上乃聖，河原達也

日本音響学会講演論文集 857 - 858 2021年09月

担当区分：筆頭著者,　責任著者記述言語：日本語掲載種別：研究論文（その他学術会議資料等）

vq-wav2vecによる離散IDを扱う音声認識のデータ拡張

上乃聖，三村正人，河原達也

日本音響学会講演論文集 825 - 826 2021年03月

担当区分：筆頭著者,　責任著者記述言語：日本語掲載種別：研究論文（その他学術会議資料等）

複数話者を対象とした非自己回帰型ニューラル音声合成

上乃聖，三村正人，河原達也

日本音響学会講演論文集 825 - 826 2021年03月

担当区分：筆頭著者,　責任著者記述言語：日本語掲載種別：研究論文（その他学術会議資料等）

ELECTRAによる音声認識仮説のリスコアリング

二見颯，稲熊寛文，上乃聖，三村正人，坂井信輔，河原達也

日本音響学会講演論文集 827 - 828 2021年03月

記述言語：日本語掲載種別：研究論文（その他学術会議資料等）

BERTによるSequence-to-Sequence音声認識への知識蒸留

二見颯，稲熊寛文，上乃聖，三村正人，坂井信輔，河原達也

研究報告音声言語情報処理（SLP） 2020-SLP-134 ( 2 ) 1 - 6 2020年11月

記述言語：日本語掲載種別：研究論文（研究会，シンポジウム資料等）

Endto-End Speech-to-Dialog-Act Recognition 査読あり

Viet-Trung Dang, Tianyu Zhao, Sei Ueno, Hirofumi Inaguma, Tatsuya Kawahara

INTERSPEECH 3910 - 3914 2020年10月

記述言語：英語掲載種別：研究論文（国際会議プロシーディングス）

DOI： https://doi.org/10.21437/Interspeech.2020-1062

End-to-End Speech Emotion Recognition Combined with Acoustic-to-Word ASR Model 査読あり

Han Feng, Sei Ueno, Tatsuya Kawahara

INTERSPEECH 501 - 505 2020年10月

記述言語：英語掲載種別：研究論文（国際会議プロシーディングス）

DOI： https://doi.org/10.21437/Interspeech.2020-1180

前のページ - 次のページ

このページの先頭へ▲

<上乃 聖>

論文 - 上乃 聖

<上乃　聖>

論文 - 上乃　聖