李 晃伸 (リ アキノブ)

LEE Akinobu

写真a

所属学科・専攻等

情報工学教育類 メディア情報分野
情報工学専攻 メディア情報分野

職名

教授

メールアドレス

メールアドレス

ホームページ

http://www.slp.nitech.ac.jp/

研究分野・キーワード

音声言語処理 音声認識 音声対話 音声言語処理 音声インタラクション

出身大学

  •  
    -
    1996年03月

    京都大学   工学部   情報工学科   卒業

出身大学院

  •  
    -
    2000年09月

    京都大学  情報学研究科  知能情報学専攻博士課程  修了

  •  
    -
    1998年03月

    京都大学  工学研究科  情報工学専攻修士課程  修了

取得学位

  • 京都大学 -  博士(情報学)

学外略歴

  • 2005年04月
    -
    2016年03月

      名古屋工業大学   大学院工学研究科   准教授

  • 2000年10月
    -
    2005年03月

      奈良先端科学技術大学院大学   助手

専門分野(科研費分類)

  • 知能情報学

  • 知覚情報処理

  • マルチメディア・データベース

 

研究経歴

  • 音声認識、音声言語理解、音声対話、探索アルゴリズム

    国際共同研究  

    研究期間:  2000年10月  -  現在

学位論文

  • Large Vocabulary Continuous Speech Recognition using Multi-Pass Search Algorithm

    Akinobu Lee

      2000年09月(年月日)  [査読有り]

    学位論文(博士)   単著

論文

  • 話しやすい音声対話システム実現のための対人対話における心理特性の関連性調査

    佐藤 翔平,李 晃伸

    言語・音声理解と対話処理研究会 ( 人工知能学会 )  ( 78 ) 129 - 134   2016年10月

    研究論文(研究会,シンポジウム資料等)   共著

  • 音声対話システムにおける環境および知識の共有表出と話しかけやすさの関連調査

    興梠 斗吾,李 晃伸

    言語・音声理解と対話処理研究会   ( 78 ) 125 - 128   2016年10月

    研究論文(研究会,シンポジウム資料等)   共著

  • ユーザフレンドリィな音声対話システム実現のためのユーザ話速および発話内容に基づくシステム話速制御手法の検討

    三原 寛哉, 李 晃伸

    研究報告音声言語情報処理(SLP) ( 情報処理学会 )  2016-SLP-112 ( 15 ) 1 - 6   2016年07月

    研究論文(研究会,シンポジウム資料等)   共著

  • 音声対話システムのオープンコンテンツ化実現のためのモジュール仕様および管理手法

    山西 元樹,船谷内 泰斗,李 晃伸

    研究報告音声言語情報処理(SLP) ( 情報処理学会 )  2016-SLP-112 ( 14 ) 1 - 6   2016年07月

    研究論文(研究会,シンポジウム資料等)   共著

  • 音声対話システムにおけるシステムからの話しかけと他者性認知の関連性の調査

    村上拓也, 李 晃伸, 西川 由里, 小島 良広, 遠藤 充

    HAIシンポジウム2015     238 - 243   2015年12月

    研究論文(研究会,シンポジウム資料等)   共著

  • 音声対話インタフェースにおけるマルチタスク性の適切な表出方法の検討

    小中 彩貴, 李 晃伸

    HAIシンポジウム2015     108 - 112   2015年12月

    研究論文(研究会,シンポジウム資料等)   共著

  • 音声対話システムにおける音環境への反応表出によるアフォーダンスの評価

    夏目 龍司, 李 晃伸

    HAIシンポジウム2015     94 - 98   2015年12月

    研究論文(研究会,シンポジウム資料等)   共著

  • Prosodically-Enhanced Recurrent Neural Network Language Models

    Siva Reddy Gangireddy, Steve Renals, Yoshihiko Nankaku, Akinobu Lee

    Proc. Conference of the International Speech Communiation Association (INTERSPEECH)     2390 - 2394   2015年09月  [査読有り]

    研究論文(国際会議プロシーディングス)   共著

  • 利用者による履歴付き対話の共同構築・拡張が可能なユーザ生成音声対話システム

    宮木 京介, 飯塚 遼, 李 晃伸

    日本音響学会2015年秋季研究発表会講演論文集     3-Q-22   2015年09月

    研究論文(研究会,シンポジウム資料等)   共著

  • 単語間非共有ノードに基づく単語信頼度を用いたキーワードの発話中遂次確定

    松尾 涼平, 小林 大晃, 李 晃伸

    日本音響学会2015年秋季研究発表会講演論文集     3-Q-12   2015年09月

    研究論文(研究会,シンポジウム資料等)   共著

全件表示 >>

著書

  • IT Text 音声認識システム 改訂2版

    河原達也 編著 (担当: 分担執筆 )

    オーム社  2016年09月 ISBN: 978-4-274-21936-8

  • 音響キーワードブック

    日本音響学会 (担当: 分担執筆 )

    コロナ社  2016年03月 ISBN: 433900880X

  • Chapter 7.2-2 Common platform of Japanese LVCSR assessment in "Resources and Standards of Spoken Language Systems - Advances in Oriental Spoken Language Processing"

    - (担当: 共著 )

    World Scientific Publishing Co.  2010年04月

総説・解説記事

  • キャンパスの公共空間におけるユーザ参加型双方向音声案内デジタルサイネージシステム

    大浦圭一郎, 山本大介, 内匠逸, 李晃伸, 徳田恵一

    人工知能学会誌 ( 人工知能学会 )  28 ( 1 ) 60 - 67   2013年01月

    総説・解説(国際会議プロシーディングズ)   共著

  • 10年間の長期運用を支えた音声情報案内システム「たけまるくん」の技術

    西村竜一, 原直, 川波弘道, 李晃伸, 鹿野清宏

    人工知能学会誌 ( 人工知能学会 )  28 ( 1 ) 52 - 59   2013年01月

    総説・解説(国際会議プロシーディングズ)   共著

  • 音声認識のデコーダと認識エンジン

    李晃伸

    日本音響学会誌 ( 日本音響学会 )  66 ( 1 ) 28 - 31   2009年12月

    総説・解説(国際会議プロシーディングズ)   単著

  • Juliusを用いた音声認識インタフェースの作成

    李晃伸, 河原達也

    ヒューマンインタフェース学会誌 ( ヒューマンインタフェース学会 )  11 ( 1 ) 31 - 38   2009年02月

    総説・解説(国際会議プロシーディングズ)   共著

  • 大語彙連続音声認識エンジンJulius

    李晃伸

    電子情報通信学会情報・システムソサイエティ誌 ( 電子情報通信学会 )  13 ( 4 )   2009年02月

    総説・解説(国際会議プロシーディングズ)   単著

研究発表

  • Spoken keyword detection using recurrent neural network language model

    Shuhei Koike, Akinobu Lee

    5th Joint Meeting Acoustical Society of America and Acoustical Society of Japan  (Honolulu, Hawaii)  2016年11月  -  2016年12月  Acoustical Society of America and Acoustical Society of Japan

  • 自然言語理解を用いた車載音声インタフェースの評価に用いるプロトタイピングシステムの開発

    李 晃伸, 神沼 充伸, Christoph Neumann

    自動車技術会2016年秋季大会  (札幌コンベンションセンター)  2016年10月  -  2016年10月  公益社団法人自動車技術会

  • 身近になってきた機械との対話、その要素技術と今後の発展:音声認識・対話

    李 晃伸  [招待有り]

    第1回産学官連携塾  (国立情報学研究所)  2016年07月  -  2016年07月  国立情報学研究所

  • 音声応用(対話・検索)は今後こうなる

    李晃伸

    音声言語情報処理研究会 SIG-SLP 第100回シンポジウム  (伊豆長岡温泉ホテルサンバレー富士見)  2014年01月  -  2014年02月  情報処理学会

  • 音声インタラクションシステム構築ツールキットMMDAgent

    李晃伸

    第67回人工知能セミナー「対話する人工知能2~音声対話システムのこれまでとこれから~」  (東京工業大学キャンパス・イノベーションセンター)  2013年12月  -  2013年12月  人工知能学会

  • 音声インタラクションシステム構築のためのオープンソースツールキットMMDAgent

    李晃伸

    電気関係学会東海支部連合大会, シンポジウム  (静岡大学浜松キャンパス)  2013年09月  -  2013年09月  電子情報通信学会

  • (招待講演)ユーザ参加型双方向音声案内デジタルサイネージシステムの開発・設置・運用事例

    徳田恵一, 大浦圭一郎, 李晃伸, 山本大介, 打矢隆弘, 内匠逸

    日本音響学会2013年春季研究発表会  (東京工科大学八王子キャンパス)  2013年03月  -  2013年03月  日本音響学会

  • スマートフォン単体で動作する音声対話3Dエージェント「スマートメイちゃん」の開発

    山本大介, 大浦圭一郎, 西村良太, 打矢隆弘, 内匠逸, 李晃伸, 徳田恵一

    インタラクション2013  (日本科学未来館)  2013年03月  -  2013年03月  情報処理学会

  • パネルディスカッション「音声対話システムのさらなる普及には何が必要か」

    李晃伸

    第3回対話システムシンポジウム  (静岡県熱海市)  2013年02月  -  2013年02月  情報処理学会・人工知能学会

  • 登録キーワードと汎用言語モデルを用いた音声認識部・応答選択部の密統合に基づく統計的音声対話システム

    平野隆司, 加藤杏樹, 南角吉彦, 李晃伸, 徳田恵一

    音声言語情報処理研究会(SIG-SLP)  (山形県天童市)  2012年07月  -  2012年07月  情報処理学会

全件表示 >>

作品

  • 音声インタラクション構築ツールキット MMDAgent Ver.1.7.0

    コンピュータソフト  2016年12月  -  2016年12月

    (以下は予定)
    1.7での主な変更点
    ・iOS対応(音声対話コンテンツファイル.mmda対応)
    ・文字表示プラグインの追加
    ・スマートフォン用の汎用メニュー機能
    ・アプリ内でファイル閲覧できるファイルブラウザ
    ・テキストによるプロンプトダイアログ機能
    ・多くのバグ修正とスマートフォン対応

  • 音声認識エンジン Julius-4.4

    コンピュータソフト  2016年10月  -  2016年10月

    ◆Julius-4.4 リリース

    Julius バージョン4.4は、DNNの計算を内蔵し、単体でのDNN-HMMによる音声認識をサポートしました。
    SIMD命令を用いた高速化により、新しめの十分なスペックのマシンであれば
    Julius単体でDNN-HMMを用いた実時間のリアルタイム音声認識が行なえます。

    その他、周辺ツールの拡充、最新のWindows/Mac/Linux/cygwin環境への対応、
    各OSでのビルド手順の文書化、バグ修正など、多くの改善と機能拡張が行われました。

    最新版は 4.4.2 です。以下から入手可能です。どうぞご活用下さい。
    (本バージョンより実行バイナリは Windows のみ配布しています。
     各環境でソースからビルドする手順は簡単です。アーカイブ内の INSTALL.txt をご覧ください)

       http://julius.osdn.jp/

    なお最新版はGitHubの開発サイト https://github.com/julius-speech/julius で常に公開しています。

  • 日本語大語彙ディクテーションキット 4.4

    コンピュータソフト  2016年10月  -  2016年10月

    ◆ディクテーションキット 4.4 リリース

    ディクテーションキットも2年半ぶりに更新されました。
    音響モデルを更新し,性能が大幅に向上しました.
    GMM版、DNN版(従来通りの numpy 利用版)に加え、Julius 単体で動作する
    DNN単体版の起動スクリプトも入っています。
    これまでと同様、ダウンロードしてすぐに試すことができます。
    動作環境は Windows / Mac / Linux です。

    ※ディクテーションキット 4.4 の特徴:
     - Julius-4.4.2 ベース
      - SIMD CPU命令による高速DNN計算(Intel AVX/FMA 命令等に対応)
     - 音響モデルの更新
      - JNASと『日本語話し言葉コーパス』模擬講演データによるDNN-HMM音響モデル
      - DNN-HMMは単語内位置依存モデル化
     - 対応OSは64bitのみ(32bit OS はこのバージョンからサポート外)
     - プロセスサイズは 700MB 程度.メモリの少ないマシンでは注意.
     - ベンチマーク(JNASテストセット200文における文字正解精度)
      - 90.8% (GMM-HMM音響モデルの場合)
      - 94.7% (DNN-HMM音響モデルの場合) ← 4.3.1 の 91.7% から大きく改善

    ダウンロード:
     Webページ(日本語) http://julius.osdn.jp/index.php?q=dictation-kit.html よりダウンロードできます。

  • MMDAgent SHARE

    Webサービス  2016年09月  -  現在

    ****************************************************************
      「MMDAgent SHARE」(音声対話コンテンツ共有サービス)
      2016年9月1日(木)β公開
      http://share.udialogue.org/
    ****************************************************************

    本サービスは、音声インタラクションシステム構築ツールキット
    MMDAgentで動作可能な音声対話コンテンツを共有するためのサービスで
    す。どなたでも無料で音声対話コンテンツの投稿と利用が可能です。


    【音声対話コンテンツ】

    ここで言う音声対話コンテンツとは、コンピュータ上のキャラクタエー
    ジェントと音声で「おしゃべり」するために必要な全ての素材(対話シ
    ナリオ、3DCGのモデル、画像、音声など)を1つにまとめたコンテンツ
    (ファイル)です。MMDAという独自の拡張子を持ち、MMDAgent 1.6.1を
    インストールすると誰でもダブルクリックするだけで利用することが可
    能になります。CREST uDialogue Projectにおける学術的研究の一つと
    して研究・開発されています


    【MMDAgent】

    MMDAgentとは、主に国立大学法人名古屋工業大学で開発された、音声対
    話コンテンツを利用(再生)するためのオープンソフトウェアです。
    3DCG、音声合成、音声認識、対話制御などの機能を 持ち、簡単なスク
    リプトを記述するだけで、高度な音声インタラクションシステムを構築
    することが可能です。Windows, Linux, Mac OSX, Android等での動作が
    可能です。


    【ログイン&使い方】

    本サービスは利用規約に同意することで、だれでも無料で利用すること
    が可能です。音声対話コンテンツを利用するためには、あらかじめ、
    MMDAgent 1.6.1がインスト―ルされていることが必要です。Googleの外
    部認証を利用してログイン可能です。


    【利用規約】

    本サービスが適用する、利用規約やプライバシーポリシーについては以
    下を参照ください→http://share.udialogue.org/meissen/terms.html


    本サービスはβシステムとして公開しています。ご意見はこちらまで
    →mmdagent.share@gmail.com

  • 音声インタラクション構築ツールキット MMDAgent Ver.1.6.1

    コンピュータソフト  2016年08月  -  2016年08月

    Version 1.6.1:
    * support dialogue contents package (.mmda).
    * add plugin to open directory of dialogue contents package by SHIFT+O key.
    * fix some bugs.

  • ユーザ生成型音声対話コンテンツサーバー

    Webサービス  2016年01月  -  2016年03月

  • 音声インタラクション構築ツールキット MMDAgent Ver.1.6

    コンピュータソフト  2015年12月  -  2015年12月

  • Julius on GitHub

    Webサービス  2015年09月  -  現在

  • 音声インタラクション構築ツールキット MMDAgent マニュアル

    2015年03月  -  2015年03月

    音声対話システム構築ツールキットMMDAgentの暫定版マニュアルを公開致します。現状では、日本語のみです。

    この資料は、2015年2月に行われた人工知能学会主催 第7回AIツール入門講座(音声インタラクションシステム構築ツールキットMMDAgent、講師:山本大介、西村良太)の配布資料用に作成されたものを一部改編したものです。内容の一部は、http://mmdagent.wordpress.com/から転載しています。

  • 音声インタラクション構築ツールキット MMDAgent Ver.1.5

    コンピュータソフト  2014年12月  -  2014年12月

    Version 1.5:
    * add new fixed view of Julius log bar, can be toggled by SHIFT+J key.
    * support variables in FST files.
    * upgrade the speed of the shadow mapping.
    * modify the codes for the latest gcc of carbon 32bit in Mac OS X.
    * modify the codes for Visual Studio 2013.
    * fix some bugs.
    * update libraries (hts_engine API 1.09 and Open JTalk 1.08).

全件表示 >>

その他研究活動

  • オープンソース音声インタラクション構築ツールキットMMDAgentの開発と公開

    2011年12月  -  現在

  • オープンソース音声認識エンジンJuliusの開発および公開

    2005年04月  -  現在

学術関係受賞

  • 情報処理学会 山下記念研究賞

    2007年04月   -  

    受賞者:  -

  • 電気通信普及財団 第24回テレコムシステム技術賞

    2006年05月   電気通信普及財団  

    受賞者:  H.Saruwatari,T.Kawamura,T.Nshikawa,A.Lee,K.Shikano

  • 日本音響学会 粟屋潔学術奨励賞

    2002年04月   -  

    受賞者:  -

科研費(文科省・学振)獲得実績

  • 「しゃべって」つくる音声インタラクションシステム

    挑戦的萌芽研究

    研究期間:  2014年  -  2016年  代表者:  徳田 恵一

  • 超巨大データに基づくユニバーサル音声モデル構築のための技術的・社会的基盤の確立

    基盤研究(B)

    研究期間:  2013年  -  2015年  代表者:  徳田 恵一

  • 多層モデルの階層間密統合に基づく音声理解フレームワークの研究

    基盤研究(B)

    研究期間:  2009年  -  2013年  代表者:  李 晃伸

  • スイッチフリーな実環境音声言語インタフェースの研究

    若手研究(B)

    研究期間:  2006年  -  2008年  代表者:  李 晃伸

  • 環境、話者、タスクへの適応性をもつユーザにやさしい音声認識アルゴリズムの研究

    基盤研究(B)

    研究期間:  2003年  -  2006年 

全件表示 >>

その他競争的資金獲得実績

  • コンテンツ生成の循環系を軸とした次世代音声技術基盤の確立

    提供機関:  科学技術振興機構  戦略的創造研究推進事業

    研究期間:  2011年04月  -  2017年03月  代表者:  徳田 恵一

  • 講演音声翻訳のための多言語音声合成技術に関する研究開発

    提供機関:  総務省  戦略的情報通信研究開発推進制度

    研究期間:  2009年  -  2011年 

  • Effective Multilingual Interaction in Mobile Environments

    提供機関:  European Commission  European Commission

    研究期間:  2008年  -  2011年 

  • ユーザ負担のない話者・環境適応性を実現する自然な音声対話処理

    提供機関:  文部科学省  e-Society 基盤ソフトウェアの総合開発

    研究期間:  2003年  -  2007年 

 
 

学会・委員会等活動

  • 2016年04月
    -
    現在

    情報処理学会   音声言語情報処理研究会運営委員

  • 2015年09月
     
     

    日本音響学会   秋季研究発表会座長

  • 2015年
     
     

    人工知能学会   論文誌論文特集「知的対話システム」編集委員

  • 2014年04月
    -
    2016年03月

    情報処理学会   音声言語情報処理研究会運営幹事

  • 2011年04月
    -
    2014年03月

    情報処理学会   全国大会プログラム編成委員、座長

  • 2010年04月
    -
    2012年03月

    情報処理学会   音声言語情報処理研究会運営委員