Works(作品等) - 李 晃伸
-
2024年09月 - 現在
作品分類:ソフトウェア 発表場所:https://github.com/avatar-ss-cgca/valles
-
東中 竜一郎, 光田 航, 千葉 祐弥, 李 晃伸
2024年06月 - 現在
作品分類:ソフトウェア 発表場所:https://github.com/remdis/remdis
-
李 晃伸
2023年12月 - 現在
作品分類:ソフトウェア 発表場所:https://mmdagent-ex.dev/ja/
-
李 晃伸
2020年09月 - 現在
作品分類:ソフトウェア 発表場所:http://julius.osdn.jp/
Julius のバージョン 4.6 を公開しました。4.6 ではDNN-HMM 計算部の GPU 対応 (CUDA) を行い、 デコーディングが3倍ほど速くなりました。そのほか、1パス文法認識への対応やバグ修正、アップデートが含まれています。 主な変更点は以下のとおりです。
・DNN-HMM 計算での CUDA サポート (Linux + CUDA-8,9,10 でのみ動作確認)
・1パス文法認識の実装
・Visual Studio 2017 でのビルド全面対応 (msvc/Julius.sln)
・修正BSDライセンスへ移行
・不具合の修正 -
2019年06月 - 2023年12月
作品分類:ソフトウェア 発表場所:第33回人工知能学会全国大会およびWeb / https://mmdagent.lee-lab.org/
MMDAgent-EX は音声インタラクション構築ツールキット [MMDAgent](http://mmdagent.jp/) をスマートフォンに向けて拡張したアプリケーションです。キャラクターエージェントとのお喋りややりとりの内容を定義したスクリプトファイル、3-Dモデル、動作ファイルを自在に組み合わせて、エージェントと音声で会話するシステムを、誰でも構築しスマートフォンへ配信することができます。iOS、Android 用アプリのほか、各種デスクトップOS (Win/Mac/Linux) でも動作するマルチプラットフォームアプリケーションです。
-
音声対話インタラクション基盤アプリ MMDAgent-EX の公開
2019年06月 - 現在
MMDAgent-EX は音声インタラクション構築ツールキット [MMDAgent](http://mmdagent.jp/) をスマートフォンに向けて拡張したアプリケーションです。キャラクターエージェントとのお喋りややりとりの内容を定義したスクリプトファイル、3-Dモデル、動作ファイルを自在に組み合わせて、エージェントと音声で会話するシステムを、誰でも構築しスマートフォンへ配信することができます。iOS、Android 用アプリのほか、各種デスクトップOS (Win/Mac/Linux) でも動作するマルチプラットフォームアプリケーションです。
-
2018年09月 - 2023年12月
作品分類:ソフトウェア 発表場所:日本音響学会2018年秋季全国大会 / https://mmdagent.lee-lab.org/
Pocket MMDAgent は MMDAgent のスマートフォン向け拡張版アプリです。Webで公開されている音声対話システムのダウンロード、サーバ側からのコンテンツ自動更新、メニュー・ダイアログ・ボタンなどのUIのサポート、汎的なログ収集・フィードバック機能を有しています。
Pocket MMDAgentは音声対話コンテンツ再生・配信のマルチプラットフォームアプリケーションであり、無償で利用可能です。iOS 用アプリと Android 用アプリがそれぞれベータ版公開されているほか、デスクトップOS版 (Win/Mac/Linux) もあります。 -
音声対話コンテンツ配信プラットフォーム Pocket MMDAgent の公開
2018年09月 - 現在
Pocket MMDAgent は MMDAgent をスマートフォンに向けて拡張した音声対話コンテンツ配信プラットフォームである。Web上で公開されている音声対話コンテンツの直接ダウンロードとサーバ側からのプッシュ更新機能、コンテンツ配信者へのログ収集・フィードバック機能を備えたクラウド音声対話システムのアプリケーションである。
-
2018年01月 - 現在
作品分類:ソフトウェア 発表場所:http://julius.osdn.jp/
◆音声認識パッケージ2種を更新
- 話し言葉モデルキット (ssr-kit)
- 講演音声モデルキット (lsr-kit)
更新内容
- 言語モデルを変更(作成方法を変更,文字コードをShift-JISに変更)
- GUIの音声入力ツール adintool-gui を同梱
- 辞書登録ツール dictool を同梱
- Juliusのバージョン 4.4.2.1a -
秋田 祐也, 李 晃伸, 河原達也
2017年10月 - 現在
作品分類:ソフトウェア 発表場所:http://julius.osdn.jp/
新しい音声認識パッケージとして,話し言葉モデルキットと講演音声モデルキットの2種類を公開しました.
話し言葉モデルキット (ssr-kit)
話し言葉認識を目的としたモデル
JNASと『日本語話し言葉コーパス』模擬講演データによるDNN-HMM音響モデル
『日本語話し言葉コーパス』の模擬講演データと学会データによる言語モデル
講演音声モデルキット (lsr-kit)
大きな部屋等での講演を対象としたモデル
『日本語話し言葉コーパス』の学会データによるDNN-HMM音響モデル
『日本語話し言葉コーパス』の模擬講演データと学会データによる言語モデル -
李 晃伸
2017年09月 - 2017年10月
作品分類:ソフトウェア 発表場所:https://github.com/julius-speech/julius/
深層ニューラルネットワーク(DNN)型HMM のためにSIMD命令およびマルチコア化を果たしたバージョンの Julius を GitHub にて公開した。従来より20%以上の高速化を実現した。
-
音声インタラクション構築ツールキット MMDAgent Ver.1.7.0
2016年12月 - 現在
作品分類:ソフトウェア 発表場所:http://www.mmdagent.jp/
(以下は予定)
1.7での主な変更点
・iOS対応(音声対話コンテンツファイル.mmda対応)
・文字表示プラグインの追加
・スマートフォン用の汎用メニュー機能
・アプリ内でファイル閲覧できるファイルブラウザ
・テキストによるプロンプトダイアログ機能
・多くのバグ修正とスマートフォン対応 -
李 晃伸
2016年10月
作品分類:ソフトウェア 発表場所:http://julius.osdn.jp/
◆Julius-4.4 リリース
Julius バージョン4.4は、DNNの計算を内蔵し、単体でのDNN-HMMによる音声認識をサポートしました。
SIMD命令を用いた高速化により、新しめの十分なスペックのマシンであれば
Julius単体でDNN-HMMを用いた実時間のリアルタイム音声認識が行なえます。
その他、周辺ツールの拡充、最新のWindows/Mac/Linux/cygwin環境への対応、
各OSでのビルド手順の文書化、バグ修正など、多くの改善と機能拡張が行われました。
最新版は 4.4.2 です。以下から入手可能です。どうぞご活用下さい。
(本バージョンより実行バイナリは Windows のみ配布しています。
各環境でソースからビルドする手順は簡単です。アーカイブ内の INSTALL.txt をご覧ください)
http://julius.osdn.jp/
なお最新版はGitHubの開発サイト https://github.com/julius-speech/julius で常に公開しています。 -
秋田 祐也, 李 晃伸, 河原達也
2016年10月
作品分類:ソフトウェア 発表場所:http://julius.osdn.jp/
◆ディクテーションキット 4.4 リリース
ディクテーションキットも2年半ぶりに更新されました。
音響モデルを更新し,性能が大幅に向上しました.
GMM版、DNN版(従来通りの numpy 利用版)に加え、Julius 単体で動作する
DNN単体版の起動スクリプトも入っています。
これまでと同様、ダウンロードしてすぐに試すことができます。
動作環境は Windows / Mac / Linux です。
※ディクテーションキット 4.4 の特徴:
- Julius-4.4.2 ベース
- SIMD CPU命令による高速DNN計算(Intel AVX/FMA 命令等に対応)
- 音響モデルの更新
- JNASと『日本語話し言葉コーパス』模擬講演データによるDNN-HMM音響モデル
- DNN-HMMは単語内位置依存モデル化
- 対応OSは64bitのみ(32bit OS はこのバージョンからサポート外)
- プロセスサイズは 700MB 程度.メモリの少ないマシンでは注意.
- ベンチマーク(JNASテストセット200文における文字正解精度)
- 90.8% (GMM-HMM音響モデルの場合)
- 94.7% (DNN-HMM音響モデルの場合) ← 4.3.1 の 91.7% から大きく改善
ダウンロード:
Webページ(日本語) http://julius.osdn.jp/index.php?q=dictation-kit.html よりダウンロードできます。 -
MMDAgent SHARE
山本 大介, 大浦圭一郎, 徳田恵一, 李 晃伸
2016年09月 - 現在
作品分類:Web Service 発表場所:http://share.udialogue.org/
****************************************************************
「MMDAgent SHARE」(音声対話コンテンツ共有サービス)
2016年9月1日(木)β公開
http://share.udialogue.org/
****************************************************************
本サービスは、音声インタラクションシステム構築ツールキット
MMDAgentで動作可能な音声対話コンテンツを共有するためのサービスで
す。どなたでも無料で音声対話コンテンツの投稿と利用が可能です。
【音声対話コンテンツ】
ここで言う音声対話コンテンツとは、コンピュータ上のキャラクタエー
ジェントと音声で「おしゃべり」するために必要な全ての素材(対話シ
ナリオ、3DCGのモデル、画像、音声など)を1つにまとめたコンテンツ
(ファイル)です。MMDAという独自の拡張子を持ち、MMDAgent 1.6.1を
インストールすると誰でもダブルクリックするだけで利用することが可
能になります。CREST uDialogue Projectにおける学術的研究の一つと
して研究・開発されています
【MMDAgent】
MMDAgentとは、主に国立大学法人名古屋工業大学で開発された、音声対
話コンテンツを利用(再生)するためのオープンソフトウェアです。
3DCG、音声合成、音声認識、対話制御などの機能を 持ち、簡単なスク
リプトを記述するだけで、高度な音声インタラクションシステムを構築
することが可能です。Windows, Linux, Mac OSX, Android等での動作が
可能です。
【ログイン&使い方】
本サービスは利用規約に同意することで、だれでも無料で利用すること
が可能です。音声対話コンテンツを利用するためには、あらかじめ、
MMDAgent 1.6.1がインスト―ルされていることが必要です。Googleの外
部認証を利用してログイン可能です。
【利用規約】
本サービスが適用する、利用規約やプライバシーポリシーについては以
下を参照ください→http://share.udialogue.org/meissen/terms.html
本サービスはβシステムとして公開しています。ご意見はこちらまで
→mmdagent.share@gmail.com -
音声インタラクション構築ツールキット MMDAgent Ver.1.6.1
李 晃伸, 大浦圭一郎, 山本大介, 徳田恵一
2016年08月
作品分類:ソフトウェア 発表場所:http://www.mmdagent.jp/
Version 1.6.1:
* support dialogue contents package (.mmda).
* add plugin to open directory of dialogue contents package by SHIFT+O key.
* fix some bugs. -
Julius on GitHub
Akinobu Lee
2015年09月 - 現在
作品分類:Web Service 発表場所:http://github.com/julius-speech/julius
-
音声インタラクション構築ツールキット MMDAgent マニュアル
山本大介、西村良太、李晃伸
2015年03月
発表場所:http://www.udialogue.org/ja/download-ja.html
音声対話システム構築ツールキットMMDAgentの暫定版マニュアルを公開致します。現状では、日本語のみです。
この資料は、2015年2月に行われた人工知能学会主催 第7回AIツール入門講座(音声インタラクションシステム構築ツールキットMMDAgent、講師:山本大介、西村良太)の配布資料用に作成されたものを一部改編したものです。内容の一部は、http://mmdagent.wordpress.com/から転載しています。 -
音声インタラクション構築ツールキット MMDAgent Ver.1.5
徳田恵一, 李晃伸, 大浦圭一郎
2014年12月
作品分類:ソフトウェア 発表場所:http://www.mmdagent.jp/
Version 1.5:
* add new fixed view of Julius log bar, can be toggled by SHIFT+J key.
* support variables in FST files.
* upgrade the speed of the shadow mapping.
* modify the codes for the latest gcc of carbon 32bit in Mac OS X.
* modify the codes for Visual Studio 2013.
* fix some bugs.
* update libraries (hts_engine API 1.09 and Open JTalk 1.08). -
DNN版Juliusディクテーション実行キット 修正版
李晃伸、河原達也
2014年04月
作品分類:ソフトウェア 発表場所:http://julius.sourceforge.jp/
-
DNN版Juliusディクテーション実行キット v4.3.1
李晃伸、河原達也
2014年01月
作品分類:ソフトウェア 発表場所:http://julius.sourceforge.jp/
ここ数年で主流となったDNN (Deep Neural Network) に基づく音響モデルを用いた音声認識を動かすツールキットを開発・公開した。また、音響モデル・言語モデルを約10年ぶりに入替えた。音響モデルは従来のGMM版に加えてDNN版を用意、旧キットと比較して、GMM版・DNN版とも認識精度の大幅な改善を実現。言語モデルは国立国語研究所のBCCWJを用いて汎用的なモデルを構築。
-
音声インタラクション構築ツールキット MMDAgent Ver.1.4
徳田恵一, 李晃伸, 大浦圭一郎
2013年12月
作品分類:ソフトウェア 発表場所:http://www.mmdagent.jp/
MMDAgent は音声と3DCGを組み合わせた高度なマンマシンインタラクションシステムを構築することのできるツールキットである。2013年度は対話記述言語の拡張や性能改善、Android OSへの移植を行い、12月25日にバージョン1.4を公開した。
-
大語彙連続音声認識エンジン Julius 4.3, 4.3.1
李晃伸
2013年12月
作品分類:ソフトウェア 発表場所:http://julius.sourceforge.jp/
バージョン 4.3 では、DNN-HMM (Deep Neural-Network HMM) を用いたオンラインデコーディングのための機能が追加されました。 具体的には、状態出力確率ベクトル"outprob vector" を入力としたデコーディング、ネットワーク経由の特徴量ベクトル(および状態出力確率ベクトル)入力のサポート、リアルタイムのための CVN (cepstral variance normalization), フィルタバンクベースの特徴量(FBANK/MELSPEC)のサポートです。また、ツール adintool に特徴量を抽出してネットワークへリアルタイム送信する機能が追加されました。
新オプション:
[-input vecnet] ネットワークから特徴量/出力確率ベクトルを読み込む
[-input outprob] HTKパラメータファイルを出力確率ベクトルとして読み込む
[-outprobout [file]] 計算された出力確率行列をHTK形式ファイルに保存(debug)
4.3.1 はバグ修正のためのリリースです(20140115公開)。 -
大語彙連続音声認識エンジン Julius 4.2.3
李晃伸
2013年06月
作品分類:ソフトウェア 発表場所:http://julius.sourceforge.jp/
バージョン 4.2.3 で追加された新機能は、辞書の再読み込み、入力音声波形の
スケーリング、長時間入力の棄却、ベイズリスク最小化探索(南條浩輝氏,古
谷遼氏より提供)、およびバイナリN-gramの文字コード変換機能です。またい
くつかの不具合が修正されました。
新オプション:
-lvscale
-rejectlong
-mbr, -nombr, -mbr_wwer, -mbr_weight -
音声インタラクション構築ツールキット MMDAgent Ver.1.3.1
徳田恵一, 李晃伸, 大浦圭一郎
2012年12月
作品分類:ソフトウェア 発表場所:http://www.mmdagent.jp/
MMDAgent は音声と3DCGを組み合わせた高度なマンマシンインタラクションシステムを構築することのできるツールキットである。2012年度はバグフィックや基本性能に関わる機能拡張を行い、8月1日にバージョン1.3を、12月25日にバージョン1.3.1を公開した。
-
大語彙連続音声認識エンジン Julius 4.2.2
李晃伸
2012年08月
作品分類:ソフトウェア 発表場所:http://julius.sourceforge.jp/
2012/08/01 Julius-4.2.2 リリース
バグ修正、文法コンパイラの修正