Works(作品等) - 李 晃伸
-
Julius on GitHub
Akinobu Lee
2015年09月 - 現在
作品分類:Web Service 発表場所:http://github.com/julius-speech/julius
-
音声インタラクション構築ツールキット MMDAgent マニュアル
山本大介、西村良太、李晃伸
2015年03月
発表場所:http://www.udialogue.org/ja/download-ja.html
音声対話システム構築ツールキットMMDAgentの暫定版マニュアルを公開致します。現状では、日本語のみです。
この資料は、2015年2月に行われた人工知能学会主催 第7回AIツール入門講座(音声インタラクションシステム構築ツールキットMMDAgent、講師:山本大介、西村良太)の配布資料用に作成されたものを一部改編したものです。内容の一部は、http://mmdagent.wordpress.com/から転載しています。 -
音声インタラクション構築ツールキット MMDAgent Ver.1.5
徳田恵一, 李晃伸, 大浦圭一郎
2014年12月
作品分類:ソフトウェア 発表場所:http://www.mmdagent.jp/
Version 1.5:
* add new fixed view of Julius log bar, can be toggled by SHIFT+J key.
* support variables in FST files.
* upgrade the speed of the shadow mapping.
* modify the codes for the latest gcc of carbon 32bit in Mac OS X.
* modify the codes for Visual Studio 2013.
* fix some bugs.
* update libraries (hts_engine API 1.09 and Open JTalk 1.08). -
DNN版Juliusディクテーション実行キット 修正版
李晃伸、河原達也
2014年04月
作品分類:ソフトウェア 発表場所:http://julius.sourceforge.jp/
-
DNN版Juliusディクテーション実行キット v4.3.1
李晃伸、河原達也
2014年01月
作品分類:ソフトウェア 発表場所:http://julius.sourceforge.jp/
ここ数年で主流となったDNN (Deep Neural Network) に基づく音響モデルを用いた音声認識を動かすツールキットを開発・公開した。また、音響モデル・言語モデルを約10年ぶりに入替えた。音響モデルは従来のGMM版に加えてDNN版を用意、旧キットと比較して、GMM版・DNN版とも認識精度の大幅な改善を実現。言語モデルは国立国語研究所のBCCWJを用いて汎用的なモデルを構築。
-
音声インタラクション構築ツールキット MMDAgent Ver.1.4
徳田恵一, 李晃伸, 大浦圭一郎
2013年12月
作品分類:ソフトウェア 発表場所:http://www.mmdagent.jp/
MMDAgent は音声と3DCGを組み合わせた高度なマンマシンインタラクションシステムを構築することのできるツールキットである。2013年度は対話記述言語の拡張や性能改善、Android OSへの移植を行い、12月25日にバージョン1.4を公開した。
-
大語彙連続音声認識エンジン Julius 4.3, 4.3.1
李晃伸
2013年12月
作品分類:ソフトウェア 発表場所:http://julius.sourceforge.jp/
バージョン 4.3 では、DNN-HMM (Deep Neural-Network HMM) を用いたオンラインデコーディングのための機能が追加されました。 具体的には、状態出力確率ベクトル"outprob vector" を入力としたデコーディング、ネットワーク経由の特徴量ベクトル(および状態出力確率ベクトル)入力のサポート、リアルタイムのための CVN (cepstral variance normalization), フィルタバンクベースの特徴量(FBANK/MELSPEC)のサポートです。また、ツール adintool に特徴量を抽出してネットワークへリアルタイム送信する機能が追加されました。
新オプション:
[-input vecnet] ネットワークから特徴量/出力確率ベクトルを読み込む
[-input outprob] HTKパラメータファイルを出力確率ベクトルとして読み込む
[-outprobout [file]] 計算された出力確率行列をHTK形式ファイルに保存(debug)
4.3.1 はバグ修正のためのリリースです(20140115公開)。 -
大語彙連続音声認識エンジン Julius 4.2.3
李晃伸
2013年06月
作品分類:ソフトウェア 発表場所:http://julius.sourceforge.jp/
バージョン 4.2.3 で追加された新機能は、辞書の再読み込み、入力音声波形の
スケーリング、長時間入力の棄却、ベイズリスク最小化探索(南條浩輝氏,古
谷遼氏より提供)、およびバイナリN-gramの文字コード変換機能です。またい
くつかの不具合が修正されました。
新オプション:
-lvscale
-rejectlong
-mbr, -nombr, -mbr_wwer, -mbr_weight -
音声インタラクション構築ツールキット MMDAgent Ver.1.3.1
徳田恵一, 李晃伸, 大浦圭一郎
2012年12月
作品分類:ソフトウェア 発表場所:http://www.mmdagent.jp/
MMDAgent は音声と3DCGを組み合わせた高度なマンマシンインタラクションシステムを構築することのできるツールキットである。2012年度はバグフィックや基本性能に関わる機能拡張を行い、8月1日にバージョン1.3を、12月25日にバージョン1.3.1を公開した。
-
大語彙連続音声認識エンジン Julius 4.2.2
李晃伸
2012年08月
作品分類:ソフトウェア 発表場所:http://julius.sourceforge.jp/
2012/08/01 Julius-4.2.2 リリース
バグ修正、文法コンパイラの修正