Skip to content

ailia Speech Release Note

Kazuki Kyakuno edited this page Jan 20, 2026 · 6 revisions
ailia AI Speech Release Note

1.5.2 2026/01/19
・SenseVoiceの精度改善(PreEmphasis)
・WindowsのDLLのバージョンリソースの表記をx64に修正

1.5.1 2026/01/09
・SenseVoiceでバッファオーバランが発生することがある問題を修正
・出力結果の一貫性向上のためSenseVoiceの乱数のシードを固定
・C# APIにSetSilentThresholdを追加
・Androidのシンボルの非公開化
・macOSのビルド環境をmacos14に更新

1.5.0.1 2026/01/02
・C APIとPython APIのドキュメントの誤植を修正
・C APIのサンプルでlarge_v3_turboに対応
・C APIのサンプルで使用するSenseVoiceのモデルをFP32に変更
・ailia SDKを1.6.1に更新
・ailia Tokenizerを1.5.1に更新

1.5.0 2025/12/24
・SenseVoiceSmallに対応
・SileroVAD v5, v6に対応(従来はv4のみ対応)
・ailia Tokenizerを1.5.0に更新
・Python APIにis_fp16フラグを追加
・Python APIのドキュメントの強化

1.4.0 2025/09/18
・話者分離を行う機能を追加(ailiaSpeechOpenDiarizationFile API)
・person_idをspeaker_idに名称変更
・Unity APIにGetStructuredResults APIを追加
・Androidの16KBページサイズ対応
・AndroidのJNI対応
・ailia SDKを1.5.0に更新
・ailia Tokenizerを1.4.1に更新
・Android NDKを24に更新
・LinuxをUbuntu22.04に更新
・WindowsをMSVC2022に更新

1.3.2.3 2025/01/05
・Python APIのWhisper Large V3 Turboでoptモデルを使用するように変更

1.3.2.2 2024/12/02
・WindowsのPython APIにおいてlangを指定した場合にエラーになる問題を修正

1.3.2 2024/11/01
・ailiaOpenPostFileWでFUGUMT_JA_ENを使用した場合にエラーになる問題を修正
・Whisper Large V3 Turbo対応

1.3.1 2024/10/11
・Python APIを追加

1.3.0 2024/07/19
・ailia SDKを1.4.0に更新
・ailia Tokenizer 1.2の仕様変更に起因してailiaSpeechSetPromptの精度が低下する問題を修正
・UnityのUnity Package Manager対応
・UnityのAPIにAiliaSpeechTranslateModelを追加
・UnityのAiliaSpeechModelのTranslate APIをIsProcessingがtrueでも呼び出せるように変更
・UnityのAPIにailiaSpeech名前空間を追加

1.2.0 2024/04/12
・ailia SDKを1.3.0に更新
・PostProcess APIにFUGUMT_JA_ENを追加
・iOSのシミュレータ対応
・iOSのAPIにVisibilityが不足している問題を修正
・仮想メモリモードを使用するサンプルを追加

1.1.0 2024/01/23
・ailia SDKを1.2.16に更新
・Whisper LargeとLarge V3に対応
・モデルを精度を改善したopt3モデルに変更
・タイムスタンプの巻き戻り対策を実装
・PostProcess APIを追加

1.0.0 2023/09/04
・特定のサンプル長の音声ファイルを入力した場合に、
 丸め誤差によってailiaSpeechBufferedがfalseにならない問題を修正
・単一のタイムスタンプの場合も前回の認識結果を次回に持ち越すように修正
・VADを使用した場合や音声末尾の場合にタイムスタンプの連続しないテキストを、
 次回に持ち越さずに早期に確定させるように変更
・Unity Pluginでモデルファイルを動的にダウンロードするように変更
・Unity PluginのサンプルにMediumモデルを追加

0.9.7 2023/07/31
・ailia SDKを1.2.15に更新
・CUDAによるGPU推論に対応
・Jetsonのバイナリを追加
・ailiaSpeechSetConstraint APIの追加(数字認識、単語認識用)
・ailiaSpeechOpenDictionary APIの追加(ユーザ辞書用)
・ailiaSpeechOpenVAD APIの追加(AIによる無音検知対応)
・ドキュメントに各APIの使用方法を追加
・AIモデルをoptモデルからさらに高速化したopt2モデルに変更

0.9.6 2023/06/02
・Unityから下記のAPIを呼び出すサンプルを追加
 ailiaSpeechFinalizeInputData
 ailiaSpeechResetTranscribeState
 ailiaSpeechSetPrompt
・ailiaSpeechTranscribeを連続で呼び出した場合に、
 ailiaSpeechCompleteがtrueの場合でも、
 ailiaSpeechBufferedがtrueになることがある問題を修正

0.9.5 2023/05/09
・Initial Promptを設定する機能を追加
・ailiaTokenizerを外部リンクに変更
・ailiaSpeechFinalizeInputData APIの追加
・ailiaSpeechResetTranscribeState APIの追加
・通常モードでループ検知を実装
・Liveモードでカーソルを非表示に変更
・Liveモードで再変換を無効化
・Textにconfidenceを追加

0.9.4 2023/03/14
・ライブ変換機能の追加

0.9.3 2023/03/02
・Android、Linuxに対応
・無音判定に対応
・メモリ再利用モード対応による高速化
・autoの場合は常に言語判定を実施
・翻訳機能の追加
・推論中に割り込みで中断する機能を追加
・トークンが448よりも長くなるとオーバフローする問題を修正
・ailia SDK 1.2.14 (production) に更新

0.9.2 2023/01/20
・モデルをoptモデルに変更
・省メモリモード対応
・WindowsとmacOSとiOS向け

0.9.1 2023/01/17
・ailiaとailia.speechをアップデート
・CALLBACKの誤植修正
・例外処理強化
・Unityのドキュメント追加

0.9.0 2023/01/05
・ファーストリリース

Clone this wiki locally