高品質AI音声合成エンジン「AITalk」を開発・提供する株式会社エーアイは、AI音声合成と音声認識を一体化したSDK「組み込み型音声対話フレームワーク SLFramework(仮)」の評価版提供を2025年1月より開始すると発表しました。また、同評価版の試用を希望するユーザーの募集も開始しました。
エーアイ / AI音声合成/音声認識を1つのSDKで実現 SLFramework(仮)評価版提供開始のお知らせ
SLFrameworkの概要
SLFrameworkは、音声による入出力を可能にする組み込み型SDKで、音声認識エンジンと音声合成エンジンを1つのSDKに統合しています。ユーザーの発話を認識してテキスト化し、ユーザーへの応答テキストを読み上げる機能を提供します。同社が保有する両技術を活用し、音声認識と音声合成で共通のユーザー単語辞書を実現するなど、高い利便性を備えています。
主な特長
共通ユーザー単語辞書
音声認識と音声合成が共通の単語辞書を使用するため、1度の操作で両方に対応した単語を登録可能。さらに音声合成時のアクセント調整も行えます。
ローカル型SDK
外部ネットワークへのアクセスを必要としないので、高いセキュリティ環境で利用可能。専用のツールで独自の言い回しや専門用語に対応した音声認識モデルをカスタマイズできます。
省リソース設計
使用メモリはRAM:400MB、ROM:210MBと軽量で、Raspberry Pi4でも動作可能。WindowsおよびLinuxに対応しています。
想定利用シーン
対話アプリやロボット、作業指示システム、券売機、ピッキングソリューション、コールセンターなど、多様な場面での活用が見込まれます。
今後の展望
SLFrameworkの製品版は2025年中のリリースを目指しており、今回の評価版提供を通じてユーザーからのフィードバックを収集。製品としての最適化を進めていく計画です。