今回は、NTTテクノクロス株式会社からのプレスリリースを紹介します。
話者の声を好みの音声や話し方にリアルタイム変換するAI音声変換ソフトウェア「SynoraVoice(シノラボイス)」を2025年9月16日から提供開始するとの発表がありました。
NTTテクノクロス / リアルタイム音声変換ソフトウェア「SynoraVoice」を提供開始
■背景
近年、AI技術の進展により、音声の認識やテキストから音声を合成する音声合成の精度が向上し、音声をベースとしたサービスがさまざまな分野に広がっています。その一方で、話者の声を別の声に変える「音声変換」は処理の複雑さから変換に時間がかかり、遅延によって会話の流れを妨げてしまう課題がありました。また、従来の「ボイスチェンジャー」では機械的な音声となるため、声の秘匿や娯楽用途には利用されるものの、自然な会話が求められる場面には不向きでした。
NTTテクノクロスは、こうした課題を解決するため、NTTコミュニケーション科学基礎研究所が開発した「リアルタイム音声変換技術」を活用し、高精度な音声変換ソフトウェアとして製品化しました。好みの声色や話し方にリアルタイム変換し、円滑なコミュニケーションを実現する「SynoraVoice」は、エンタテインメント分野での活用をはじめ、聞き取りやすい案内放送やカスタマーハラスメント対策など、幅広い用途での利用が見込まれます。
■特徴
(1)瞬時に好みの声色や話し方に変換
NTTコミュニケーション科学基礎研究所が開発した「リアルタイム音声変換技術」の活用により、話者の音声を好みの声色や話し方に瞬時に変換することができます。
(2)利用シーンに合わせた音声が選択可能
男声4種・女声4種の合計8種の音声モデルを標準搭載し、用途やシーンに応じて最適な音声を選択・活用できます。また、新たな音声モデルをカスタマイズして追加することもできます。
(3)アプリケーションとしてだけでなく、ライブラリとしても提供可能
Web会議システムなど、さまざまなシステムと連携できる独立したアプリケーションとしての提供に加え、既存のシステムなどに組み込めるソフトウェアライブラリとしても提供可能です。
■想定される活用や利用シーン
(1)メタバース・YouTube配信のキャラクター音声
バーチャルYouTuber「VTuber」などのアバターに相応しい音声で視聴者と会話ができるため、ライブ配信やイベントの臨場感、没入感の向上が図れます。
(2)イベント・ショーでのキャラクター音声
スタッフの声をキャラクターの声に変換し、ファンやお客様と会話ができ、イベントやショーの演出効果を高めることができます。
(3)公共施設・交通機関の案内音声
騒音下でも聞き取りやすい音声に変換することで、公共施設における呼び出しや案内放送をはじめ、鉄道・バスなどの交通機関における駅や車内での緊急アナウンスなどに活用できます。
(4)コールセンターのオペレーター音声
オペレーターの音声を柔和な音声に変換することで顧客に安心感を与えたり、毅然とした音声に変換することでカスタマーハラスメントの抑止を図るなど、オペレーターの心理的負担を軽減し、業務環境の改善にも寄与します。
今回の紹介は以上です。
それでは、また。