フェアリーデバイセズが2023年3月3日にビジネス向け音声AIテクノロジー「mimi」のサービスサイトを全面リニューアルし、音声AIテクノロジーのビジネスへの応用に必要な全体の知見を一般に公開しました。今回はそんな「mimi」の概要を紹介をしていきます。
フェアリーデバイセズ / 機械の「耳」を実現する音声AIテクノロジー「mimi®︎」のサービスサイトを全面リニューアルし、音声AIの社会実装に必要な技術知見を一般に公開
「mimi」は音声ソリューションを開発するために必要となる「クラウドAI」「エッジAI」「デバイス」の3つを網羅した製品群。できることが多岐にわたっているため、今回サイトをリニューアルすることでわかりやすく伝えるようにしたというもの。
一般的に、音声認識だけに特化、音声合成だけに特化するといった専門サービスが提供されることが多いと思いますが、mimiの製品群は機能別に細かく細分化されており、かつ幅が広いサービスをカバーしている点が他社との大きな違いになっています。
エッジ側でノイズキャンセリング、バージインなどのフロントエンド処理を行いつつ、ウェイクワード認識を行い、その後クラウド側で言語識別、話者認識、態度認識、感情認識、そして音声認識。さらには機械翻訳から出口となる音声合成までカバーしています。まさに音声AI応用製品に必要なほぼ全てのテクノロジーが提供されていることがわかります。
mimiのソリューションを使って、流行りのChatGPTの会話エンジンを組み込めば・・・すぐさま面白い音声サービスが提供できそうな予感がします。
それはともかく、AI音声サービス開発者の方は一度mimiの新しいサイトをチェックする価値、あると思いますよ。
ではまた。