AI音声合成開発のElevenLabsが音声クローニング悪用防止のためAI音声生成かを判定する「AI Speech Classifier」を発表

AI音声合成開発の「ElevenLabs」が「AI Speech Classifier」を発表しました。これはElevenLabsのAI生成による音声コンテンツを検証するツールで、音声コンテンツをアップロードするとAI生成されたものが含まれているかを判別するというもの。今回はこのツールの紹介をしていきます。

ElevenLabs / Introducing the ElevenLabs AI Speech Classifier: Elevating Safety Standards for AI-generated Audio Content

ElevenLabsは、元Palantirのマティ・スタニシェフスキCEOと元Googleのピョートル・ダブコウスキーCTOが共同創業したロンドンのAIスタートアップ。人工知能と深層学習を使用した自然な音声合成エンジンを開発し、音声アシスタント、音声合成、ナレーション、音声コンテンツの作成など、さまざまな用途に使用されており、現在ユーザー数は100万人を超えているとのこと。2023年6月20日に1,900万ドル規模のシリーズAラウンドの資金調達も発表しており、今勢いのある音声合成企業のひとつとなっています。そして、ElevenLabsのサービスが悪用され、ジョー・ローガンやエマ・ワトソンなどの有名人の声を真似たディープフェイク音声コンテンツが勝手に生成されたことでネット上で話題になっていました。

今回ElevenLabsは、AI生成音声の透明性を高めるための一歩として、世界初のAI音声検証メカニズムを実装したツールとして「AI Speech Classifier」をリリースしました。

音声クローニング(音声クローン)と呼ぶ、ある人物の声をそのままAIで生成する技術の品質が上がるにつれて、活用範囲が広がっているという良い面もありますが、逆に悪用リスクも日々高まっています。

音声クローニング悪用関連記事
米国でAI音声合成を使った振り込め詐欺が増加中
アリゾナでAI音声合成の声を使った身代金目的誘拐事件が発生
AIを悪用した音声詐欺が世界で増加中!10%が遭遇する音声詐欺から身を守る方法は?

実際AI音声が悪用された事件が増加傾向にあるのは過去Audiostart Newsで紹介してきたとおりです。

こういう背景があり、ElevenLabsとしても音声クローニングの悪用に対する懸念を少しでも減らすために、AI音声かどうかを判定するツール「AI Speech Classifier」が必要となってきたというわけです。

さて。AI Speech Classifierの使い方も紹介しておきます。

AI Speech Classifier

音声コンテンツをアップロードして、「Detect Synthesized Speech(合成音声の検出)」ボタンを押すだけで、判定してくれます。1分以上のファイルの場合は最初の1分のみが分析されます。検出精度は、音声コンテンツが変換されずにそのまま入力された場合は99%以上の精度、コーデックやリバーブなどの変換を行った場合でも90%以上の精度で検出できるとのこと。精度はコンテンツに後処理が施されるほど低下し、BGMなどオーディオトラックが追加されている場合も低下するとのこと。

現在はElevenLabsの生成した音声のみを検出しますが、今後、他社のプラットフォームで生成されたAI音声も検出できるようにする予定であるといいます。そうなるとこのツールの活用は広がりそうです。
ではまた。