Metaが新たなオーディオ・サウンド生成AI「AudioCraft」を発表!

Metaがテキストから音声や音楽を簡単に生成できるジェネレーティブAIツール「AudioCraft」を発表しました。今日はこのニュースを紹介します。

Meta / Introducing AudioCraft: A Generative AI Tool For Audio and Music
Meta AI / Open sourcing AudioCraft: Generative AI for audio made simple and available to all

関連記事
Metaが音楽生成AI「MusicGen」を発表!Text-to-Musicを実際に体験してみた
Metaが音声用の生成AIモデル「Voicebox」を発表、音声合成・音声編集・ノイズ除去・言語変換など超多機能

AudioCraftはMusicGen、AudioGen、EnCodecの3つのモデルで構成されたツールとなっています。

MusicGenは、以前も紹介しましたが、テキストから音楽を生成できるモデルです。AudioGenは、テキストからさまざまなサウンドを生成できるモデルです。EnCodecは音質を維持したまま圧縮を実現する音声コーデックです。これら3つを組み合わせることでAudioCraftは高品質の音声や音楽を簡単に生成できるといいます。

またMusicGen、AudioGen、EnCodecは研究用にオープンソースとして公開し、AI生成のオーディオ分野の発展に貢献していくとしています。

Metaは今回発表のブログ記事の中で、AudioCraftはミュージシャンやサウンドデザイナーにインスピレーションを与え、素早くブレインストーミングを行い新しい方法で作曲を反復するためのツールであり、MusicGenはシンセサイザーの登場と同じ用に新しいタイプの楽器になると語っています。

画像、動画、テキストを対象としたジェネレーティブAIの盛り上がりは日々ニュースを見ていると感じますよね。それらに比べると「音」の領域は若干遅れをとっている状況でしたが、やっと本格化してきた感じがします。嬉しいですね。

また新しいニュースがあればお伝えしていきますのでお楽しみに。

ではまた!