Stability AIが音楽生成AI「Stable Audio 2.0」を発表、プロンプト入力で最長3分の音楽生成可能

生成系AI開発のStability AIが、音楽生成AI「Stable Audio 2.0」を発表しました。今回はこのサービスを紹介します。

Stability AI / Introducing Stable Audio 2.0

関連記事
Metaが音楽生成AI「MusicGen」を発表！Text-to-Musicを実際に体験してみた
 Metaが新たなオーディオ・サウンド生成AI「AudioCraft」を発表！
音楽生成AI「Suno」、簡単に音楽が作れて、そのクオリティーの高さにも驚愕

■Stable Audio 2.0とは？

「Stable Audio」は、Stability AIの画像生成AIモデル「Stable Diffusion」の使い方と一緒で、プロンプトに希望する音楽を指示するだけで音楽が生成されるというものです。

最初のバージョン「Stable Audio 1.0」は、2023年9月にリリースされ、TIME誌の2023年ベスト発明の1つに選ばれています。

今回の最新バージョン「Stable Audio 2.0」では、テキストからオーディオを生成するだけでなく、オーディオを入力として、別のオーディオを生成することもできるようになりました。もちろん、テキストとオーディオを組み合わせて新しい音楽を生成することもできます。また、出力は44.1 kHzのステレオで最長3分間のきちんと曲として成立したものが生成されるなど大幅にアップデートされています。

■実際にやってみた

とりあえず、実験としてジャジーなヒップホップBGMを作ってみました。プロンプトには「jazzy hip hop」と入力しただけなんですけども。

「Generate」ボタンを押して待つこと数分間。曲が完成しました。

イメージした通り、チルアウトなLo-Fi感のある作品が完成しました。上記再生ボタンを押すことで出来上がった曲を聴くことができます。いかがでしょうか？

他にも子供向け音楽やアフリカっぽい音楽などを生成してみましたが、プロンプトの指示に近い形で生成されて満足度は高いです。

■Stable Radioでチェック

Stable Audioで生成されたトラックをフィーチャーした24時間年中無休のライブストリーム「Stable Radio」をYouTubeで聞くことができます。

いやはやレベルの高さに驚きです。

ではまた！