AIを使ったリアルタイムボイスチェンジャーソフト「VC Client for RVC」とは?

今回は、AIを使ったリアルタイムのボイスチェンジの話。wok!さんが開発した「VC Client for RVC」について紹介したいと思います。

以前Audiostart Newsでも紹介した「第一回AIアートグランプリ」優勝者である松尾公也さんによる解説記事が非常にわかりやすいのでこちらをもとに簡単に紹介します。

テクノエッジ / AIボイチェン「RVC」の精度と学習・変換速度が革命的。コナンの蝶ネクタイ的リアルタイムボイチェンも可能(CloseBox)

AIボイスチェンジは、音声データを学習をさせ、その後、推論と呼ぶ変換作業を行うことで実現されます。

松尾公也さんの声と、その声をボイスチェンジして奥様の声を模して、デュエットする曲が公開されています。聴くと驚きます。最先端のAIボイスチェンジ、凄すぎです。

このボイスチェンジという技術がリアルタイムで自分の声を他の人の声に変えられるとなると、VTuberやVRChatでの活用も現実的になってくるわけで、注目度の高い領域となるのは当然です。僕のようなおっさんの声が、美少女の声に簡単にできるようになれば、バ美肉も捗りますよね。知らんけど。

このリアルタイムボイスチェンジに特化したソフトが今回の本題「VC Client for RVC」です。

GitHub / voice-changer/vc_client.py at master · w-okada/voice-changer

VC ClientはMMVC, so-vits-svc, RVC(Retrieval-based-Voice-Conversion)などの AI を使ったリアルタイムボイスチェンジャーのクライアントソフトウェアです。また、リアルタイムボイスチェンジャーで必要となるトレーニング用の音声の録音(MMVC 向け)アプリも提供しています。

先日Mac版も登場し、NVIDIA製GPUなどハイスペックなビデオカードを搭載したWindows PCでなくても、Apple Silicon M1/M2搭載のMacでもCPUのみで可能になったとのこと。つまり僕らが日頃仕事で使っているようなMacbookでもできてしまうということですね。すごい時代になったものです。ということは僕がこのポッドキャストを録音しながらリアルタイムボイスチェンジでイケボで配信できちゃうかもしれないってことですよね。夢がある話ですねぇ。

そして松尾公也さんも指摘していましたが、「コナンの蝶ネクタイ的リアルタイムボイチェン」ができる日もそんなに遠くなさそうですね。

ハードウェアの制約が今後も下がること、品質向上、より高速化されることで、ますますリアルタイムボイスチェンジは普及していくことと思います。一方で、簡単に他人の声を模倣できるようになることで、この技術を悪用した犯罪も増えそうであることには注意をしていく必要はあります。すでに米国でAI音声合成を使った振り込め詐欺が増加中とのことですから。

ではまた!