中国人が開発したと思われる最新のAIボイスチェンジャー「RVC」がいま話題になっている。学習モデルを生成すれば、誰でも簡単に「その人の声」を発声することができる。

今回は、使い方次第では危険とまで言われているRVCについて見ていこう。ライフスタイル誌から誕生した男の隠れ家デジタルが、知的好奇心をくすぐる情報を解説する。

■そもそもAIボイスチェンジャーとは?

AIボイスチェンジャーとは、人工知能(AI)の機能を使用し、音声を別の声やアクセントに自動変換する機能・ツールのことだ。近年ではAIの技術が進歩したことで、誰でも自然で高度な音声変換ができるようになった。

またリアルタイムで音声を出力することも可能で、さまざまなアプリケーションで活用されている。ネット上での通話だけでなく、ゲームや映画、テレビ番組、オーディオブックなど、その用途は多岐にわたる。

最近は中国でのAIボイスチェンジャーの開発が加速しており、いくつもの高機能サービスが発表・リリースされている。今回は、なかでも革命的なAIボイスチェンジャーであるRVCを紹介しよう。

■AIボイスチェンジャー「RVC」の機能・魅力

RVCは「Retrieval-based-Voice-Conversion」の略称であり、開発者は中国人だと言われている。その根拠となるのが、サービスの表記がほぼすべて中国語であるということ。

日本語化されている箇所も一部あるが、説明文は基本的に中国語表記なので、インストールする際には苦労を要する。気になるサービスの内容は、学習モデルと言われるAIが学習した音声データを利用することで、自分の音声をその学習モデルに置き換えるというもの。

また学習モデルは他者と共有でき、特徴的な音声を用いた会話も行える。さらにRVCで作られた学習モデルは、「VC Client」という別ツールを使うことで、リアルタイムの音声変換が可能になる。

そのほか、歌のボーカル音声を学習モデルの声にしたり、2つの学習モデルを融合させて新たな音声を作り出したりなど、RVCの機能は多岐にわたる。

■RVC最大の強み|AIによる音声学習のスピード

これまでもAIボイスチェンジャーというものは、世の中に数多く存在していた。今回取り上げているRVCに至っては、AIを駆使した音声学習のスピードがとんでもなく早い。

大量の音声サンプルや学習にかける膨大な時間を使わなくても、RVCならわずか1時間程度で良質な学習モデルを生成できる。また学習モデルのデータ容量が軽いため、保存や共有の融通が利きやすい。

RVCを操作する環境が必要であること、中国語で記載されたサイトからインストールしなくてはならないことなど、実際に使用できるまでに複数のハードルがあるものの、ある程度の知識がありターゲットの音声データを入手できれば、比較的手軽に自分の声を理想の音声に変化させることができるのだ。

■RVCは危険なサービス? 利用時の注意点

本記事で解説したRVCは、開発元が不明で安全性が担保されていないため、利用する際には注意が必要だ。さらに使い方次第では、他人の声を学習モデルとして出力し、その音声を無許可で使用することも可能である。

そのため、RVCは十分なモラルを持って扱わなければならない。また著作権侵害などの問題も孕んでいることから、面白半分で使うことはおすすめしない。「革命的なAIツールが登場した」という事実認識にとどめておく程度が良いだろう。

そもそも今回紹介したAIツールだけに限らず、画像生成AIや文章生成AIについての反対意見が相次いでいる。それでもRVC含めたAIツールを活用したいのであれば、「すべてにおいて自己責任である」という事実を忘れないでほしい。

ChatGPTの進化で話題! AIの今後を大予測。仕事が奪われるのはいつ? どう活用すればいい?
大手企業がAIサービスを次々とリリース! AmazonやAdobe、イーロン・マスクが開発表明