去年RVC+VC Clientを使ったリアルタイム音声変換についてまとめたのですが、iMyFoneさんから高機能なボイスチェンジャーソフト「Magic Mic」を使ってみないかと連絡をもらったので試してみました。
有料版のライセンス提供を受けてこの記事を書いています。
iMyFone Magic Micについて
iMyFoneは、iOSおよびAndroidデバイス向けのデータ復元、コンテンツ管理、不具合修復ソフトなどを提供するグローバルな独立系IT企業です。香港、日本、ヨーロッパにオフィスを持っています。
Magic MicはiMyFoneが作成したリアルタイムの音声変換ソフトで以下からダウンロードすることができます。 機能が一部制限されていますが無料版もあります。
主な機能
ボイスボックス: 男性、女性、子供など、さまざまな音声にリアルタイムで変更可能です。
無料版は日替わりで6つのボイスを利用可能です。アイコンの右下に「AI」と記載がないものは単なるボイスチェンジャーです。
有料版は制限無しで様々なRVCの音声モデルを利用できます。後述しますが様々なキャラクターのモデルが使えるようになっています。
効果音: 様々な効果音をマイク音声とミックスして出すことが可能です。イメージとしてはDiscordのサウンドボード機能が近いです。効果音に対してキーバインドを割り当てることができるので配信中に使えたりするかもしれません。全て利用するには有料版が必要です。
音声カスタマイズ: 最大20個までの音声ファイルをアップロードすることでRVCモデルのトレーニングを行ってくれます。RVCモデル作成はグラボのパワーが必要になるので代行してくれるのはいいですね。有料版の機能です。
ボイススタジオ: 音声にエフェクトをかける機能です。例えばですが、ピッチシフターとリバーブをONにするとダースベイダーっぽい音声に変更できたりします。設定できる項目はかなり細かい無料の機能です。ピッチシフト、フォルマントシフト、イコライザなどを組み合わせることで声質を変化させることができます。
コミュニティ: ユーザーが自由にRVCモデルをアップロードして共有することができる有料版の機能です。ユーザーが作ったものなので品質はまちまちです。RVCモデルを既に持っているならここからアップロードすることで利用できます。
アップロード時にパブリックかプライベートを選択することができ、プライベートでアップロードすれば他人に使われることはなくなります。
海外のユーザーがアップロードしたモデルは声優が違ったりするのでキャラのイメージと違う声かもしれません。今は登録名が英語かどうかでなんとなく判別できますが、言語でフィルタ設定できたらよりよいと思いました。
その他にツールとして音声ファイルからの音声変換、録音からの音声変換機能が用意されていますがRVCモデルには対応していないようでした。
MagicMic ControllerというアプリでスマホからPC版のMagicMicを制御することも可能です。
利用規約について
基本的にアップロードしたRVCモデルはiMyFoneがその使用権を持つことになります。RVC+VC Clientと違ってアップロードしたRVCモデルはiMyFoneのサーバー上に保管されるため、RVCモデルをアップロードする行為は第三者に著作物を渡す「再配布」や「二次配布」にあたる気がします。(RVCモデルはだいたい再配布NGなことが多い)
- もし権利侵害があった場合はアップロードしたユーザーの責任になりますし、iMyFoneが被った諸々の損失は全部ユーザー持ちになります。
例えばこれはユーザーがアップロードしたものですがデ◯ズニーが訴えた場合、アップロードしたユーザーの責任になります。パブリックでアップロードする場合には充分気をつけましょう。 - ちなみにネズミもいます。(海外コミュニティからのアップロードが多いみたいで、英語版の声優は違うので日本人が知っている甲高いネズミの声ではなかったです)
必要動作環境
以下に記載されています。
項目 | Windows版 | Mac版 |
---|---|---|
対応OS | Windows 7/8.1/10/11 | macOS v12.1, macOS v11.6, macOS v10.15, macOS v10.14, macOS v10.13, macOS v10.12, OS X 10.11, OS X 10.10 |
プロセッサ | Intel i3以上 | Intel i5以上 |
メモリ | 4GB RAM | 8GB RAM |
ディスク容量 | 10GBのHDD空き容量 | 7GBのHDD空き容量 |
グラフィックス | Intel HD Graphics 5000以上、NVIDIA GeForce GTX 700以上 | Intel HD Graphics 5000以上、NVIDIA GeForce GTX 700以上 |
RVCモデルを利用する場合にはこれとは別にCUDAコア≥1000、メモリ≥5GB、グラフィックスメモリ≥3GBが必要です。
CUDAコア数とか言われてもわからないと思うので以下のサイトから自分が使っているGPUのコア数を確認すると良いと思います。
利用手順
機能比較
iMyFone MagicMicとRVC+VC Client+VB-Audioの主要機能を比較してみました。
機能 | iMyFone MagicMic | RVC+VC Client+VB-Audio |
---|---|---|
価格 | 有料(無料体験版あり) | 無料 |
リアルタイムボイスチェンジ | 対応(ストリーミング、ゲーム、コンテンツ作成) | 対応 |
効果音 | ボイスチェンジャーと分けて再生されるので効果音も使える | 入力音声がすべて変換されるので効果音が使えない |
対応プラットフォーム | Windows、macOS | Windows、macOS、Linux |
使いやすさ |
シンプルなインターフェース めんどくさい設定が不要でこれ1つで完結する |
上級ユーザー向け、技術的な設定が必要 |
ボイスの種類 | プリセットがたくさんあるのでダウンロードして即使える | RVCモデルの事前準備が必要 |
遅延 | 50ms以下な気がする | 50ms~100msくらい |
RVCモデルの作成 | 可(iMyFone側でやるので学習回数などは不明で完成まで3~5日待つ) | 可(自分で細かい調整が可能 高スペックなPCが必要) |
更新とサポート | 頻繁なアップデートと公式サポート。日本語で質問できる公式Discordあり。 | コミュニティ主導のオープンソースサポート |
MagicMicは特に「使いやすさ」の面で優位です。特に複雑なことをしなくても最初からRVCモデルが豊富に使えるところがいいと感じました。
一方、RVC+VC Clientは高度なカスタマイズを好むユーザーに適しています。VC ClientはWebサーバーを立てることができるので2台PCを用意すれば音声変換に使うGPUリソースを別のPCに負担させることができ、配信PCの負荷を抑えられるという点でもメリットがあります。
価格についてですが、RVCモデルが使えるSVIPの買い切り永久ライセンスだと定価17,980円です。今なら割引が入って9,880円で買えます。VIPライセンスだとRVCモデルは使えませんのでご注意ください。
使ってみる
とりあえずあみたろさんのRVCモデルをコミュニティからアップロードしてみます。アップロードするファイルは拡張子が.pthのものをzipで固めてアップロードしないといけないようです。パブリックにしてしまうと他人が見れてしまうのでここはプライベートで。
あみたろさんのRVCモデルのダウンロードはこちらから。
プライベートでアップロードしたとしてもiMyFoneに対しての再配布にあたりそうなので利用規約に沿って説明文を添えておきます。
1分くらい待ったらアップロードが終わりました。追加されたRVCモデルをクリックするとボイスボックス>私の声 に登録されます。
コミュニティ欄にRVCモデルが表示されるので、クリックしたらダウンロードが走って使えるようになります。使うRVCモデルによってピッチを調整します。
声質もRVC+VC Clientのときと同じでよかった。
時間は計測してないですが、個人的にはVC Clientよりも音声遅延が少なく感じます。
VC Clientで使うときは個別にVB-audioのインストールが必要でしたが、MagicMic自体が仮想オーディオデバイスとして動作するので入力デバイス設定時に「MagicMic Virtual Audio dev」を選ぶだけで変換後の音声が相手に伝わります。
Discordを例にすると以下のように設定します。
結論
お金が払えるなら間違いなくMagicMicのほうがお手軽に使えて便利です。
RVCモデルのアップロードが権利面でネックになりそうなので、再配布NGのRVCモデルを使いたい場合はRVC+VC Clientを使う方がいいかもしれません。
以上
圧倒的成長。