最近のAIの進歩が凄まじいことは今更改めて説明するまでもない。
今年は新年早々OpenAIがDALL-E2で新しい画像生成の地平線を切り開いたかと思えば、一ヶ月もせずにGoogleのImagenが新たなSOTA(State of the art)を達成する。

そこに追従するのが世界中に散らばった自由な研究者たちによるオープンソース実装だ。

そうした実装を追いかけるのも大変だ。
なにしろ最新のAIは絡んでくる要素が多くなって簡単に再現できないものも少なくない。

たとえば、使用するGPU、そのGPUを駆動するためのドライバ、ドライバで動くGPU用計算ライブラリのバージョン、フレームワークとの組み合わせ、そのバージョン、などなど。とにかく不確定要素が多く、オープンソースであるがゆえに公開してる側のケアレスミスも少なくない。

それを解決するために最近はDockerコンテナでの配布やHuggingFaceなどのAPIやWebでの配布といったことも整備が進んできた。
しかし画像生成系は処理が重たいのでHuggingFaceではなかなか提供されない。

そうした悩みを解決しようというのがreplicate.com(https://replicate.com/explore)だ。

replicate.comは、ユーザーが投稿したさまざまな生成系AIを公開することができ、同時にWebによる推論インターフェースも提供されている。
誰でも無料で計算時間30分まで試すことができ、それ以上やりたければ、月額10ドルのホビープランで5時間まで使ったり自分のコードをクラウドで実行できるようにしたりできる。

環境のセットアップで悩む前に、とりあえずお試しで「このモデルはどこまでできるのかな」ということを手軽に知ることができる。

たとえば、顔写真からさまざまなバリエーションを生むStyle-GAN Nada(https://replicate.com/rinongal/stylegan-nada)を手軽に試すと、こんな感じになる。

他にも、写真をスケッチ風に変換したり・・・

ジョジョ風にしたりできるJojo-GAN(https://replicate.com/mchong6/jojogan)なんかもある。

また、顔写真を言葉で操作するStyleCLIP(https://replicate.com/orpatashnik/styleclip)も手軽に試せるのは嬉しい。

筆者は髪を染めたりしたことはないが、たとえば「金髪にしたらどうなるんだろう?」と考えたことはある。
そこで、自分の顔写真を入力して「金髪にする」という言葉を与えるとこうなる。

ヘアスタイルを変えることもできる。

もちろん最近のモダンなテキストから画像を生成するタイプのAIもかなり手軽に試すことができる。

最新のオープン実装であるLAIONプロジェクトのOngoモデル(https://replicate.com/laion-ai/ongo)で「テディベアの宇宙飛行士」で生成するとこうなる。

「テディベアが宇宙ステーションの雑貨屋で買い物するマンガ」はこう

これだけ色々できると30分はあっという間だ。
10ドルくらいならつい課金したくなってしまう、実にうまい価格設定だ。

画像生成以外のモデルもちらほらアップロードされている。

気軽に使えるのでご興味を持たれた方はぜひお試しあれ。