AIが絵を描いてくれるサービス「Midjourney」が人気だ。8月に入ってからSNS上で言及が急速に増え、Midjourneyで描かれた絵が大量にシェアされるようになっている。

 AIに絵を描かせることは以前からできたが、自分で環境を整備する必要があり、描き始めるまでのハードルが高かった。だがMidjourneyは、少し英語が分かればすぐに、お試しで、無料で使えるのも大きいだろう。

 筆者も試してみて、こうしたサービスがどんな意味を持つのかを考えてみた。

 なお本記事は、毎月10ドルの有料プラン「Basic」を利用して制作している。

●文章が絵になっていくMidjourney

 Midjourneyは、クラウド上で動く「文章による命令から絵を描かせるサービス」だ。

 キーボードからコマンドを入力、そこに「英文による、求めている絵の内容」を書き加えると、いわゆるAIが絵を描いてくれる。

 どんな絵になるかは、実例を見てもらうのが分かりやすいかもしれない。次の絵は「2030年の東京」。確かにそんな感じがする。

 同じようなパターンで「アメリカ陸軍と一緒に戦うロボット」。どちらもなんとなく、ゲームや映画のイメージボードにありそうな絵になっている。

 「うまそうな未来の食事」も描いてみた。確かにどことなく合成食っぽいが、でも「前衛フランス料理」と言われればそんな気もする。美味しそうでかつ、微妙に危なそうだ。

 一番気に入っているのは次の絵かもしれない。「明るい夏の日のネコ」。これ本当にネコなのか、本当は巨大な雲じゃないか、的な感じにも見えるが、実に味のある絵になったと思う。

●Discordをユーザーインタフェースに

 Midjourneyへの命令は、Discordを介して行う。要はMidjourneyがDiscord上のBotとしてふるまっているわけだ。同じことはWeb上でもアプリ上でもできるのだが、あえてこの構成になっているのは、Discord上で可視化されてバズることも考えた仕組みかな、とも思える。若い世代・ゲームをする世代へのDiscordの浸透度は圧倒的なので、このやり方は正解だ。

 使い方はシンプル。「/imagine」とコマンドを入力、その後に絵を示す英語を文章、もしくは単語の羅列で記述する。同じような文章であっても、語の並びで微妙に結果が違ったりするので、試行錯誤してみる価値はある。

 以下の画像は、「フォトリアルに描いた眩しい夏のスクールガール(school girl in the shiny summer, photorealistic)」の結果。それっぽいのだが、もともとは4つの候補が描かれる。

 下に「U1」から「U4」と「V1」から「V4」のボタンがある。この意味は、Uが「アップスケーリング」、Vが「バリエーション」。右上から1・2・3・4として、「V1」は「1のバリエーション」、「U3」なら「3のアップスケーリング」で描きなおす、という意味になる。

 で、先ほどの4例のうち、3のアップスケール版が完成として示した絵で、下がバリエーション、ということになる。

 無料での利用の場合、25枚まで描かせることが可能。それ以上は月額課金制の有料になる。

●「道具としてのAI」が生み出すクリエイティビティとは

 これらの絵を見てどう思うだろうか?

 クオリティはかなり高いと思う。

 もちろん絵のテイスト、というかモチーフには一定のベクトルがあり、言葉を飾らずにいえば「アメリカのコンテンツ企業でイメージボードに描かれる絵、それもゲームやSFなどのエンタメに偏っている」印象がある。

 それはおそらく、学習に使われている絵のソースがそちら方面に偏っていることに加え、Discordの上でユーザーが描かせる絵にも、大きな偏りがあるからだろうと思う。

 それで使い物にならない、と考えるのは間違いだろう。使える範囲への制限はあるが、ちょっとしたイメージ画や下絵、背景には十分に使える。それに、ソースの偏りなら、学習で修正できる。

 これが人の仕事を奪うのか、という点については「そうかもしれないが、たいした影響はない」と予測する。

 AIが絵を描いて補完してくれるとしても、それはフォトストックや「いらすとや」に似たものが増えるのと大差ない。フォトストックやいらすとやの存在によって、「どれでもいいけど手早くいいものを使いたい」ところで、人間が絵を描きおろす・撮りおろす必然性は減った。同じように「ここになにか絵が欲しい」とき、一定のコストでソフトが描いてくれるなら、それは間違いなく「アリ」な世界だ。

 道具として考えても、いまさら「AIはまかりならん」という話はないだろう。ゲームや映画のCGでは、街の建物や木を自動生成するツールが使われている。それとMidjourneyはどこが違うのだろうか?

 ポイントは、「それで人が楽になり、より良いコンテンツが作れるかどうか」ということだ。

 短期的には「サービスに共通のテイスト」には価値があるだろうと思う。いかにもMidjourney、という絵には、しばらく一定の価値が生まれるのではないか、と思う。

 一方で、本当の意味での「テイスト」をAIが作れるのか、という疑問は残る。できそうな予感はするが、「AIが作ったものです」では、一定までのコストは負担しても、なかなか高い対価は払わないだろうと思う。

 ここでもっとも良い比較対象は「いらすとや」だと考える。

 前述のように、「とにかくここにいい感じのイラストを埋めたい」というニーズを満たすものとしては、いらすとやの作品でもAIでも同じかと思う。

 だが、いらすとやの一連の絵には確実に「一定のテイスト」が存在する。たくさんの場所に使われ、ありふれた絵になったが、その「テイスト」が生み出すなにかがあるから、人は「あえていらすとやを使う」ことがある。それは強いクリエイティビティの結果だと考える。

 AIでそれができるのか? AIでできたとして、そこに価値を人が見出すのか? そこには情緒的なものも反映されるので、なんとも言い難いところがある。

 Midjourneyのような仕組みの場合、「一定のテイストを必ず生み出す命令を与えること」には、短期的にはクリエイティビティが生まれる、と思う。今の機械学習の持つあやふやな部分が人間側の最適化を必要とし、そこにクリエイティビティが見出しうる。

 同じような絵が出てくる場合、その過程は「作業」に過ぎず、付加価値は生まれづらい。だが、生み出されるものに「ぶれ」があってそこに人の発想が関わるなら、間にいるのがAIであろうが、それは「作品」になりうるし、その過程で「人の意図によるテイスト」が感じられるとすれば話は違うのではないか。実際、「なぜこのような描写ができているのか」という作品もシェアされるようになってきており、そこには「Midjourneyっぽさ」がかなり消えているものも多い。

 一方で、アーティストのテイストを意図的に真似る行為や、特定のキャラクターそのものを描かせる行為は、個人の創作としては問題なくとも、商業利用になるとなかなか微妙な話になってくる。

 SNSでは「Midjourneyへの命令」を、魔法使いの呪文に例える人もいるが、なんとなくわかる。この辺が実に興味深いことでもある。

この記事は、毎週月曜日に配信されているメールマガジン『小寺・西田の「マンデーランチビュッフェ」』から、西田宗千佳さんのコラムを転載したものです。