米OpenAIの研究チームは、『Minecraft(マインクラフト/略称「マイクラ」)」のプレイ動画を7万時間も見続けたAIがプレイのやり方を学習し、熟練した人でも20分以上はかかるダイヤモンド製アイテムを10分程度で作れる」ほどの達人になった成果を公開しています。

Minecraft

 

マイクラのプレイ動画はネットに大量にありますが、そこには「何が起こったか」が記録されているだけで「どうやって操作したか」の情報はありません。つまり「ラベル」が付いていないため、それをAIがどれだけ観ても何も学ぶことはできないわけです。

 

そこでOpenAIは半教師あり模倣学習「Video PreTraining 」(VPT)を開発し、どうやって操作するかのラベル付き動画を使い、映像の各ステップで行われるキー入力やマウス操作を予測するモデル「Inverse Dynamics Model」(IDM)を学習。それから7000時間のラベルなし動画を見せ、効率的にプレイを学ばせたというしくみです。

Image;OpenAI

 

これによりAIは木を切り倒して道具を作り、ツルハシで石を採掘し、洞窟の奥でダイヤモンドを発見して、人間のエキスパートでも20分以上はかかるダイアモンド製アイテム作りを10分程度でやり遂げた……という動画がTwitterで公開されています。

ほか、このAIは水泳や狩り、料理などの他の仕事もこなせるそうです。さらにジャンプして下にブロックを積み重ね、より高い場所に行ける「ピラー・ジャンプ」のテクニックも完ぺきに使いこなせるそうです。

 

これまでAIがチェスや囲碁などをマスターすることはありましたが、マイクラのようなオープンワールドのゲームを人間と同じように(あるいは人間以上に)プレイできるのは驚くべきことでしょう。あまりにムダがないプレイはすぐに機械だと気づかれそうですが、逆に人間の失敗も学んだドジで人間くさいAIも、いつの日か誕生するのかもしれません。

 

Source:OpenAI
via:Gamesradar