東京大学大学院工学系研究科、スクウェア・エニックス・AI&アーツ・アルケミー、ソニーグループ、NECの4者は9月28日、オンラインで記者会見を開催し、「世界モデル・シミュレータ寄付講座」を東京大学大学院工学系研究科内で開講することを発表した。

同講座は、スクウェア・エニックスがゲーム領域で培ってきたAIに関するノウハウをエンタテインメント全般に活用すべく2020年に設立したスクウェア・エニックス・AI&アーツ・アルケミーとソニー、NECが寄付企業として、資金だけでなく人的ネットワークや各企業の知見、技術を提供し、研究開発を協働して推進していくもの。

2021年7月にスクウェア・エニックス・AI&アーツ・アルケミーの寄附により同講座が設置され、同年10月から寄附企業として、ソニーとNECの2社が新たに加わる形となる。2026年6月までの最大5年間の期間で東京大学大学院工学系研究科に設置する想定だ。

同講座では「シミュレーション×ディープラーニング(DL)」を主軸に「世界モデル(World Models)」や「言語理解」などのAIに関する講義を実施するとしているが、講座のタイトルともなっている世界モデルとはどのようなものだろうか。

同大学大学院工学系研究科の所属で日本の人工知能研究の第一人者である松尾豊教授は「人間は現在の状態から、経験などを用い、将来を“想像”することが可能で、この“想像”できるAIの開発が今後の発展の肝であり、その基幹技術が“世界モデル”だ。深層学習の第2ステージとも言える段階であり、社会的なインパクトは相当大きいものになる」と説明する。

つまり、現実世界で起こる事象の後に、何が起こるのかという「モデル」を学習ベースで獲得し、限定情報から現実の世界を効率的にシミュレートする技術が世界モデルだとしている。

実際に、Googleといった先進企業では世界モデルの研究に注力しており、効率的な将来予測を可能にする技術の開発が進んでいる。今後のDL開発の主戦場である「言語の意味理解」や「ロボットの運動の習熟」には世界モデルが鍵となるという。

世界モデルが実装されると、現在では事前に決められた動作のみが可能なロボットが、個別の指示がなくとも経験から汎用的なタスクをこなすことが可能となる。

また、言語理解においては、概念や文脈理解を含めた本質的な言語理解が可能となり、対話や接客、自然な翻訳や物理・社会の新法則の発見などホワイトカラーの仕事をAIが行うことが可能となるという。

同講座では、世界モデルの構築を軸にロボットの汎用性を高めることや言語の意味理解につなげていくといったことを総合的に研究していくとともに、人材の育成という観点から2022年1月より全8回+特別回2回という構成で「世界モデル概論」として講義を行う予定だとしている。

寄付企業として参加する3社も、研究開発を行った世界モデルを活用し、それぞれの事業に活かしていく想定とのことだ。