去る4月7日から9日までの三日間、東京ビッグサイトの青海展示棟で開催された「AI・人工知能EXPO2021【春】」に筆者の経営するギリア株式会社もブース出展させていただいた。

リアルな展示会に大規模なブースを出すのは久しぶりだったので大変だったが楽しくもあった。

まずはテレビCMでお馴染みの「家庭教師のトライ」さんと開発したトライ式AI学習診断(https://www.trygroup.co.jp/campaign/ai/)のご紹介コーナー。

このサービスの重要なところは、従来は個々人の指導者によってバラつきの出ていた「この子、どこが苦手分野なのかな」という診断をAIで一本化し、素早く苦手分野を類推できるようになったこと。次に、志望校にあわせて過去問を検索し、その生徒専用の問題集を作るAIなど、トライグループ様は早くからAIに積極的に取り組んでサービスを拡大されてる。

この技術を応用し、薬剤師国家試験に適用した事例も紹介されていた。

「少ない質問から大量の情報を類推する」というのは実は応用範囲が広い技術で、今後は試験対策以外にも使われていくだろうと考えている。

パラマウントベッド様とギリアの取り組み(https://www.paramount.co.jp/news/detail/158)では、画像解析を駆使して介護用ベッドに取り付けたカメラから介護対象者の体の状態を推定し、転倒予測まで行うソリューションを展示していた。カメラだけ見て、パッと見て人じゃないものも正しく人が寝ていると識別できる。こういうものは、データとモデルを丁寧に作っていくことでしか実現できない。

個人的に驚いたのは、何度目かの展示になる視線検出ソリューションである。

これはもともと、二年くらい前に「カメラだけからアイトラッキングができたら応用範囲が広いよね」とだけ言って研究段階だったものが、いよいよ実用レベルまで高速化してきたのだが、当初は深層学習専用のGPUマシンを使っても、3FPSくらいだった。それが20FPS以上出ていて、しかも複数人数の視線や姿勢をリアルタイムに検出していてひどく感心したのだがもっと驚いたのは、それがCPUのみのMacで動いていることだった。

これには心底驚いた。

当社はコロナで全面的な在宅勤務体勢になっているため、こうした技術革新が起きてもなかなか報告が上がってこない。
こうしたニューラルネットの極端な高速化・高度化を支えているのは実は人間だけではない。

遺伝的アルゴリズムを利用してAIを自動設計する「ギリア・スペクター」という技術のパネル展示も行っていた。

100ノードからなる社内の計算資源をフェデレーションというMastodonにヒントを得たP2P技術で束ね、それぞれのノードに試作したAIを仮学習させ、一定期間後に学習を打ち切り、有望そうなAIの設計を生物の遺伝子のように「交配」したり「突然変異」させたり「淘汰」したりしながら最適な設計を見つけていくことができる。

先日のテストでは、40MBあったオブジェクトデテクション(物体検出)のモデルを、精度を保ったままわずか40KBにまで縮小したAIの設計を得ることができたと言う。

この技術の重要性も見過ごされがちなのだが、そもそも世の中に既にあるAIの設計や実装といったものは、公開されているデータセットや広く市販されているGPUに対して最適化されているものがほとんどだ。そうしなければ論文が書けないからである。

ところが、実際の仕事に使う場面では、データセットは当然ながら顧客の中で閉じた非公開のものを使う必要があり、使用可能なハードウェアにも厳しい制限がある。なんでもかんでもNVIDIAのGPUを使うと言うわけにはいかないのだ。

たとえばヒープメモリが2MBしかないマイコンで物体検出をしたい、と考えた時、40MBもあるニューラルネットは最初から選択肢に入らないが、40KBとなれば十分現実的どころか、同じ規模のニューラルネットを5つくらい並行でメモリに置けることになる。つまり、ニューラルネットワークを精度を保ったまま小さくできれば、メモリは節約され、処理速度もそれに比例して高速化することになる。計算の絶対量そのものが減るからだ。

そして2MB程度のメモリのマシンで高度なAIが動作するというのは、いろいろ「できないと思っていたことが実はできる」ということでもある。

数千円で買えるM5StickVとかでエッジだけで高度な物体認識ができれば、できることはものすごく広がる。
プライバシーにもより配慮しやすくなるだろう。

さて、強化学習ほど、その重要性が一般に正しく理解されていないAI技術はないかもしれない。

一般に「深層学習」と言うと、少し聞いたことがある人がすぐ思いつくのは「画像認識」で、これは飛躍的な進歩があり既に文字の読み取りや工場での不良品の検知など多くの場所で使われている。次に、「画像生成」で、これはいろいろな画像を生成することができるが、一般の人にはなんの役に立つのかはわかりにくい。そして最後が「囲碁で人間に勝った」ことくらいで、しかし囲碁をやらない人からしたら、囲碁で人間に勝つと言うことがどれほど破壊的なことなのか理解できないのでスルーしてしまう。

さて、最後の「囲碁で人間に勝つ」人工知能は、深層学習と強化学習を組み合わせた深層強化学習の成果なのだが、この技術も一般には「凄いことはわかるが、だからといって何ができるかよくわからない」というものの代表例と言えるだろう。

筆者は数年前から「深層強化学習こそがAI革命の本命である」と繰り返し主張してきた。

それ以外のものは、従来のものが性能が上がる、くらいのものだが、深層強化学習では、「考える」という行為そのものが逆転するのだ。

つまり、深層強化学習以外の手法は、プログラムが判断する部品としてのAI(画像の認識や生成など)があるだけだが、深層強化学習されたAIの場合、AIが考え、プログラムはAIに対して判断材料となるセンサー情報を提供し、AIからの指示をモーターなどに伝える伝令役を果たすに過ぎなくなる。

このとき初めてAIとコンピュータ(プログラム)の主従関係が逆転し、AIはその真価を発揮することになるのだ。

そのうちの一つが、強化学習によるサッカーロボットだ。

この原稿で敢えて「強化学習」と「深層強化学習」を分けて書いていることに注意されたし。
このサッカーロボットは、「強化学習」によって学習しているが、「深層強化学習」は使っていない。

UnityのML-Agentsのシミュレータを用いて、ほんの数日、パソコンでトレーニングした8体のロボットが、それぞれ別々のニューラルネットワークで推論し、自律的に動作している。これだけの制御をわずか1台のiPhoneでこなしているのだ。

なぜこのデモを展示したかというと、深層学習以前の「強化学習」でさえ、これほどの可能性を持っていたことを示すためだ。

強化学習は非常に長い歴史を持っているが、深層学習と出会うまではまさしくこうしたサッカーロボットの研究用としてよく使われていた。

このロボットたちはそれぞれ独立して判断するが、全体としてはチームプレイをこなしている。
たとえば、どれか一台のロボットがフォワードとして相手の陣地に突撃すると、残りのロボットは自軍ゴール内に入り、ディフェンスを行うといった役割分担が自然発生的に行われる。

このロボットたちに誰かがサッカーの戦術を教えたわけでは全くない。ただひたすら、サッカーのルールと環境だけを与え、ひたすら強化学習を繰り返すことによってロボットたちが自然に最適なふるまいを身に付けたのである。

またこのロボットのハードは、ソニーインタラクティブエンターテインメントのtoioという玩具のロボットを流用しているが、このtoioというロボットが持つ特有の性質にニューラルネットワークは順応して学習する。たとえば人間ならば、真横に移動してブロックすることができるが、車輪が並行して二つしかついてないこのロボットでは、横に移動したければまず回転してから移動することになる。技術的な解説は開発者の布留川英一のnote(https://note.com/npaka/n/n05368fec4551)を参照されたし。

これらのロボットは学習の過程を通じて徐々にドリブルやシュート、クリアーやブロックといった技を身につけていった。

こうした複数のロボットが自律的にチームプレイを習得していく過程は、当の開発をしている我々にとってすら興味深いものだった。

我々にできることは、ロボットの環境を整えてあげることだけ。
あとはひたすら根気よく、「彼ら」が育つのを待つしかない。

この技術が深層強化学習と組み合わさればもっと凄いことになる。
もっと凄いことになるのだが、別に最強のサッカーロボットを作ることが目的ではないので、デモとしてはこれで充分だろうと判断した。

なによりもまず、強化学習に興味をもってもらうことが大切なのだ。

そして、こうした強化学習が深層学習と結びつき、深層強化学習になると人間ですら不可能に近いと思われる難問、すなわち囲碁で常に人間のトッププレイヤーに勝利するという状態まで持っていくことができることが既に証明されている。

次の問題は、「ではこれを一体全体何に使えばいいのか」ということになる。
この答えは単純明快ではあるが、単純明快であることと、それがすぐに人の役に立つことの間には大きな開きがある。

簡単に言えば、「深層強化学習を何に使えばいいのか」と質問されたら、「あらゆる意思決定に適用すればいい」と答えることになるだろう。

しかし、「あらゆる意思決定」にAIの判断を適用するというのは人間の営みとしてはかなり勇気がいる決断である。
しかも、意思決定に強化学習を使おうと思ったら、その意思決定に関わるできるだけ多くの情報をシミュレータで再現し、AIに学習させなければならない。

たとえば「組織計画に強化学習を使う」と言うのは簡単だが、その「組織計画」に関わるあらゆるパラメータ、一人一人の人材の特性や性格、そして考えたくないが、そうした人たちが事故や病気で欠席する確率、仕事を能率的に行える確率といったものをすべてシミュレートしなければならない。これは別の意味で難問だ。

それでも果敢にそうした適用に取り組んでいるのが、ゲーム業界と大規模な計画を必要とする業界だ。ゲームのテストプレイはまさしく深層強化学習にうってつけのテーマであり、ギリアでも創業当初から取り組んでおり、一定の成果が出ている。とある業界においては、計画の立案は非常に難易度の高い仕事であり、熟練した人間が取り組んで一週間かかっていたそうだ。

ギリアでは、それと同じレベルの計画を1時間から数時間程度で立案するAIを深層強化学習によって開発した。
こうなると、仕事のやりかたそのものが根本的に変わる。

このように、人間が計画を作ることができ、それを比較することができるような状況では、AIに判断を委ねやすい。

そういうわけでここで紹介し切れないほど、いろいろな展示をした。
もはや社長の自分が把握できないほど様々な活用例が活発に提案されていて、また技術も目覚ましい進歩を遂げていた。

まさしく、AI業界の未来は明るい、と思ったのだった。