研究開発のデジタル変革(DX)が大きく加速する。文部科学省は研究のDX推進予算として2022年度の概算要求に621億円を計上した。21年度からおよそ4割増額する。環境・エネルギーやマテリアル、人文社会科学など各分野の研究事業を、人工知能(AI)やデータ科学を駆使した「データ駆動型」に移行することを目指す。各分野で蓄積したデータを掛け合わせ、異分野融合の新しい研究体制を構築する狙いだが、課題も山積している。(小寺貴之)

米中先行に危機感

「AIを使ってできる研究は増えた。ただ、このままでは中国や米国には勝てない」と、東京工業大学の細野秀雄栄誉教授は危機感をあらわにする。研究にAI技術やロボット技術を投入して、研究を効率化する動きが世界で広がる。20年に英リバプール大学が「ロボット化学者」という論文を英科学誌「ネイチャー」に載せ、その先進性が話題をさらった。

同大が行った実験はこうだ。実験装置の間をモバイルマニピュレーター(移動型作業ロボット)が走り回り夜通しで実験を実施。実験条件を機械学習の一つである「ベイズ最適化」を用いて絞り込み、実験作業と条件探索を自動化することに成功した。

ただ、研究としての投資効果には研究者から疑問符が付いた。「数億円かけて機械で688サンプルを評価しただけ」「化学の実験自動化としてはまだまだ」「良いジャーナルに載せたいという気持ちはわかる」など厳しい評価がある。自動化やAI活用が目的化しているという批判だ。

それでも、AIなど先端の情報技術を活用した実験は各所で行われ、成果も出始めている。名古屋大学の布施新一郎教授は、化学物質の生産手法「フロー合成」の条件探索にベイズ最適化を用いた。研究者が絞り込んでも1万通り以上残る実験条件の中から、目的条件を20回以下の実験回数で特定した。

九州大学の山崎仁丈教授は、燃料電池の電解質材料である「プロトン伝導性材料」の探索にAI技術を活用し1度の実験で新物質を見つけた。山崎教授は「元素組成の情報空間では(未知のデータを推測し答えを導く)『外挿』でも、記述子(材料の特徴を数値化したもの)空間では、(既知のデータから答えを導く)『内挿』になる。AIで新しい材料の発見は可能だ」と持論を展開する。このように各分野でデータ駆動型研究の吟味が進み、華々しい研究から地に足をつけた研究へと移行しつつある。

連携へ“高い壁”

個々の研究で活用が進むデータ駆動。その先に異分野や近隣分野をつないだデータの連携があり、新技術の萌芽となりうる。例えば、企業の抱える膨大な製造プロセスのデータと、大学の研究データを組み合わせて材料を探索する研究だ。細野栄誉教授は「中国は上海と北京に数百人規模の研究所が二つもある。産学が一つになれる国は強い」と指摘する。一方、日本では産業界のデータに大学がアクセスするのは至難の業だ。民間企業同士でもデータ連携は、業務提携レベルの経営判断になってしまう。

投資効果を吟味した研究者の間では、異分野融合は難しいという意見が根強い。研究データはコストが高いためだ。実験を伴う科学に至っては、データありきの手法を選びにくい側面もある。異分野の高い壁を取り払うカギとなるのが、さまざまな分野のデータを連携するデータプラットフォーム(基盤)だ。果たして、プラットフォームの構築でデータ連携は起こるだろうか。

成功例はある。プリファード・ネットワークス(東京都大手町)とENEOSは、膨大な計算データをAIに学習させて汎用原子シミュレーターを開発した。触媒や吸着材料、固体電解質など、材料科学の中の異分野をつなぐ技術となり、研究ツールをビジネス化する先行事例として期待が持たれる。

生分解性プラスチック分野では、微生物群と材料データの掛け合わせがコンピューター上で日々行われている。群馬大学の粕谷健一教授は「いつの間にか(実験の少ない)ドライなラボになってしまった」と振り返る。

プラスチックの分解には、さまざまな微生物が関わる。深海や土壌、埋め立て地など微生物の生息データと、プラスチック材料の結晶性や分子構造などの材料データを掛け合わせ分解性の評価をしている。粕谷教授は「AI技術など、膨大なデータをクロスさせて解析する技術が整い、生分解研究にブレークスルーが起きた」と力を込める。

理化学研究所の大浪修一チームリーダーらは国際的な顕微鏡画像データベースを運営する。データは研究者にとって虎の子だ。だが、画像データをコミュニティーに提供すると情報系の研究者から画像分析技術が提案され、新しい共同研究が生まれるなど連携の輪が広がっている。大浪チームリーダーは「トップ研究者には好循環が起きている」と目を細める。

他にも街の人流データと路面材料の劣化過程のデータ、気象データを組み合わせ、市民参加の路面点検システムを構築する研究がある。古文書データと地質データを活用し、地球環境史や災害をひもとくといった事例もあり、データ連携の用途は幅広い。

文科省の狙い

文科省はDXを軸としたデータ連携の促進を重点施策に掲げる。22年度予算の概算要求では、全国的な研究データ基盤の構築・高度化事業などを盛り込んだ。データ基盤の高度化機能を開発しつつ、研究振興と人材育成につなげる狙いだ。情報分野に限らず、生命科学や物質科学など幅広い分野にデータ駆動型研究を広げ、データ連携で異分野融合や未開拓分野の研究を振興する。

東京大学の田浦健次朗情報基盤センター長は「各分野でデータ駆動型研究を進めると、異分野の協力の必要に迫られる場面がすぐに出てくる」と認識。異分野融合を支える体制整備を進めている。東大と国立情報学研究所、産業技術総合研究所など11機関はデータを蓄積する情報基盤の構築を推進し、異分野間のデータをつなぐ触媒になることを目指す。

プロジェクトメンバーの工藤知宏東大教授は「人と人とのつながりを作っていくことが重要」と話す。社会問題を解決するには、複数分野のデータや知見が不可欠。そのためのデータ連携には、異分野でデータを共有する基盤やデータ解析技術、情報分野の研究者が必要になる。

こうした大型事業について東工大の細野栄誉教授は「人が育つことが大きい。情報科学を使って研究することが当たり前になるだろう。勝負は10年後だ」と先を見据える。「人口減少など、大国にも落ち目は必ずくる。その時までに(データを有益に使いこなせる)若手をたくさん育てるべきだ」と指摘する。