●ディープラーニングと大きく異なる3つの特徴
「スパースモデリング」と呼ばれるデータ分析手法をご存知だろうか。わずかなデータからでもAIモデルを構築可能な技術であり、2019年にイベント・ホライズン・テレスコープが公開した、ブラックホールシャドウの撮影に利用された手法としても知られる。

スパースモデリングは膨大な量のデータから学習するディープラーニングとは反対に、わずかなデータ量からでもAIを構築可能であり、AIが結論を導く過程が人間にも理解しやすく、AIのブラックボックス化問題の回避も可能だという。

独自のスパースモデリング技術をAIに応用してデジタルソリューションを開発する、AIスタートアップ HACARUSの代表取締役 CEO 藤原健真氏に、同技術の概要と今後の発展性について話を聞いた。

プロフィール
1976年生まれ、滋賀県出身。カリフォルニア州立大学コンピューター科学学部卒業。18歳で単身アメリカに渡り進学。帰国後、ソニー・コンピュータエンタテインメントでエンジニアとしてPlayStationの開発に従事した後、数社のテクノロジーベンチャー企業を共同創業。
京都が持つ大学の技術と知財、ライフサイエンス・モノつくりの経験と知見、優秀な日本人学生と留学生、よその真似をしない独自のビジネス価値観、といった強みを再発見する。2014年に株式会社HACARUSを創立。
趣味はアウトドア、山登り、夜に日本酒を飲みながらのシンセサイザーいじりとテクノ音楽制作。尊敬する経営者は任天堂の故岩田さん。

--スパースモデリングはどのような特徴があるのでしょうか

藤原氏:現在のAI開発の主流な技術であるディープラーニングと大きく異なる点が3つあります。1つ目はAIを構築する際にビッグデータが不要である点、2つ目はAIが結論に至った理由が説明可能である点、3つ目は計算量が少なく消費電力も少ない点です。特に3点目なのですが、現在のままディープラーニングの活用を続けると電力供給が追い付かなくなるかもしれないという試算もあるほどで、エネルギー問題の観点でもスパースモデリングを用いたAIに期待しています。

具体的に他のAI技術とどれだけ異なるかを、太陽光パネルの画像から異常箇所を検出するAIを構築すると仮定して説明します。一般的に、SVM(サポートベクタマシン)やCNN(畳み込みニューラルネットワーク)では、AIが学習するためのデータとして800枚程度の画像が必要とされています。一方でスパースモデリングでは、60枚程度の画像でAIを作ることができます。また、学習のために必要な時間も、SVMでは30分、CNNでは5時間であるのに対して、スパースモデリングでは19秒です。

私がスパースモデリングの理屈を説明するときには、関数y=f(x)の例を用いて説明をします。yは導きたい答えで、xはAIが学習する特徴量としての入力値です。一般的なAI開発に用いられるディープラーニングでは、多量のデータからxとyの組み合わせを読み込んで関数の中身を調整します。関数の中身は詳しくはわからないけれど、おそらく適切であろうxとyの関係性を導くようなアプローチです。

犬の画像から犬種を判断するAIをディープラーニングで作ると仮定しましょう。多量の犬種の画像を読み込んで、「Aという特徴を持つ犬はチワワ」「Bという特徴を持つ犬はトイプードル」という組み合わせを関連付けることで、新しい画像を読み込んだ時に「この画像はAの特徴があるからチワワだな」と予測します。特徴量xから適切なyを導くというディープラーニングのアプローチは、数学や統計学の世界では順問題と呼ばれています。

対してスパースモデリングは、逆問題を解こうとするアプローチの手法です。つまり、「導きたい答えであるyは、どのようなxによって特徴づけられているのだろうか?」という考えを基本にしています。スパースモデリングにはビッグデータが不要と言われますが、そもそも多量のデータを用いて問題を解決しようとするアプローチではないのです。答えであるyを特徴づけているのは、どのようなxであるのかを見極める手法です。

--どのように特徴を見つけ出しているのですか

藤原氏:実は人間の視点が非常に大切です。例えば、私たちが人の顔を認識する際のことを想像してください。目の前にいる人が誰なのかを識別する場合には目や鼻、口など特定の部位にのみ着目していて、それ以外のおでこや頬の詳細まで詳細に確認して見分けることはしませんよね。スパースモデリングもこれと似たような考え方でAIを構築します。

一方で、さまざまな人の顔のデータを多量に読み込んで、おでこや頬や輪郭の細部まで特徴付けを行うのがディープラーニングの手法です。これが2つの手法で大きく異なる点ですね。スパースモデリングでは、画像のどこに着目して、反対にどこを無視するのかをAIに教えるための作業が必要です。

こうした理由から、当社がスパースモデリングでAIを作る際には、何を特徴として捉えるのかを毎回データ加工する手順を採用しています。MRI画像から腫瘍を見つけるAIを構築する場合には、医師がMRI画像のどこに着目して病巣を見つけているのかを、先生にヒアリングしました。

スパースモデリングを使って少ないデータの量で精度の高いAIを構築するためには、専門家のドメイン知識をAIに落とし込む過程が不可欠です。だからこそ、AIが特定の結果を導出した過程が説明可能で人間にも理解しやすいのです。AIのブラックボックス化を回避できるというのは、こうした理由があるからなのです。私たちはむしろ、データだけを使ってAIを作るということはしないようにしています。

--素晴らしい技術だということがわかりました。今後、スパースモデリングはディープラーニングと逆転するのでしょうか

藤原氏:そうなれば私も嬉しいのですが、どちらの技術にも一長一短がありますので、実際には逆転はしないと思っています。自動車の世界でもそうですが、電気自動車が作られた後もガソリン車は残っていますし、使用用途によってはディーゼル車やハイブリッド車が有効な場面もあります。それと同様で、AIを支える技術も適材適所での活用になると思います。

データが大量に手に入る環境であれば、むしろディープラーニングでAIを構築した方が短期間で正確なAIが作れます。自動運転のAIを作りたい場合には街中の交通情報を集めれば済みますし、AlphaGoのような技術も自動で膨大な量の対局データが取得できます。そのような場合には、わざわざ人間にヒアリングして特徴を絞り込むというスパースモデリングのアプローチよりも、ディープラーニングの方が適切な手段だと考えられますね。

医療の分野では、AIが結論を導き出した過程が説明できないブラックボックスでは困る場面があります。あるいは、希少疾患のようにそもそもデータが多量に取れない場合もあります。こうしたケースではむしろスパースモデリングが適切な手法だと言えるでしょう。先ほどの話に戻りますが、スパースモデリングは消費電力が少なくて済みます。ドローンやウェアラブルデバイスなど、バッテリーの大きさが限られる場面でもスパースモデリングが有効だと思っています。

●今後必要なのは「AIを使う人材」と「AIを作る人材」を結ぶ人
--スパースモデリングに限らず、広い視点で教えてください。国内企業のAI導入は進んでいると思いますか

藤原氏:DX(デジタルトランスフォーメーション)という言葉が使われ始めて久しいですが、AIの導入だけに着目しても、まだまだ部分的な最適化や特定の作業の置換にとどまっていると感じます。実は人間が作業した方が早くて簡単な部分をAIに置き換えるために、多額の資金を投入している例も少なくないと思います。

企業の視点からしますと、現在の業務プロセスを大幅にトランスフォーメーションする際にはリスクが伴います。そのため、業務の一部分だけをデジタルツールに置き換えるところに着目しがちなのだと思います。その結果、投入した投資に対してそこまで大きな変化が得られないケースが多いのではないでしょうか。

また、最近はデジタル人材不足を耳にする機会が多くなりましたね。AIエンジニアやプログラマーを増やそうという取り組みもよく見かけます。実は、私はプログラマーの不足はそれほど大きな問題だとは思っていません。デジタルネイティブな世代が成長すると、AIを使う人材もAIを作る人材も自然に増えてくると思います。

その一方で、AIを使う人材とAIを作る人材とをつないで、最新の技術を日々の業務に実装する役割の人材が今後最も不足すると思っています。両者の間を橋渡ししてくれる人材がいないと、やたら難しいアルゴリズムの話をする人とAIの仕組みがわからない決裁者が理解し合えず、ビジネスにAIを活用できない恐れがあるのです。「現在の技術ではここまでが可能で、ここからが不可能です。なので今期の課題と目標はここに設定しましょう」と翻訳してくれる人材がいた方が、ビジネスがうまくいくはずです。

AIを使う人材とAIを作る人材を橋渡ししてくれる方を増やすためには、2通りの方法が考えられます。1つ目は、データサイエンティストの中でビジネスに興味のある方が思い切ってMBAの勉強をするなど、ビジネス側に近づくというシナリオです。もう1つは、反対にビジネスに詳しい方がAIの仕組みを学ぶシナリオです。ただし、どちらにせよ座学だけで学ぶのは難しいので、実務の中で身に付けるしかありません。例えば大企業でビジネスをしていた方が、当社のようなベンチャーでエンジニアに囲まれながら修行をするのも1つの方法だと思います。

--会社としての、今後の目標を教えてください

藤原氏:現在当社が主軸としている医療分野と製造分野の両事業について、さらに「深化」させていきたいと思っています。医療分野ではこれまで医師の診断を補助するツールを開発してきましたが、今後は創薬にチャレンジしたいです。例えば、細胞に化合物を投与して、細胞の外観から化合物の効き目や毒性を判断するという過程はAIが得意とする領域です。化合物のスクリーニングに必要な期間を短縮できれば、短期間で薬を開発して患者さんに届けられるはずです。

同様に製造業の分野でも、目的とする色や形の素材を開発する期間をAIで短縮できると考えています。現在は膨大な試行錯誤によって目的のゴムやプラスチックを作っていますが、AIを活用すれば短期間で素材の候補を見つけられるはずですので、医療領域に加えて製造業にもにチャレンジしていきたいですね。

そして、多くの方にスパースモデリングという手法を知ってほしいと思います。AIといえばディープラーニングしかないと思われる方が多いのではないでしょうか。ディープラーニング以外の手法もあるということを、多くの方に知っていただくのは当社にとっても世の中にとってもメリットがあるはずです。

私は日本企業とスパースモデリングは非常に相性が良いと思っています。繰り返しになりますがディープラーニングは多量のデータが必要ですので、中国やアメリカなどの人口が多い国の方が有利です。データ量で勝てないということはAIの性能で勝てないことにもつながり得るからです。また、シリコンバレーを中心に莫大な投資金のもとで日々技術革新が行われていますので、日本企業が正面から戦う必要が無いのではないでしょうか。

昔から言われるように、日本人は高性能なものを安く小さく早く作る過程が非常に得意なのだと、私も思っています。AI開発の世界でも、少ない資源を有効に活用しながら高性能な製品を作り上げるために、スパースモデリングという手法がマッチしていると信じています。そうした意味でも、ぜひたくさんの方にスパースモデリングを知っていただきたいです。