2013年の夏、マシュー・ズィーラー(Matthew Zeiler)はニューヨーク大学で人工知能の博士課程を修了しようとしていた。就職を控えたズィーラーは大手テック企業から引く手あまただった。グーグルのAI部門でのインターンを終えて数週間後、ハドソン川の岸辺をジョギング中に見慣れない番号から電話がかかってきた。

電話の主は後にグーグルのエンジニアリング部門を率いることになるAlan Eustaceだった。ズィーラーのAI分野における傑出した才能を耳にした彼は、「グーグルに入らないか」と誘いをかけてきたのだ。Eustaceはグーグルがこれまで新入社員に提示した中で最高額の報酬を提示した。ズィーラーは金額を明かさないが、関係筋によるとグーグルが特定分野の知見を持つ社員に提示する金額は、通常の給与に数百万ドルが上乗せされるという。

しかし、グーグルからの誘いをZeilerは断った。その数日後にはマイクロソフトからオファーが来た。アップルからの面談の誘いを受けシリコンバレーに飛んだ際には噂を聞きつけたマーク・ザッカーバーグが時間をとり、フェイスブックのAIチームに加わるよう説得にあたったほどだ。

ズィーラーは各社からのオファーを丁重に断り、自身でスタートアップを立ち上げた。「今から考えるとクレイジーな決断だったかもしれない」と彼は当時を振り返る。しかし、ズィーラーの生み出したAIアルゴリズムは、特定の領域ではグーグルを上回っていた。「大企業で働くことよりも、自分の情熱に賭ける道を選んだ」

それから4年、ズィーラーが設立したニューヨーク本拠のスタートアップ「Clarifai」は、マシンラーニングの領域で最も有望な企業として広く知られている。Clarifaiは画像や動画の認識ツールを開発者向けに提供し、この分野でグーグルやマイクロソフトを競合と見据えている。

バズフィードも認めたAI解析技術

ストライプやTwilioらが決済やコミュニケーション用のAPIをプログラマーらに提供するのと同様に、Clarifaiは低コストで最先端のAIテクノロジーへのアクセスを可能にする。Clarifaiの顧客にはユニリーバやバズフィード、ユビソフトといった大手企業の名前が並び、膨大なイメージデータの解析に役立てている。

ここ数年、テック業界では次なる革命としてAIが注目を集め、ディープラーニングやディープニューラルネットワークという言葉がバズワードになった。人間の脳の構造を模倣するそれらの技術は、画像や音声認識の分野に革命をもたらし、医療や自動運転、ロボティックス分野に変革をもたらそうとしている。

しかし、ズィーラーの野心的試みの前途には巨大テック企業の資本力の壁がそびえている。AI分野の人材獲得戦争はあらゆる大学の研究機関を食い尽くし、全てのAI関連スタートアップを買収する動きに出た。グーグルはこれまで少なくとも11社のAI関連の買収を行っており、そのうちの2社だけで10億ドル以上の金額を支払った(DeepMindとapi.aiの2社)。

Clarifaiの競合だった企業は今ではほぼ全て大手に買収された。アマゾンはOrbeusを、セールスフォースはMetaMindを、IBMはAlchemyAPIを傘下に収めた。ClarifaiはAIによるイメージ解析分野で現在アマゾンやグーグル、IBMやマイクロソフトに対抗し得る、おそらく唯一のスタートアップ企業と言える。Clarifaiの関係者の証言によると、同社はこれまで複数の数百万ドル規模の買収提案を断ってきた。ズィーラーは「今後も会社の独立性を保ちたい」と述べている。

グーグルにデータを吸い取られる恐怖

ズィーラーはClarifaiをグーグルやマイクロソフトの規模にしたいとは考えていない。しかし、AIの領域で中立的ポジションをとることは非常に重要だと考えている。AI分野のスタートアップは蓄積したデータをグーグルやアマゾン等の巨大企業に吸い取られる恐怖にさらされている。

写真共有サービスのPhotobucketは現在Clarifaiのサービスを利用中だが、同社の幹部は「グーグルの解析サービスを利用する場合は自分たちのデータを結局、グーグルのシステムのトレーニングに利用されてしまうことを考えたほうがいい」と語る。Photobucketはかつてグーグルの画像解析サービスを用いていたが、その後、グーグルは自社の写真アプリにPhotobucketの競合となる機能を盛り込んだ。

ズィーラーによると、これは巨大テック企業の終わりなき拡大への欲望の一例にすぎない。「グーグルのサービスを使っていると、ある日突然、自社の競合となるサービスをグーグルが立ち上げることになる。Clarifaiはそんなやり方をしたくない」

現在30歳のズィーラーはカナダのウイニペグから40マイルの小さな町で育った。AI領域にのめり込むきっかけになったのは、トロント大学の学生時代に見たビデオだった。人間が撮影した動画のように思えたが、実際は人工知能が生成した映像だった。

当時、ズィーラーはプログラミングの基本を修得したばかりだったが、本気で何かをやろうとは思っていなかった。「でも、その動画を見た時に頭をぶん殴られたような気分になった。人間があれこれ指図するのではなく、コンピュータが蓄積されたデータから自分で動画を生成するのを見て、ここにはもっと学ぶべきことがあると思った」

ズィーラーはその後、ニューラルネットワークの権威として知られるGeoffrey Hintonが運営するラボに向かった。そこでズィーラーはAIを用いた鳩の行動の分析を行い、最初の論文を執筆し、トップの成績で大学を卒業した。

その後、トロント大学で出会った友人の紹介で、ニューヨーク大学の博士課程に進んだ。友人はディープラーニング分野のパイオニアとして知られ、現在はフェイスブックのAI部門を率いるYann LeCunのもとで働いていた。その後、グーグルでインターンを行い、後にグーグルブレインの部門長を務めるJeff Deanとつながりを持つことになった。

ズィーラーは2013年の11月にClarifaiを創業し、この分野で最も権威あるコンテストとされるImageNetに応募し、その実力を認められた。創業から数ヶ月の間、ズィーラーは一人でディープラーニング技術を磨き上げ、その技術を商用化可能なレベルに仕上げた。自室のサーバにクローラーを仕込み、ウェブ上の画像データを収集しアルゴリズムを鍛え上げた。

サーバが熱を持ち、真冬にアパートの部屋の全ての窓を開けて外気を取り入れたこともあった。2014年の春になり最初の社員を採用し、ニュージャージーのデータセンターにサーバを移設し事業を拡大。10月にサービスの一般公開に漕ぎつけた。

Clarifaiの最初の顧客となったのは結婚式サービスのStyle Me Prettyという企業だった。同社は数千に及ぶ結婚式の写真にマッチする広告を同社のウェブサイトに掲載している。

評価額は約130億円

2015年になりClarifaiはユニオン・スクエア・ベンチャーズの主導で1000万ドルを調達。出資元にはクアルコムやエヌビディア、さらに興味深いことにグーグル傘下のVCも加わった。その翌年、Menlo Venturesが主導する調達ラウンドでさらに3000万ドルを調達。当時の評価額は1億2000万ドル(約136億円)だった。

「テック業界の巨大企業らも同じ試みを行っている。しかし、彼らにとって最高の画像認識技術を生み出すことは、生きるか死ぬかの問題ではない」と、Menlo Venturesの関係者は述べる。

Clarifaiは現在55名を雇用している。昨年はグーグルの企業セールス部門の社員を引き抜き、営業部の主任ポジションに就けた。調査企業CapTechのデータによるとClarifaiは画像認識分野でアマゾンやグーグル、マイクロソフトと拮抗し、時に上回る実績をあげている。しかし、AI分野で今後の拡大を見据え、スタートアップが人材をつなぎとめるのは容易なことではない。

今年2月、Clarifaiはグーグルで長年、AI部門の研究者を務めたAndrea Fromeを招き入れた。しかし、わずか4ヶ月でFromeは離職した。ズィーラーはこの件に関し、多くを語らないが、優先すべき課題に関する意見の不一致があった事は認めた。Clarifaiが直面している課題の一つは、アルゴリズムを鍛えるために必要なビッグデータへのアクセスの確保であり、この点で同社は大手企業に遅れをとっている。

Clarifaiが直近で力を注ぐのは大手が注力するクラウドのデータではなく、スマートフォンをベースとした画像のAI解析だ。先日のフォーブスの取材当日、サンフランシスコのホテルのロビーでズィーラーは画面が割れたiPhone 6を手に「この端末のカメラは周囲にある全ての物体を認識できる。室内の家具や道路のクルマや歩行者等を全てデータとして取得する」と述べた。

ディープラーニングを人々が肌身離さず携帯するスマートフォンから広げていこうというズィーラーの情熱には注目すべきものがある。「自分たちが今やっている事は、今後AIが果たすべき仕事の氷山の一角に過ぎない」とズィーラーは話した。

Aaron Tilley