IBMは2000年代にワトソンを開発して以来、AI業界を牽引してきた。IBMはディープラーニング用のソフトウェアツールキット「PowerAI」を発表し、AIシステムを一から開発しなくとも、ニーズに合わせて仕様をカスタマイズできるソリューションを提供している。

IBMリサーチは8月8日、このPowerAIの機能を拡張する分散深層学習(DDL:Distributed Deep Learning)ソフトウェアをリリースした。これは、ディープラーニング分野において、過去数ヶ月間で最もインパクトの大きいニュースだ。

ディープラーニングはこの数年で爆発的に普及し、あらゆる場面で活用されている。一方で、ディープラーニングを活用する上での障害がスケーラビリティの問題だ。

今日のAIサーバの大半はシングルシステムで、多数のサーバによる並列処理はあまり用いられていない。一般的なオープンソースのディープラーニングフレームワークは、サーバの台数を増やすと処理時間が長くなることがボトルネックとなってきた。

この問題を解決するのがDDLだ。IBMの独自のメソッドを用いて開発されたDDLライブラリでは「TensorFlow」や「Caffee」、「Torch」、「Chainer」など主要なオープンソースのAIフレームワークの利用が可能だ。DDLを用いることにより、数百基のGPUを搭載した多数のサーバを使ってスケール化を図ることが可能になり、従来に比べてトレーニング時間が大幅に短縮された。

これまでは、IBMの「ResNet-101」モデルを使って大量のデータセット(「ImageNet-22k」の画像データなど)を学習させる場合、「NVIDIA P100 GPU」搭載のシングルパワーの「Minsky」サーバを用いて、16日間が必要だった。

深層学習の時間を大幅に短縮

IBMはDDLを「ディープラーニングのジェットエンジン」と呼んでいるが、これは実に的確な表現だ。同社は同じトレーニングにDDLを用いたところ、64台のMinskyサーバに搭載された256基のNVIDIA P100 GPUアクセラレータを使い、7時間で完了することができたという。

IBMはディープラーニングを根本的に変える武器を手に入れたと言える。時間が短縮されただけでなく、学習結果も大幅に向上した。IBMが7時間で達成した画像認識率は33.8%で、これまでの記録だったマイクロソフトが10日間で達成した29.9%を大幅に上回った。

IBMリサーチはDDLのベータ版の提供を開始し、先頃リリースされたPowerAIのバージョン4に対応させた(既にTensorFlowやCaffeが利用でき、TorchやChainerには近日対応の予定)。DDLのリリースにより「Power System」に強力な新ツールが加わったことになる。Power Systemは、一つのプラットフォームでPCI express、CAPI、NVLinkをサポートするツールで、言わば「アクセラレーションにおけるスイス・アーミーナイフ」とも呼べる。

DDLのもう一つの特徴は、オンプレミス環境(自社内での運用)だけでなく、クラウドプロバイダーのNimbixを通じてクラウド上でも利用できることだ。開発者はNimbix上かIBMのPower SystemサーバでDDLのベータ版を試してみることができる。

この画期的なテクノロジーがグーグルやフェイスブックではなく、IBMから提供されることは非常に興味深い。IBMはエンタープライズ領域だけでなく、ディープラーニングの分野においても主要なプレーヤーであることを証明した。

DDLとOpenPOWERは、学習時間を大幅に短縮させながら精度と効率性を向上させることを実現し、IBMにとっては大きな差別化要因となるだろう。DDLがディープラーニングのボトルネックを解消したことにより、今後ディープラーニングが飛躍的に普及する可能性がある。

Patrick Moorhead