NTTドコモが、10月14日に発生した通信障害に関する記者会見を開催。ドコモの田村穂積副社長、常務執行役員 ネットワーク本部長の小林宏氏、サービス運営部長の引馬章裕氏が障害について謝罪するとともに、障害の原因や今後の対策について説明した。

 通信障害は10月14日17時頃に発生し、19時57分に一部回復。4Gと5Gについては、15日5時5分に復旧したが、3Gについては現在も復旧対応中としている。

●通信障害の経緯

 障害の経緯は以下の通り。10月14日未明に、タクシーの電子決済や自動販売機向けIoTサービスの加入者/位置情報サーバ(HLR/HSS)を、旧設備から新設備に切り替えたところ、不具合が確認されたという。具体的には、海外で稼働しているIoTモジュールと通信できないことが、いくつかの国の事業者で起きたという。

 そこで、加入者/位置情報サーバを旧設備に切り戻し、IoT端末に対して旧設備へ位置登録を促したところ、大量の位置情報が再送されて旧設備の加入者/位置情報サーバが輻輳し、これがドコモのネットワーク全体に波及。IoT端末だけでなく、一般ユーザーのスマートフォンやケータイでも、音声通話とデータ通信が利用しにくくなった。

 障害の対象は音声通話とデータ通信。音声通話は、信号交換機と音声交換機が輻輳することで利用しにくくなった。データ通信は、位置情報の更新が必要とされる移動をした場合に、信号交換機の輻輳によって位置情報が更新できず、利用しにくい状況となった。

 障害発生後、17時37分から最大100%のネットワークコントロールを実施。18時9分からネットワークコントロールを順次緩和し、19時57分に緩和完了した。ここで障害の一部は復旧したが、その後、通話やデータ通信の利用が増えて混み合うことで、一部のユーザーは依然としてつながりにくい状況が続いていた。「何回も接続しようとしてトラフィックが通常の3倍増えたことが、(障害の)長引いた事象になった」と田村氏は説明する。

 一方、14日20時頃に、一部メディアで「ドコモの通信障害が完全復旧した」とする報道があり、これを知ったユーザーの多くが通信や通話をしようとしたことが、障害を長引かせたとみる向きもある。ドコモ側は、21時5分にお知らせで一部復旧したことを伝えていたが、一部メディアに対しての情報伝達で手違いがあった可能性がある。

●影響規模は不透明

 今回は約200万ユーザーが位置登録不可になり、圏外の表示になったり、アンテナピクトが立たなくなったりした。ただし、位置登録ができた場合でも、ドコモのネットワークが混雑していたため、通信しにくい状況となった場合があった。

 全ドコモ契約者のうち、どれだけのユーザーが障害発生時に通信をしていたかが分からないため、正確な影響規模は算出できないが、対前週比で音声通話は約15%、データ通信は約4%減少したという。「パケット通信の障害は、位置情報の更新が必要な場合に遭遇する。ドコモ全ユーザー8000万人が遭遇したわけではないが、日本全国、位置情報登録不可が200万なので、十分影響があったと認識している」(田村氏)

 電気通信事業法では、緊急通報を取り扱う通信事業者のサービスで、1時間以上にわたり障害が起き、3万人以上に影響を与える場合は「重大な事故」に該当し、総務大臣への報告が義務付けられている。今回の障害が重大な事故に該当するかについて、田村氏は「総務省側が判断すると思っている」と述べるにとどめた。

●障害の再発防止策

 障害の再発防止策として、通常運用と異なる状態での処理能力を再確認し、確認した処理能力を踏まえた適切な切り替え手順の見直しを行う。これらは10月下旬に完了する予定。「通常とは異なる状態」とは、加入者/位置情報サーバを新設備から旧設備に移したときに、旧設備にIoT端末の位置情報を登録すること。「こういった動きは通常のネットワークではあり得ない」(引馬氏)

 「今回のような切り戻しが起きる場合は、シミュレーションを実施して準備をしていたが、結果的に想定した以上のトラフィックが発生したことで輻輳が発生した」と田村氏。引馬氏も「われわれの処理能力の見積もりが甘かった」と振り返る。サーバの切り替え対象となったIoT端末は約20万に及ぶそうだが、旧設備は仮想化できていないため、仮想化済みの新設備よりも処理能力が低いことも要因だったようだ。

 一部で障害が続いて3Gについては「4Gや5Gと比較して、昨日(14日)ほどご迷惑を掛ける状況ではない。状況としては沈静化している」(引馬氏)とのこと。