NTTドコモは11月10日、10月14日に発生した大規模な通信障害について、対応状況を発表した。この通信障害は、新設したIoTサーバへの切り替え工事中での作業手順の認識齟齬(そご)により、IoT端末から大量の位置情報登録信号が発生。ドコモ回線にアクセスが集中し混雑するネットワークの輻輳(ふくそう)が起き、全国のドコモユーザーに影響を与えた。

 障害を起こした責任として、井伊基之社長など幹部8人が役員報酬を自主返上する。総務省は是正に向けた行政指導を実施するなど、対応を検討するとしている。

 今回ドコモは、通信機器が圏外となり、全ての通信が利用できなかった状況と、音声通話やデータ通信などが利用しづらい状況の2つに分けて概要を説明。大量の位置情報登録信号を制御するために、最大で100%の通信制限を実施したフェーズを前者、制限解除後の通信によって生じた通信の輻輳を後者に分けた。

●影響を受けたユーザー数は計1290万人ではない?

 パケット通信の速度低下や音声通話がつながりにくいなど、ドコモ回線が利用しづらい状況は14日午後4時54分から15日午後10時まで続き、影響規模は音声通話で約460万人、データ通信で830万人以上に影響を与えたという。

 各数値には、通信が利用できなかったユーザー約100万人も含まれる。音声通話とデータ通信それぞれで影響人数を発表していることから「延べ1290万人」とはいえるものの、実際には音声とデータ両方の障害を受けた人もいれば、片方だけの影響を受けた人もいるため、「合わせて1290万人が影響を受けた」とまではいえない。

 同社の引馬章裕サービス運営部長は「個人別の障害状況を把握することはできないため、これ以上の具体的な数値は算出できない。それぞれに重複があるため、単純に足せばいいわけではないため、このような表現にしている」と述べた。

 通信しづらい状況が3G回線で特に長引いた理由について、引馬サービス運営部長は「4Gや5G回線も利用しづらい状況だったため、3G回線に通常より多く人がいた。4Gなどが回復した後は徐々に人が戻っていったため、それに時間を要した。4Gや5Gを優先して復旧していたわけではなく、ネットワーク全体の復旧に努めた結果、このような形になった」と説明した。

●石川県や奈良県など5県で圏外にならなかった理由

 全ての通信が利用できなかった状況は14日午後5時37分から午後7時57分の2時間20分の間に生じ、石川県と富山県、福井県、奈良県、和歌山県を除く全国の約100万人のユーザーに影響を与えたという。

 石川県などの5県が影響を受けなかった理由について、全国で位置登録信号を制御するために実施したネットワークコントロールの100%制限をこの5県では行わなかったためだと同社常務執行役員の小林宏ネットワーク本部長は説明する。

 「当社では、ネットワークコントロールを東日本と西日本に分けて実施した。やり方としては、東日本なら東から西へ、西日本では西から東へと端から順に実施していたのだが、この5県に到達するころには規制の効果が現れ、輻輳が収まっていた。そのため、コントロールを緩和したため5県では通信が利用できない状況にはならなかった」(小林宏ネットワーク本部長)

 このように理由を話し、通信しづらい状況とは別に、石川県などの5県では通信が利用できない状況は発生していない認識であると考えを述べた。

●音声通話とデータ通信で、影響規模の表記が揺れるワケ

 スマートフォンやIoT機器など端末が通信するためには、利用効率の観点から基地局に端末の位置情報を登録する必要があり、通信の際には常に位置情報をサーバに発信したのち、通話やデータ通信が利用できる。

 これを踏まえて同社は、各端末の通常稼働時との位置登録情報の差分から影響を受けたユーザー数を算出したという。圏外となり利用できなかったユーザー数は、ネットワークコントロール100%規制時の位置登録数差分の最大時から算出した結果、約100万人と分かったとしている。

 音声通話がつながりにくかったユーザー数は、通信稼働時と障害のあった約29時間のコール数の差分を一人当たりの平均コール数で割り、影響規模は約460万人と算出。データ通信に関しては、通常稼働時の4Gサービスの位置登録数差分の最大値から計算し、830万人以上のユーザーに影響があったと説明する。

 音声通話と異なり、データ通信の影響規模は830万人「以上」と表記されている。この理由について「位置登録数差分の最大値が830万人であると分かった。ここから影響を受けたユーザーの数は減っていくが、障害中に4Gから3G、3Gから4Gへと通信回線が変わっているユーザーもいるため、それを含めると830万人以上に影響を与えたといえる」と引馬サービス運営部長は説明する。

●原因は工事手順の齟齬 再発防止策を立て、22年春に再度工事

 同社はこの障害が起きた原因について、工事中に同社と連携し作業していた外部組織と、サーバの切り戻し手順の細部に認識の齟齬があったためだと改めて説明する。「サーバの位置情報を制御する交換機という部分があり、その数の認識に作業員の中で齟齬があった。それが尾を引き、障害の発生まで至った」(小林ネットワーク本部長)

 そのため同社では認識の齟齬が起こらないような仕組みの構築をすることで対策を講じるとコメント。手順の見直しや新たなソフトウェアを導入するなど、工事中の対策から通信障害発生した際に影響を長期化させないことや情報発信の方法まで、計6つの再発防止策を発表。22年1月下旬までに実施するとしている。

 障害が発生した原因となった工事は、再発防止策を導入し、事前のテストを十分に行ったうえで、22年春までに再度実施するという。

【修正履歴:2021年11月10日午後7時30分 タイトルと本文の表記を一部修正しました】