米マイクロソフトは、2024年5月6日に発生したMicrosoft 365の大規模障害について、原因がAzure Front DoorインフラのCPU異常使用に起因すると報告した。TeamsやSharePoint、OneDriveなどが影響を受け、Downdetectorには数千件の不具合報告が寄せられた。
障害発生当初、マイクロソフトはAFDのルーティング設定やパフォーマンス劣化を疑い、代替インフラへのトラフィック切替と復旧措置を実施。最終的にはCPU使用率の異常が判明し、対応策の検討が継続されている。
今回の障害は北米地域を中心に発生し、同社はMicrosoft 365管理センターにて「重大なサービス障害」と位置づけた。3月および4月にも類似事象が報告されており、クラウド基盤の信頼性確保が喫緊の課題とされる。
広範な影響と技術的背景 Microsoft 365障害の全容

2024年5月6日に発生したMicrosoft 365の障害は、Teamsを中心に、SharePoint Online、OneDrive for Businessなど主要クラウドサービスに波及し、北米全域の企業活動に支障をもたらした。
マイクロソフトのステータス通知や管理センターによれば、本事案は「重大なサービス障害」として分類され、影響の深刻さが際立った。発生から2時間以上にわたり、多数のユーザーが接続不良や機能停止に直面し、Downdetectorでは数千件に及ぶ障害報告が集中した。
障害の要因とされたのは、マイクロソフトのグローバルCDN基盤であるAzure Front Door(AFD)インフラにおけるCPU使用率の異常上昇である。同社はAFDのルーティング構成とネットワークテレメトリの分析を通じて原因究明を進め、特定領域において性能が許容基準を下回っていた事実を明らかにした。
これにより、トラフィックは代替インフラへ再配分され、一部サービスの復旧が図られたが、完全な正常化には至っていないと見られる。
マイクロソフトは現在、再発防止を目的とした技術的措置の検討を継続しており、最終的なインシデントレポートの提示を予定している。特にAFDのようなコンテンツ配信基盤におけるCPU負荷管理は、今後の安定運用における重要な論点となる。
頻発する障害が示すクラウド基盤の脆弱性と運用課題
本件に先立ち、マイクロソフトは2024年3月から4月にかけて、Teams、Exchange Online、Outlookなどの基幹サービスにおいて複数の障害を相次いで経験している。通話接続の失敗、メールボックスへのアクセス不能、送受信の遅延や障害が複合的に発生し、ユーザー体験に深刻な影響を与えた。さらに、Exchange Admin Center(EAC)の接続障害も重なり、企業のIT運用部門における可用性の懸念が高まっていた。
クラウドサービスの信頼性は、企業にとって業務継続性や対外的信用と直結する経営リスク要因である。特にMicrosoft 365のように多機能を統合したプラットフォームでは、一部サービスの障害が他機能にも波及する可能性が高く、影響範囲の広さがリスク評価の焦点となる。加えて、インフラ全体のリソース使用状況に起因する障害は、単一の技術的瑕疵に留まらず、設計・運用方針にまで遡って対処を迫られる。
今回の障害対応に見られるように、迅速なルーティング変更や緩和措置の導入は短期的な影響軽減には有効であるが、根本的な耐障害性の確保には至っていない。今後は、AFDを含む基盤技術の性能監視体制の強化と、障害発生時の事後対応プロセスの透明化が、信頼回復の鍵を握ると考えられる。
Source: BleepingComputer