Microsoft Azure米国中南部リージョン、落雷などで冷却が失われ自動シャットダウンが発動。24時間以上障害から復旧せず
Microsoft Azureの米国中南部リージョン(South Central US)では、Azure Virtual Machines、Azure Storage、Azure SQL Databaseなど主要サービスを含む多くのサービスが、日本時間9月4日から24時間以上、障害によって正常に稼働していない状況が続いています。
障害の第一報のツイートは、日本時間9月4日午後8時12分。Microsoft Azureの米国中南部リージョンが障害に見舞われ、調査中とのステータスが報告されました。
Engineers are aware of an issue affecting resources in South Central US. For continued updates please visit the Azure status page at https://t.co/Dw19fIoS5H
— Azure Support (@AzureSupport) 2018年9月4日
その後の調査によると、原因は米国中南部リージョンが荒天に見舞われ、近くに落雷したことなどによって電源に異常を来し、それが冷却システムへ影響。
冷却が失われたことでデータセンター内のサーバやストレージなどのハードウェアとデータを守るために自動的にシャットダウンプロセスが起動したとのことです。
Datacenter Dynamicsの記事「Microsoft Azure suffers outage after cooling issue」では、この障害の影響は米国中南部リージョンにとどまらず、Azureのステータスページまで一時的にエラーで表示できなくなったと報じられました。
第一報から約9時間後、日本時間9月5日の午前5時16分のツイートで、データセンターの電源を復旧。主要なネットワーク機器が稼働し、サービスが復旧しはじめたと報告されました。
Engineers have restored power to the datacenter and recovered a majority of network devices. Some services are starting to see signs of recovery, mitigation efforts continue. Updates: Portal - https://t.co/66mR6nPbwY Status Page - https://t.co/Dw19fIGsXf and/or Twitter. pic.twitter.com/dkmT24IVfr
— Azure Support (@AzureSupport) 2018年9月4日
日本時間9月5日午後2時50分には、ストレージ関連の復旧が行われつつあると報告。
As storage-related mitigation progresses, Engineers are in an extended recovery phase. Mitigation is reported for Azure Active Directory and efforts continue for other storage-dependent services. Updates: Portal - https://t.co/p4SEbHGJuY | Status Page - https://t.co/n4GwvG5n3U pic.twitter.com/k2GMQ29bIG
— Azure Support (@AzureSupport) 2018年9月5日
しかしそこから10時間以上経過した原稿執筆時の9月6日午前1時現在も完全復旧ならず、復旧作業中です。
あわせて読みたい
さくらインターネット石狩データセンターの非常用発電装置は48時間の稼働を想定、今後の燃料調達は調整中(更新:電源供給が約50%再開)
≪前の記事
AWS日本法人、クラウド初心者向けにマンガの連載をはじめる。英語版も登場予定