ファーストサーバの「Zenlogic」、7月9日夜10時20分に高負荷緩和でサービス一時再開。ただし障害は未解決のまま。利用者はいまのうちにバックアップなど自衛手段を
ストレージ障害に対するメンテナンスによって7月6日夜からメンテナンスによるサービス停止をしていたファーストサーバのレンタルサーバサービスZenlogicは、7月9日夜22時20分に状況を報告し、「一時的に高負荷状態の緩和を確認しましたので、メンテナンスを終了し、サービスをご利用いただける状態にさせていただきました。」と、サービスの再開を発表しています。
(追記: 2018年7月10日 16:25 メンテナンス完了が報告されました)
ただし「再び高負荷状態になった場合には、サービスのご利用を停止させていただく場合があります。現在も、原因・対応方法の調査、及び、別環境、そのほかの代替手段を準備を進めております。」と現在は経過観察中とし、障害が解決したわけではないことを示しているため、明日10日火曜日の朝にトラフィックなどが増化した場合、再びサービスが停止する可能性があるようです。
そのため、利用者はいまのうちにサーバに保存したデータをバックアップし、必要に応じてほかのサーバへ移行するなどの自衛手段をとる検討をすべきでしょう。
ファーストサーバは、サーバの移設方法について解説ページを用意しています。
関連記事
ファーストサーバのレンタルサーバ「Zenlogic」、金曜夜からの全面サービス停止が解けず、いまだ停止中。ストレージ障害のためのメンテナンスで(追記あり) - Publickey
障害の原因が解決できず、振り出しに戻ったのではないか?
なぜこれほど問題解決が長期化しているのでしょうか。
同社は障害の原因を「冗長構成しているストレージシステムにおいて、データ入出力の処理が一部のシステムに偏ったことにより、高負荷が発生。該当ストレージシステムの再起動が発生し、サービスが断続的に利用できない状態が発生しました」としており、これを修正するためにストレージシステムの増強やパラメータの調整などを繰り返し行ってきたことを報告してきました。
そして障害の根本的な解決を目指して6日金曜夜から9日朝までの予定で、長時間のメンテナンスに入ったわけです。
しかし7月9日月曜日の午前9時の報告では「サービス再開処理後、再度の高負荷発生を確認いたしましたため、大変申し訳ございませんが、不本意ながらメンテナンスを延長させていただくこととなりました」と報告。メンテナンス期間が延長されました。
これはおそらく、同社が障害原因だと想定した技術的要因に対して対策を行ったものの、残念ながらそれでは障害が解決できなかったことを示しているのではないかと推察されます。
もしかしたらこの時点で、障害対応は振り出しに戻ってしまったのかもしれません。
その2時間半後の9日11時30分には、前述した「調査と平行して、基盤提供元のヤフー株式会社とともに、別基盤の構築準備に着手いたしました」と報告されているのは、障害原因が分からなくなってしまったために、まっさらな状態からZenlogicを作り直した方が早いかもしれない、という判断がなされたからではと推察できます。
その数時間後の9日15時に「現在も、原因・対応方法の調査、及び、別環境、そのほかの代替手段を準備検討しておりますが、時間を要しており、本日中に目途をお伝えするのは厳しい状況でございます」と報告されていることも、この時点で解決のめどが立っていない可能性を示しており、この推察を補強できると思います。
現場で障害対応にあたっているエンジニアの方々は大変な思いをしているとは思いますが、いずれにせよ一刻も早い復旧と原因究明が待たれます。
関連記事
あわせて読みたい
Chromeの拡張機能で従業員のMacやPCを集中管理。Googleが軽量のMDMソリューション「Endpoint Verification」発表
≪前の記事
ファーストサーバのレンタルサーバ「Zenlogic」、金曜夜からの全面サービス停止が解けず、いまだ停止中。ストレージ障害のためのメンテナンスで(追記あり)