「Google Appsに計画停止はない」 グーグル、SLAから計画停止を削除
「他社と違い、私たちはアップグレードやメンテナンスのためであっても計画停止はしません。そのため、SLA(サービスレベル契約書)から計画停止を削除しました」。グーグルは1月14日に公開したブログのエントリ「Destination: Dial Tone -- Getting Google Apps to 99.99%」で、このように書き、SLAの改善を行ったことを明らかにしました。
Unlike most providers, we don't plan for our users to be down, even when we're upgrading our services or maintaining our systems. For that reason, we're removing the SLA clause that allows for scheduled downtime.
これまでのSLAでは、あらかじめ予定されていた計画停止はダウンタイムとしてカウントしないとされていましたが、今後はすべてのダウンタイムがカウントされることになります。
We are the first major cloud provider to eliminate maintenance windows from their service level agreement.
私たちはメンテナンス時間をSLAから取り除いた最初のメジャーなクラウドプロバイダになりました。
グーグルによると、2010年のGmailの可用性は99.984%で、これは1カ月あたり7分間のダウンタイム。このダウンタイムには数秒のディレイなどもすべて含んだ計算とのこと。
データセンターの障害にも耐える
一般的にサーバの運用では、バックアップやOSへのセキュリティパッチの適用、アプリケーションのバージョンアップなどの場面で、サーバを停止して行う作業が必ず発生します。そのためにサーバを停止することを「計画停止」と呼び、突発的なトラブルによる停止と分けて考えます。
ところがグーグルは今後のGoogle Appsについて、計画停止はない、もしくは利用者に影響しないように行うことを今回表明し、他社との差別化としたのです。
グーグルは昨年の前半にGoogle App Engineの利用拡大に追いつけていないと告白し、データセンターのトラブルにも何度か見舞われていました。
しかし今年に入り、Google App Engineにおいてたとえデータセンターに障害が発生しても、ほとんどの場合問題なく処理を続けられる新データストア「High Replication Datastore」を発表、そして今回のGoogle Appsの計画停止をSLAから削除するなど、可用性について大きな自信を見せています。
Google App Engineの「High Replication Datastore」は、複数のデータセンター間でPaxosによる同期をとってデータをレプリケーションし、障害時にはデータセンターごと切り替える技術とされています。こうした可用性を支える新たな技術が、グーグル内部で確立したことがその背景にあるのではないでしょうか。