グーグルが構築した大規模システムの現実、そしてデザインパターン（1）～MapReduce編

2010年8月24日

グーグルが「Evolution and Future Directions of Large-Scale Storage and Computation Systems at Google」（グーグルにおける、大規模ストレージとコンピュテーションの進化と将来の方向性）という講演を、6月に行われたACM（米国計算機学会）主催のクラウドコンピューティングのシンポジウム「ACM Symposium on Cloud Computing 2010」で行っています。

グーグルはどのようにして大規模分散システムを構築してきたのか、そして、そこからどのようなことを学んだのかが語られていますし、後半では大規模分散システムのデザインパターンという、非常に興味深いノウハウも公開している、非常に情報量の多い講演です。

その講演の内容を、全部で4つの記事、MapReduce編、BigTable編、教訓編、デザインパターン編に分けて、紹介したいと思います。

講演を行ったのはグーグルのJeffrey Dean氏。1999年にグーグルに入社し、現在はSystems Infrastructure Groupのフェローです。

信頼性はソフトウェアによって実現される

グーグルのコンピュータ環境のシステムやソフトウェアとその革新について紹介しよう。また、大規模分散システムのための技術についても説明していく。

これがオレゴン州ダレスにあるグーグルのデータセンター。ここで多くのサーバが稼働している。

サーバにはコモディティハードウェアが使われ、ハードディスクかFlashドライブを内蔵している。これを、各サーバへのスイッチを備えたラックに収納する。ラックそれぞれはセントラルネットワークへのアップリンクを持つ。

しかし、これらのリアルなマシンは、リアルな問題を引き起こす。それは、ファイバーケーブルが切断されるといったデータセンター間ネットワークの問題から、ラックやルータの故障、各サーバの故障まで、さまざまなレベルで起きる。

そこで、重要なポイントは「信頼性はソフトウェアによって実現される」ということだ。

グーグルのクラスタで実行されている処理とは？

グーグルのクラスタソフトウェアについてみていこう。

クラスタは数千台のマシンで構成されている。サーバOSはLinuxで、そのうえに分散ファイルシステム（Google File Systemもしくは次世代のGFSであるColossus）のためのチャンクサーバ、ジョブのためのスケジューリングスレーブが稼働している。これらは、スケジューリングマスターとGFSマスターによってコントロールされている。