クラウド事業者がテクノロジーリーダーになる理由~クラウドコンピューティングの雲の中(その1)。NII Open House 2013
クラウドはどのような仕組みで構成されていて、この先どう進化していくのでしょうか。6月14日に開催された国立情報学研究所主催のオープンハウス「NII Open House 2013」において、国立情報学研究所 佐藤一郎教授が「クラウドコンピューティングの雲の中」と題した講座を行いました。
佐藤教授は、分散データストレージが抱える整合性の課題の解決方法を中心に、クラウドの技術的な構成と技術の発達の方向について、具体例を交えつつ解説しています。本記事では、その講座の内容をダイジェストで紹介しましょう。
クラウドコンピューティングの雲の中
国立情報学研究所 佐藤一郎教授。
今日はテクニカルなところ、クラウドコンピューティングを理解する上で重要なところをお話ししようと思います。また、クラウドコンピューティングに関する最新の潮流についても触れようと思います。
クラウドコンピューティング(以下クラウド)とは、コンピュータやストレージを必要なときに必要なだけ使えるシステムです。
クラウドというと未来の技術というイメージが強かったのですが、いまではオンラインゲームや企業の基幹業務などにまで広く使われる時代になっています。
その割にはクラウドの中身はあまり知られていません。例えば皆さんがPCを使うときには、プロセッサやメモリなどの基礎知識があって、それがPCを使うときに間接的に役立つことが多いでしょう。
クラウドがこれから一般的になれば、その基礎知識があることがすごく重要になると思います。今日はそのあたりを中心にお話ししたいと思います。
クラウド事業者がテクノロジーリーダーとなっている
これはGoogleのクラウドの中、データセンター内部の写真です。こうした大きなデータセンターを作り、10万台オーダーのサーバとネットワークと冷却装置などをそこに入れる、まるで工場のようになっています。
なぜサーバがいっぱいあるのかというと、経済合理性が理由です。クラウドは民間企業が運営しているので経済合理性が優先されます。いまたくさん計算ができるいちばん経済的な方法は、値段が高いけれど高性能なスパコンを使うよりも、安くなったサーバをたくさん使った方がいいと考えられています。
しかも単にたくさん使うのではなく、徹底的な集中管理がされています。例として、AmazonやGoogleやマイクロソフトやFacebookは、管理者一人で1万5000台以上のサーバを管理しているといわれています。日本国内のデータセンターは一人で100台以上見ているところも少ないと思うので、海外の大規模データセンターは圧倒的に効率的になっているのです。
2011年のGoogleの設備投資額は34億ドル、日本国内でいちばんサーバを売っているのは富士通で、売上額は13億ドルです。Googleの設備投資の半分がサーバへの投資だとしても、富士通の売上げより大きい。
しかもクラウド事業者は自分たちでサーバやネットワーク機器の設計を始めていて、デルやHPといったメーカーを通さずに、中国や台湾のOEM、ODMに直接発注しています。
またXeonプロセッサをインテルにいちばんたくさん発注しているのはGoogleだと言われていて、実際にインテルはGoogle向けに特注Xeonを提供しています。
つまりクラウド事業者がサーバの大規模メーカーになっていて、その分野のテクノロジーリーダー化しているのです。
クラウドのコアは分散データストレージである
これは典型的なクラウドの構成図です。クラウドは大きく、下側の分散データストレージと、上側のアプリケーション部に分かれています。つまり分散データストレージが基盤になっていて、その上にIaaSだったりサービスなどが動いている。
もう1つの特徴として、アプリケーションが保護ドメインと呼ばれる箱の中で動いています。これはセキュリティを守るためで、アプリケーションがほかのアプリケーションと直接通信することはなく、つねに分散データストレージを介して通信をする。つまり、分散データストレージがクラウドのコアになっています。ここをきっちり理解しないと、上の部分は理解できません。
例えば、Amazonがクラウドで最初に提供したのはAmazon S3で、Amazon EC2はそのあとでした。つまりAmazonでも分散データストレージがコアで、その上はアプリケーションに過ぎないということです。
クラウドの中の物理的な構成。サーバ、ラック、クラスター、データセンターの4つの構成単位があります。そしてどの構成単位においても極力均質化する。そうすると管理コストが下がるからです。
次にネットワーク構成を見てみましょう。このあたりはあまり(公開されている)情報がないので想像で書いていますが、ファットツリーという構造になっています。特徴は、任意のサーバ同士が通信するときには、必ず2つ以上の経路がある、ということです。
複数の経路があるのは、途中のネットワーク機器などが故障したときに迂回できるという理由のほかに、通常でも複数の経路を使って帯域をかせぐということをしています。
データセンターも、自然災害や大きな停電などで壊れることがあります。それに備えて複数のデータセンターが世界中に作られています。それがネットワークでつながれていて、そしてこのネットワークも多重化されています。
つまりクラウドとは、地球規模の超巨大コンピュータだといえるのです。
クラウドの中のネットワークはSDN(Software-Defined Networking)を駆使している事業者が多い。SDNの代表的な技術にOpenFlowがありますが、OpenFlowを初めて大規模に導入したのはGoogleだと言われています。
なぜOpenFlowを採用するのかというと、データセンター内でネットワークが多重化されているという理由のほかに、集中管理ができる点。これもひとえに管理コストを下げたいためです。
≫次の記事「分散ストレージの整合性をいかに解決するか。プライマリ-バックアップ方式と分散コミット~クラウドコンピューティングの雲の中(その2)。NII Open House 2013」に続きます。
- クラウド事業者がテクノロジーリーダーになる理由~クラウドコンピューティングの雲の中(その1)。NII Open House 2013
- 分散ストレージの整合性をいかに解決するか。プライマリ-バックアップ方式と分散コミット~クラウドコンピューティングの雲の中(その2)。NII Open House 2013
- チップスケール原子時計やSoCがこれからクラウドを変えていく~クラウドコンピューティングの雲の中(その3)。NII Open House 2013
関連記事
2年前の2011年、佐藤教授のクラウドに関する講演。
あわせて読みたい
分散ストレージの整合性をいかに解決するか。プライマリ-バックアップ方式と分散コミット~クラウドコンピューティングの雲の中(その2)。NII Open House 2013
≪前の記事
最近よく目にする「フルスタックエンジニア」とは何だろうか?