クラウド上でデータウェアハウスを構築するAmazon Redshiftが公開。あらゆるデータ処理をクラウドへと誘う戦略
大規模なストレージとサーバなどのコンピュータリソースが必要となるデータウェアハウスを、クラウドで提供するサービス「Amazon Redshift」が、昨年秋以来の限定公開を終了し、一般ユーザーからも利用可能になったことが発表されました。
Amazon Redshiftは昨年開催されたイベント「re:Invent」で発表された大型の新サービス。Amazon Web Services シニアバイスプレジデント Andy Jassy氏は、「典型的なオンプレミスのデータウェアハウスが1テラバイトあたり年間1万9000ドルから2万5000ドルかかるのに対して、Redshiftでは1000ドルしかかからない計算になる。ここには10倍以上の開きがあり、圧倒的な違いだ。」と、Amazon Redshiftが従来のデータウェアハウスに対する価格破壊だと紹介しています。
クラウド上でデータウェアハウスの価格破壊へ
16TBディスク128GBメモリ、あるいは2TB、16GBメモリのノードを選択可能で、大規模分散(MPP)アーキテクチャとカラム型データベースを採用しておりクエリは非常に高速で、スタンダードなPostgreSQLドライバやJDBC/ODBCに対応。
分析ツールとして、MicroStrategy、JasperSoft、BusinessObjects、COGNOSなどに対応しています。
データのライフサイクルをすべてクラウドで
クラウド上でのデータウェアハウスを利用する際の大きな課題の1つが、大量のデータをどのようにクラウドへ展開するのか、という点にあります。
AmazonクラウドではすでにオブジェクトストレージのAmazon S3、NoSQLデータベースのAmazon DynamoDBを提供しており、データをロード可能。リレーショナルデータベースのAmazon RDS、HadoopのAmazon Elastic MapReduce、ストレージのAmazon EC2からは、AWS Data Pipelineを使うことができるようになっており、クラウド上でデータの保存、蓄積、処理、分析といった一連の処理を実現するためのサービスを揃えることで、その課題を解決しようとしています。
データウェアハウスのような大規模データベースは、どれだけのデータが蓄積され、その処理にどれだけの能力を必要とするのか、設計当初に明確に予想することは困難です。それだけに、ストレージも処理能力もスケーラブルで、利用した分だけ課金されるクラウドの仕組みは価格の面でも能力の面でも適しているといえます。
Amazonクラウドは、前述したように、ストレージからリレーショナルデータベース、NoSQL、データ転送ツール、データウェアハウスに加え、大規模アーカイブを可能にするAmazon Glacierも提供し、この分野のサービスの充実度で群を抜いていることは明らかです。それは明確にクラウドの利点を意識し、クラウドでデータのライフサイクルすべてを実現するという戦略の基にサービスの充実に努めてきたためでしょう。
あわせて読みたい
Amazonクラウド、デプロイの自動化ツール「AWS OpsWorks」公開。Chefのレシピ利用
≪前の記事
オープンソースで商用クラウドサービスを作るためのチームビルディング。NTTコミュニケーションズ(後編)