グーグル、BigQueryを正式公開。SQLで大規模データに対して高速処理
グーグルは5月1日、大規模データを高速に分析処理できるサービス「Google BigQueryを正式公開しました。
BigQueryはカラム型データストアの一種で、テラバイトクラスの大規模データに対して大量の並列処理を行うことで高速に結果を得ることが可能。グーグル 佐藤一憲氏の発言によると、
OLAP/DWH/Data Miningで行われるようなread onlyのad hocクエリをきわめて高速(数秒〜数十秒)に実行します。
とのこと。
SQLによる問い合わせが可能
この高速性に加え、BigQueryではSQLを問い合わせ言語に使えるという点にも大きな特徴があります。数秒程度のレスポンスとSQL文による記述は、大規模データに対するアドホックな処理を行うのに適したサービスだといえるでしょう。
BigQueryのSQLの構文は「Query Reference」で解説されていますが、SELECT文にFROM、WHERE、JOIN、HAVING、GROUP BY、ORDER BY、LIMITなどが使えるため、ざっとみたところ一般的な問い合わせは通常のSQL文のように素直に記述できそうです。
BigQueryの料金は月額で、ストレージのデータ容量と検索対象にしたデータの大きさの合計で計算されます。
ストレージ容量は1GBあたり0.12ドル。検索対象のデータは、最初の100GBまで無料、それ以上は1GBあたり0.035ドル。