Clouderaが「SQL-on-Hadoop」のImpala 1.0正式版リリース
Hadoopのディストリビューションベンダとして知られるClouderaは今日、Hadoopのクラスタに対してSQLでの問い合わせを実現するオープンソースソフトウェア「Cloudera Impala」のバージョン1.0を公開しました。製品版は「Cloudera Enterprise RTQ」として販売されます。
Clouderaは、Hadoopで構築された大規模な分散データベースに対してSQLで高速に問い合わせが可能になることにより、企業でのデータウェアハウス用途などHadoopでの新たな市場を開拓できるとしています。
MapReduceを使わず独自の分散クエリエンジン
Impalaはバッチ処理をベースにしたMapReduceは使わず、独自の分散クエリエンジンによってHDFSあるいはHBaseに保存されているデータに対して直接クエリを実行する仕組みになっています。
Hadoop上でSQLによる問い合わせを実現するソフトウェアとしてはHiveがよく知られていますが、HiveはMapReduceのバッチ処理として実行されるため問い合わせごとに時間がかかっていました。それに対してImpalaはMapReduceのバッチ処理を経由しないため、高速でインタラクティブな動作を実現しているとClouderaは説明しています。
Impalaで使用できる問い合わせ言語はSQL 92のサブセットでHiveQLに似ており、Select、ジョイン、サブクエリなどをサポート。Hive ODBCドライバもサポートするため、アプリケーションからODBCドライバ経由で利用することもできます。
あわせて読みたい
インメモリデータベース「MemSQL 2.0」公開。数百ノードへスケールアウト可能で大規模データベース対応へ
≪前の記事
FacebookもAmazonも、Software-Defined Networkingエンジニアを現在募集中