MongoDBがHadoopとの統合強化。HiveでMongoDBデータへSQL問い合わせ可能、BSONをHDFS上に保存など
代表的なNoSQLデータベースの1つであるMongoDBの開発元10genは、MongoDBとHadoopとの統合を強化する「MongoDB Connector for Hadoop」の新バージョンを発表しました。
MongoDB Connector for Hadoopは、Hadoopへの入出力データとしてMongoDBを使えるようにするソフトウェアで、新バージョンでは主に以下の機能が追加されています。
- Apache HiveからMongoDBのデータへSQLライクな問い合わせ
- インクリメンタルなMapReduceジョブのサポートによる、アドホックな分析を容易に実現
- MongoDB BSONファイルをHadoop Distributed File System(HDFS)上に保存することで、データの移動を削減
これにより以下のようなメリットがあるとのこと。プレスリリースから引用します。
The Connector presents MongoDB as a Hadoop-compatible file system. Real-time data from MongoDB can be read and processed by Hadoop MapReduce jobs, such as when aggregating data from multiple input sources or as part of Hadoop-based data warehousing or ETL workflows. The results of Hadoop jobs can also be written back to MongoDB to support real-time operational processes and ad-hoc querying.
このコネクタによりMongoDBをHadoop互換のファイルシステムとし、MongoDBからのリアルタイムデータをHadoop MapReduceジョブで読み込むことができます。例えば複数のデータソースからの統合データや、Hadoopベースのデータウェアハウス、ETLワークロードなどが挙げられます。
Hadoopのジョブの結果はMongoDBへと書き戻され、リアルタイムな操作やアドホックな問い合わせをサポートします。
MongoDB Connector for Hadoopは、2012年に最初のバージョンがリリースされており、今後さらなる性能向上、Hiveのフル機能サポートなどを進めていく予定。
あわせて読みたい
書籍「The Datacenter as a Computer」の第二版がPDFで無料公開中
≪前の記事
データセンター自動化ツール「Enterprise Chef」発表。5ノードまで無料。シスコ/ジュニパー/アリスタらとの協業でネットワーク自動化、Windows対応強化など