MongoDBがHadoopとの統合強化。HiveでMongoDBデータへSQL問い合わせ可能、BSONをHDFS上に保存など

2013年8月21日

代表的なNoSQLデータベースの1つであるMongoDBの開発元10genは、MongoDBとHadoopとの統合を強化する「MongoDB Connector for Hadoop」の新バージョンを発表しました

Integration of Hadoop and MongoDB, Big Data’s Two Most Popular Technologies, Gets Significant Upgrade | 10gen, the MongoDB company

MongoDB Connector for Hadoopは、Hadoopへの入出力データとしてMongoDBを使えるようにするソフトウェアで、新バージョンでは主に以下の機能が追加されています。

  • Apache HiveからMongoDBのデータへSQLライクな問い合わせ
  • インクリメンタルなMapReduceジョブのサポートによる、アドホックな分析を容易に実現
  • MongoDB BSONファイルをHadoop Distributed File System(HDFS)上に保存することで、データの移動を削減

これにより以下のようなメリットがあるとのこと。プレスリリースから引用します。

The Connector presents MongoDB as a Hadoop-compatible file system. Real-time data from MongoDB can be read and processed by Hadoop MapReduce jobs, such as when aggregating data from multiple input sources or as part of Hadoop-based data warehousing or ETL workflows. The results of Hadoop jobs can also be written back to MongoDB to support real-time operational processes and ad-hoc querying.

このコネクタによりMongoDBをHadoop互換のファイルシステムとし、MongoDBからのリアルタイムデータをHadoop MapReduceジョブで読み込むことができます。例えば複数のデータソースからの統合データや、Hadoopベースのデータウェアハウス、ETLワークロードなどが挙げられます。

Hadoopのジョブの結果はMongoDBへと書き戻され、リアルタイムな操作やアドホックな問い合わせをサポートします。

MongoDB Connector for Hadoopは、2012年に最初のバージョンがリリースされており、今後さらなる性能向上、Hiveのフル機能サポートなどを進めていく予定。

あわせて読みたい

NoSQL 機械学習・AI Hadoop MapReduce MongoDB




タグクラウド

クラウド
AWS / Azure / Google Cloud
クラウドネイティブ / サーバレス
クラウドのシェア / クラウドの障害

コンテナ型仮想化

プログラミング言語
JavaScript / Java / .NET
WebAssembly / Web標準
開発ツール / テスト・品質

アジャイル開発 / スクラム / DevOps

データベース / 機械学習・AI
RDB / NoSQL

ネットワーク / セキュリティ
HTTP / QUIC

OS / Windows / Linux / 仮想化
サーバ / ストレージ / ハードウェア

ITエンジニアの給与・年収 / 働き方

殿堂入り / おもしろ / 編集後記

全てのタグを見る

Blogger in Chief

photo of jniino

Junichi Niino(jniino)
IT系の雑誌編集者、オンラインメディア発行人を経て独立。2009年にPublickeyを開始しました。
詳しいプロフィール

Publickeyの新着情報をチェックしませんか?
Twitterで : @Publickey
Facebookで : Publickeyのページ
RSSリーダーで : Feed

最新記事10本