Amazon S3のデータを直接検索できる「MongoDB Atlas Data Lake」正式リリース。データベースへの転送不要、MongoDBのクエリ言語を直接実行
MongoDBは、Amazon S3に保存されているデータをそのままデータベースへ転送することなく、直接MongoDBのクエリ言語で検索可能にするクラウドサービス「MongoDB Atlas Data Lake」の正式リリースを発表しました。
発表は同社がオンラインで開催したイベント「MongoDB.Live 2020」で行われました。
通常、データベースで検索や分析の対象となるデータはデータベース内に保存されているデータであるため、ファイルサーバやオブジェクトストレージなどに保存されているJSONデータやCSVファイルなどは、何らかの方法でデータベースへインポートする必要があります。
MongoDB Atlas Data Lakeはこのインポートを不要にし、Amazon S3のバケット内に保存されているJSON、BSON、CSV、TSV、Avro、Parquetなどのフォーマットのファイルに対して、そのまま直接MongoDBの問い合わせ言語(MongoDB Query Language:MQL)で検索を行い、結果を得られるというクラウドサービスです。
設定は簡単で、Amazon S3のバケット名やAmazon IAMなどの情報をMongoDB Atlas Data Lakeに設定し、生成されるいくつかの構成ファイルを対象となるAmazon S3内に保存するだけです。
対象となるデータフォーマットは前述の通りで、このフォーマットのまま圧縮されていても対応します。
これにより、オブジェクトストレージからデータの複製や転送をすることなく、そのままデータレイクとして利用することが可能になります。
MongoDB.Live 2020
あわせて読みたい
NGINXがQUIC+HTTP/3対応のテクニカルプレビューを発表
≪前の記事
「MongoDB 4.4」ベータ登場。データを統合するUNION対応、シャードキーの動的変更、最速レスポンスのためのヘッジドリードなど新機能