オラクル、MySQLにOLAP用の独自インメモリデータベースエンジンを搭載、「MySQL Analytics Engine」をOracle Cloud上で提供開始
米オラクルは、Oracle Cloud上での新しいデータベースサービス「Oracle MySQL Database Service Analytics Engine」(以下、MySQL Analytics Engine)を発表しました。
オラクルは今年の9月に、最新のOracle Cloud基盤に最適化したMySQLのマネージドサービスとして「Oracle MySQL Database Service」を発表しています。
今回発表されたMySQL Analytics Engineは、このMySQL Database Serviceに大規模データ分析機能を追加するものです。
通常のデータベースエンジンであるInnoDBに対して最大で400倍高速にOLAPのクエリを実行できます。
具体的にはオラクルが独自に開発したカラム型の分散インメモリデータベースエンジンをMySQL Database Serviceに追加。InnoDBからデータを読み込むことで、超高速に大規模データの分析が可能になります。
いったんMySQL Analytics Engineの利用が開始されると、MySQLに対してデータの更新や削除が行われた場合、その内容は通常のデータベースエンジンであるInnoDB側のデータベースだけでなくMySQL Analytics Engine側のインメモリデータベースにも反映されるため、つねに最新のデータを用いて分析が可能。
MySQLに対して投げられたSQL文は内容に応じて自動的にInnoDBもしくはMySQL Analytics Engineの適切な方へ投げられ、結果が返ってくるため、MySQL Analytics Engineを有効にするだけであとはMySQL Analytics Engineの存在を意識することなく、分析用のSQL文を投げるだけで使えるようになります。
そのためMySQLに対応したツールであればすべてMySQL Analytics Engineでも利用可能です。
ただしMySQL Analytics Engineにはデータの永続化機能はないため、終了させるとインメモリデータベース内のデータは消去されます。そしてまた次に利用を開始するときにはInnoDB側のデータベースからデータをロードすることになります。
MySQL Analytics Engineは複数のサーバ上のメモリに展開されたデータを分散並列処理することでデータ分析を行っています。この処理は、Oracle Cloudの高速なネットワークやサーバのCPUキャッシュのレベルにまで最適化されていると説明されています。
オラクルはその高速性についてプレゼンテーションの中で、競合クラウドのデータウェアハウス向けデータベースサービスと比べてもMySQL Analytics Engineは何倍も高速でしかも利用価格は安価であるとして、ユーザーの声を紹介しています。
MySQLでOLTPとOLAPをシンプルに両立
従来、大規模データの分析はETLツールなどでデータを分析専用のデータベースに変換しつつロードし、そこで分析処理を行うことが一般的でした。
この場合、データ転送に手間と時間がかかるほか、OLTPとアナリティクス用の2つのデータベースを運用管理することにも手間がかかることなどが課題でした。
今回発表されたMySQL Analytics Engineは、前述の通りMySQLの従来のデータベースエンジンであるInnoDBから内部的にAnalytics Engineのインメモリデータベースへとデータを転送する仕組みです。
そのため、ETLツールを用いるのに比べて高速かつ簡単にデータ分析を開始できることに加え、マネージドサービスとして提供されているMySQLの管理下でMySQL Analytics Engineが組み込まれるため、運用管理の手間もほとんどかからないことが大きな特徴となっています。
MySQLはオープンソースソフトウェアのバックエンドとして広く使われているほか、大規模なWebサービスのバックエンドでも使われています。
従来、こうしたWebサービスではログなどの分析のために専用のデータベースへデータ転送していることが一般的でしたが、MySQL Analytics Engineの登場によって分析処理もMySQL内で実行できるようになることが期待されます。
MySQL Analytics Engineはオラクルが独自開発したデータベースエンジンのためオープンソースとしては公開されず、Oracle Cloud上のデータベースサービスとしてのみ利用可能になるとのことです。
あわせて読みたい
Amazon S3がこれまでの「結果整合性」から「強い一貫性」サポートへ。データを更新直後でも最新データの読込みが保証されるように
≪前の記事
AWS、新たな独自プロセッサ「AWS Trainium」発表。機械学習のトレーニング処理に最適化、テラフロップス級の性能を発揮。AWS re:Invent 2020