オンプレミスからAmazon Redshiftへのデータ転送ツール「FlyData」、MySQL対応と日本法人設立を発表
「Amazon Redshiftのプレビュー版を試してベンチマークをとったら、Hadoopよりも10倍は速かった」。オンプレミスからクラウド上のデータウェアハウスであるAmazon Redshiftへのデータ転送ツール「FlyData for Amazon Redshift」などを提供しているFlyDataファウンダーの藤川幸一氏は、同社がAmazon Redshiftのツールへ参入する決断をしたときのことをこう振り返ります。
2011年にシリコンバレーで起業した同社は現在、「売上げが毎月約40%ずつ成長している」(藤川氏)という急成長のフェーズにあるとのこと。その同社は1月9日、「FlyData」日本法人の設立を発表しました(米国法人もあわせて「FlyData Inc」へHapyrusから社名変更)。
Amazon RedshiftはAmazonクラウドが2012年11月に発表した、クラウドで大規模データウェアハウスを提供するサービス。大規模分散(MPP)アーキテクチャとカラム型データベースを採用しており、テラバイトからペタバイトクラスの大容量データをSQLで高速かつ安価に処理可能です。2013年2月には正式にサービスインしています。
FlyData for Redshiftは、オンプレミス側にエージェントソフトウェアを置いておくと、データをほぼリアルタイムにRedshiftへ高速かつ確実に転送してくれるというもの。大規模データをエラーなく確実かつ高速にクラウドへ転送するのは要件こそシンプルですが実装を考えると面倒な処理です。例えばRedshift側でメンテナンス中だったらどうするかなども考慮する必要があるわけで、FlydData for Redshiftはそうしたことを自動化してくれるサービスとなっています。
リレーショナルデータベースのデータもRedshiftへ
FlyDataは日本法人の発表と同時に、MySQLに対応した「FlyData Sync」のリリースも発表しました。リレーショナルデータベース内のデータも容易にAmazon Redshiftできるようになり、例えばソーシャルゲーム会社であれば、ゲームの実行ログと同時にリレーショナルデータベースに格納されているユーザーデータもRedshiftへ転送し、Redshift上で個々のユーザーの動向を詳細に分析できるようになります。
今後MySQLだけでなくPostgreSQL、Oarcle、SQL Serverなどへも順次対応予定と説明されています。