スケーラブルな分散SQLエンジン「Presto」の開発団体「Presto Software Foundation」が発足
スケーラブルな分散SQLエンジンとして大規模データに対して高速なクエリを実現する「Presto」は、2013年にFacebookが公開したオープンソースソフトウェアです。
現在でもFacebookをはじめTwitter、Uber、Netflix、ウォルマートなどがデータ分析などに利用しているとされています。
そのPrestoの開発者たちが、Prestoの開発を促進する団体「Presto Software Foundation」の設立を発表しました。
設立を発表するブログには、Presto Software Foundationの役割を次のように説明しています。
The Presto Software Foundation is dedicated to preserving the vision of high quality, performant and dependable software developed by an open, collaborative and independent community of developers throughout the world.
Presto Software Foundationは、世界中に開かれたオープンでコラボレーティブで独立した開発者コミュニティによって開発された、高品質で高性能で信頼できるソフトウェアのビジョンを維持することに尽力していきます。
The Presto Software Foundationは引き続きFacebookの開発者が大きな役割を果たすとみられますが、Facebook以外の創立メンバーにはArm Treasure Dataの名前も挙がっています。
ペタバイトクラスのデータにも対話的でアドホックなクエリを実現
PrestoはもともとFacebook社内で大規模データに対して、バッチ指向のHaddop/MapReduceよりもさらにリアルタイム性に優れたクエリを実現するために開発されました。
2013年に同社がPrestoをオープンソースで公開したときには、「Prestoはほとんどの社内のクエリにおいて、CPUの効率とレイテンシに関してHive/MapReduceよりも10倍は優れている」と、そのリアルタイム性能の高さを誇っています。
ANSI SQLに準拠し、ジョイン、アウタージョイン、サブクエリ、一般的な集計関数やカウントなどに対応するため、SQLの知識があればほぼそのまま使えるだけでなく、RやTableau、Power BIなど既存のツールから使えるのもPrestoの大きな特徴です。
あわせて読みたい
全米で最高の職業は「データサイエンティスト」。「DevOpsエンジニア」も6位に。米Glassdoor「The Best Jobs in America 2019」
≪前の記事
macOS用パッケージマネージャ「Homebrew 2.0」リリース。LinuxとWSL(Windows Subsystem for Linux)にも正式対応