Apache FlinkとPravegaを用いてリアルタイムデータ分析に最適化された統合システム「Project Nautilus」登場[PR]
Dell Technologiesは2017年10月10日、Apache FlinkとPravegaを用いたリアルタイムデータ分析に最適化したサーバ、ストレージ、ソフトウェアの統合システム「Project Nautilus」を発表しました。
Project Nautilusは、DellによるEMC買収前の旧社名で言うところのDellのサーバ、EMCのストレージ、VMwareの仮想化基盤、そしてオープンソースのリアルタイムデータ分析ツールであるPravegaとApache Flinkなどを統合し、リアルタイムデータ分析に最適化した統合システムです。
ある意味で現在のDell Technologiesが総力をあげて作り上げた、IoTを中心とした大量のストリームデータを分析するためのプラットフォームだと言えます。
同社は発表と同時に、同社のIoT事業の戦略と実行を担う「IoT Division」(IoT事業部)の発足も発表。IoT分野への注力を鮮明にしました。
Apache FlinkとPravegaを搭載
Nautilusで中心的な役割を担うのが、Apache FlinkとPravegaです。
Apache Flinkは、連続的に流れてくる大量のデータ、いわゆるストリームデータをリアルタイムに処理するためのオープンソースの分散処理基盤です。
高スループットかつ低レイテンシでストリームデータを処理し、しかもデータ量に対応したスケーラビリティを備えつつ、障害が発生しても自動復旧して処理を継続できる高い耐障害性も備えています。
リアルタイムな処理だけでなくバッチ処理にも対応し、イベント処理を実現する「CEP」機能、機械学習ライブラリへの対応、グラフ処理など多様な要求に対応するため、急速に人気が高まっています。
Apache Flinkによって処理されるデータを収集するストレージ機能を提供するのがPravegaです。
Pravegaはストリームデータを高信頼かつスケーラブルに保存するストレージを実現すると同時に、保存したデータをほかのシステムに複製せず、そのままPravegaのうえで分析、加工することを可能にします。
そしてこのApache FlinkとPravegaなどを実行する分散環境基盤としてMesos DC/OSが用意されています。
IsilonやECSでストレージの階層化を可能に
Project Nautilusのハードウェアには、クラスタ構成のDell EMC PowerEdgeが採用されています。
クラスタ構成のPowerEdgeのストレージには、取得したストリーミングデータが蓄積されていきますが、その下位レイヤにさらにスケールアウトストレージのIsilonやオブジェクトストレージのECS(Dell EMC Elastic Cloud Storage)を置いて階層化ストレージとすることで、非常に大容量なストレージへとProject Nautilusを拡張することが可能になっています。
IoTのアーキテクチャにおけるProject Nautilusの位置づけは、中心的な存在となるクラウドに対して、よりデータに近いエッジにおいてデータ分析を行うものとなっています。
その位置づけを実現するサーバの名称が、おおよそ25年前にマイケル・デルが名付けた「PowerEdge」だというのは幸運な偶然といえそうです。
Project Nautilusの出荷時期は未定で、あらためて同社から発表される予定です。
(本記事はDell EMC提供のタイアップ記事です)
あわせて読みたい
国内ITサービス市場は1%程度のゆるやかな成長を継続。ただしITサービスベンダーが成長するには自分自身のデジタルトランスフォーメーション推進が必要。IDC Japan
≪前の記事
終わりなく増えていくストリームデータ特化の分散ストレージ「Pravega」、EMCがオープンソースで公開。これまでのストレージとどう違う?[PR]