「次に何が起こるか?」を予測するための、スケールアウトアーキテクチャによるデータ分析システムとは[PR]

2016年2月15日

ビジネスにおけるデータ分析の活用は、データを分析して過去に何が起きたのかを把握する「Analytics 1.0」に始まり、次に起こりそうなことを予測する「Analytics 2.0」の時代を経て、現在は分析結果を製品やサービスの改善や開発に活用することが業務プロセスに組み込まれた「Analytics 3.0」の時代にある(Thomas H. Davenport『Analytics 3.0』(Harvard Business Review, Dec. 2013)を参考)。こう指摘するのは、SAS Institute Japanの小林泉氏です。

「機械学習や自動化、ストリーミングデータやIoTといったキーワードで語られるように、データ資産の活用が実ビジネスに直結するようになってきている」(小林氏)

小林氏の指摘は、12月9日に都内で開催されたイベント「データ分析まるわかりセミナー」(主催:伊藤忠テクノソリューションズ)で発言されたもの。このイベントでは、データ分析の目的や投資対効果(ROI)、留意点、さらに分析のキーワード解説や新テクノロジなどについて、シスコシステムズ、マップアール・テクノロジーズ、伊藤忠テクノソリューションズの3社から解説が行われました。

fig

イベントの主な内容を追っていきましょう。

テクノロジーの進化のおかげでビジネスユーザーのデータ分析が可能に

ビジネスとデータ分析が密接に結びつく時代の背景にあるのは、テクノロジーが進化したおかげで、難しいことが分からなくてもビジネスユーザーによる高度でリアルタイムに近い迅速なデータ分析が可能になっていることだとSASの小林氏。

こうした高度なデータ分析を支えるITシステムは、例えばSASが提供するようなデータ分析のロジックを備えた製品と、それを高速に処理できるMapRが提供するHadoopのようなミドルウェア、そしてシスコシステムズが提供するようなサーバやストレージなどのインフラから構成されます。

fig

こうしたAnalytics 3.0時代のソフトウェアの多くは、複数のサーバで分散処理を行うシェアドナッシングなアーキテクチャになってきています。つまり、より性能や容量が必要になってきたら、サーバをどんどん買い足していくことで性能も容量も向上させていけるアーキテクチャです。

fig

SASのLASR Analytic ServerやHadoopは、このスケールアウトアーキテクチャに対応したソフトウェアです。

ただし、スケールアウトアーキテクチャにはサーバが増大するせいでシステム全体の管理が難しくなっていくというデメリットがあります。これを解決するために、統合管理ツールの重要性が増してきます。

シスコが提供するインフラではあらかじめMapRを含むさまざまなHadoopでの動作を検証済みで、また管理ツールの「UCS Director Express for Big Data」は、ベアメタルサーバのプロビジョニングからHadoop ManagerによるMapRの管理まで統合的に行えるようになっているため、スケールアウトアーキテクチャの利点を最大限に生かせる機能を備えています。

fig

「何が起きたのか?」から「最善・最適な対処法は何か?」まで

伊藤忠テクノソリューションズ(CTC) ビジネスアナリティクス技術推進課 小平啓一氏は、データ分析のアプローチとして8つの段階があると説明します。

fig

この8つの段階においても、データを分析することで「何が起きたのか」を把握するところから、データ分析の結果を基に「何をすればよいのか」を示し、さらに「この傾向でいくとどうなるか」「次に何が起きるのか?」「最善・最適な対処法は何か」と、将来を予測する方向へとデータ分析を活用していくことになるとの指摘です。

これを実行する上で重要なのは、データを集め、きちんと整理した上で分析を行い、分かりやすい形でレポーティングを行うこと。

そしてデータ分析において前述の8つの段階の上半分における、過去のデータを基にして将来を予測する場面では、多様なデータ同士を組み合わせてさまざまな仮説の有効性を計算しなければならないため、処理が爆発的に増大していく傾向にあります。

SASが提供する「SAS Visual Analytics」は、データの収集や整理、そして高速な分析、レポーティング、この3つを兼ね備えた形の製品になっており、特に複雑なデータの組み合わせ処理の面では、インメモリによる高速な分析機能を搭載しています。

さらに、大規模データの分析に対応するうえでSAS Visual AnalyticsはHadoopとの統合も実現。

fig

データの処理方式として、HadoopデータをSASに移動する方式、SAS処理をHadoop内に移動してHadoop内で処理を行う方式、インメモリ処理を行う方式などが備わっており、最適な組み合わせを適用することで高速かつスケールアウト可能な分析処理を実現可能です。

fig

「このように構成する製品をきちんと統合した1つのシステムとして提供できる、というのも、このSAS Visual Analyticsという製品の重要なポイント」(小平氏)

データウェアハウスのオフロード処理をHadoopで

データ分析基盤として注目されるHadoopですが、従来のデータウェアハウスをHadoopでリプレースするのではなく、既存のものと組み合わせて活用することを提案するのがCTC ビッグデータ基盤技術推進課 瓜田幸代氏。

データウェアハウスを使っていたあるお客様の事例として「データが増えてきたので、本当はもう1つデータウェアハウスのアプライアンスを購入して拡張したいがコスト的に断念せざるを得なかった。そこでHadoopを提案して導入いただいた」(瓜田氏)

データウェアハウスとHadoopを組み合わせ、データウェアハウスでは直近1カ月から3カ月のデータを処理。その期間を超えるデータについてはHadoopへオフロードすることで、データウェアハウスの負担を軽くしました。これにより低コストで従来のシステムを拡張したデータ処理基盤が構築できたとのこと。

fig

「しかもHadoopに対してもSQLで叩けるため、従来のBIツールをそのまま活用できた」(瓜田氏)

CTCはここで説明されたように、SASのVisual Analyticsなどの分析ツール、MapRのHadoop、そして管理ツールを統合したシスコのインフラ製品などを用いた、大規模データ分析を実現するさまざまなソリューションを展開していることが示されました。

同社はビッグデータに関するソリューションへの本格的な取り組みの1つとして、ビッグデータ関連の検証に特化した「Big Data Processing Lab」を常設。各社のさまざまな機種による500台のサーバ、600台のスイッチ/ルータ、1ペタバイトのストレージを備え、ベンダーを限定せずにソフトウェア、ハードウェアの検証を行う環境を備え、お客様からの相談や問い合わせに対応しています。

「データ分析まるわかりセミナー」主催の伊藤忠テクノソリューションズは、本セミナーの資料ダウンロードページを公開しています。興味のある方は、ぜひご覧ください。

「データ分析まるわかりセミナー ~インフラから分析まで~」資料ダウンロードページ

(本記事はシスコシステムズ提供のタイアップ記事です)

あわせて読みたい

機械学習・AI Cisco Hadoop PR




タグクラウド

クラウド
AWS / Azure / Google Cloud
クラウドネイティブ / サーバレス
クラウドのシェア / クラウドの障害

コンテナ型仮想化

プログラミング言語
JavaScript / Java / .NET
WebAssembly / Web標準
開発ツール / テスト・品質

アジャイル開発 / スクラム / DevOps

データベース / 機械学習・AI
RDB / NoSQL

ネットワーク / セキュリティ
HTTP / QUIC

OS / Windows / Linux / 仮想化
サーバ / ストレージ / ハードウェア

ITエンジニアの給与・年収 / 働き方

殿堂入り / おもしろ / 編集後記

全てのタグを見る

Blogger in Chief

photo of jniino

Junichi Niino(jniino)
IT系の雑誌編集者、オンラインメディア発行人を経て独立。2009年にPublickeyを開始しました。
詳しいプロフィール

Publickeyの新着情報をチェックしませんか?
Twitterで : @Publickey
Facebookで : Publickeyのページ
RSSリーダーで : Feed

最新記事10本