リアルタイムなデータ分析をする分散OLAP「Pinot」をLinkedInがオープンソースで公開

2015年6月18日

LinkedInは、同社が開発したリアルタイムデータ分析を実現する分散OLAPデータストア「Pinot」をオープンソースで公開したことを明らかにしました

Open Sourcing Pinot: Scaling the Wall of Real-Time Analytics | LinkedIn Engineering

LinkedInはビジネスに特化したソーシャルメディアサービス。

同社はこのサービスで発生する大量のデータを分析するプラットフォームとして、すでに2年以上Pinotを運用してきており、日々数十億件のデータを投入し、数千億件ものデータを保存。毎日1億クエリを実行し、10ミリ秒程度のレイテンシでリアルタイム分析しているとのこと。

例えば、LinedInのサービスである「Who's Viewed Your Profile」(あなたのプロフィールを誰が見たか」や、A/BテストフレームワークのXLNTもPinotで構築されていると説明されています。

figWho’s Viewed Your Profileの画面

スケールアウト型でカラム型データストア

Pinotはスケールアウト型のアーキテクチャでフォールトトレラント。カラム型データベースに複数の圧縮手法を内蔵し、インデックス機能はソート型インデックス、ビットマップインデックス、転置インデックスなどプラガブル。HadoopからバッチやKafkaなどを通じてほぼリアルタイムにデータを取得可能で、SQLライクな問い合わせ言語によって検索を行います。

LinkedInではPinotの新機能としてB+Treeとカラム型ストレージのハイブリッド型インデックスの開発に取り組んでおり、これによってデータキューブのような追加ストレージ容量を要求されることなく高スループットでクエリに対応できるようになるとのことです。

あわせて読みたい

NoSQL 機械学習・AI BI




タグクラウド

クラウド
AWS / Azure / Google Cloud
クラウドネイティブ / サーバレス
クラウドのシェア / クラウドの障害

コンテナ型仮想化

プログラミング言語
JavaScript / Java / .NET
WebAssembly / Web標準
開発ツール / テスト・品質

アジャイル開発 / スクラム / DevOps

データベース / 機械学習・AI
RDB / NoSQL

ネットワーク / セキュリティ
HTTP / QUIC

OS / Windows / Linux / 仮想化
サーバ / ストレージ / ハードウェア

ITエンジニアの給与・年収 / 働き方

殿堂入り / おもしろ / 編集後記

全てのタグを見る

Blogger in Chief

photo of jniino

Junichi Niino(jniino)
IT系の雑誌編集者、オンラインメディア発行人を経て独立。2009年にPublickeyを開始しました。
詳しいプロフィール

Publickeyの新着情報をチェックしませんか?
Twitterで : @Publickey
Facebookで : Publickeyのページ
RSSリーダーで : Feed

最新記事10本