書評:「統計学が最強の学問である」、データをビジネスに使う人のための知識が凝縮

2013年2月13日

「どんな分野の議論においても、データを集めて分析することで最速で最善の答えを出すことができる」。だから統計学が最強の学問である。著者は本書でこう断言しています。

fig

統計学が本当に最強の学問かどうかは置いておくとしても、以前の記事「次の10年、「統計分析」こそテクノロジー分野でいちばんホットな職業になる」で書いたように、グーグルやマイクロソフトやそのほか多くの企業が統計に着目し優秀な人材を求めていることからも、現代における統計学の重要さは誰もが認めることでしょう。

なぜ統計学はそれほど強力なのか? そして、それをビジネスに活かすにはどうすればいいのか? 本書はそれを、統計学の予備知識のないビジネスマンでも分かるように説明してくれます。

データをビジネスに使うための「3つの問い」

本書は単に統計学を解説するのではなく、ビジネスの視点から統計学の有用性を説いているところに特徴があります。例えば著者は、データをビジネスに使うには次の「3つの問い」に答えられなければ意味がない、と書いています。

【問1】何かの要因が変化すれば利益は向上するのか?
【問2】そうした変化を起こすような行動は実際に可能なのか?
【問3】変化を起こす行動が可能だとしてそのコストは利益を上回るのか?

多くのビジネスマンは、これまで職場で多くのグラフやデータを目にして「で、これは何に役立つの?」とか「で、これに基づいて次はどうアクションするの?」という疑問を持ったことがあるはずです。いくら分析が緻密であっても、それ以前に明確な問いを設定しておかなければ役に立ちません。そのためには、統計によって何をどれくらい正しく知ることができるのか、そのためにどのような手法があるのか、という知識は欠かせないものでしょう。

ビッグデータは本当に必要か?

第2章で著者は、統計学を使えば本当にビッグデータを分析する必要があるのか、大いに疑問だと指摘します。例えば10万人分のデータを解析する場合、そこから8000件を抽出して分析するだけで誤差は1%以内の結果となることが誤差を計算する式から分かる。であれば、データをビッグなまま解析することが投資するコストに見合うのかと、疑問を投げかけています。

ビッグデータ時代と呼ばれる考え方に逆行するようだが、私は誰からデータ分析の相談を受けても「まず正しい判断に必要な最小限のデータを扱うこと」を推奨している。もし1%の誤差が今後数年積み重なって何千万円分もの売上げやコストに繋がるのであれば、ビッグデータ解析技術は役に立つだろう。だがその場合においても、必ずしも最初からすべての解析を全データで行なう必要はないのだ。

「ビッグデータ」をマーケティング用語として使い、その重要性を説く企業は、著者のこの指摘に答えを持っていなければならないでしょう。逆にユーザーの立場では、統計を正しく使いこなせればわざわざ高価なシステムを買わずに済むかもしれないのです。

では統計学をどう使えば正しい答えが導き出せるのか、本書はこれに答えるためのさまざまなデータの取り方、分析の仕方などの手法と意味、その背景となる考え方が紹介されます。

例えば、ECサイトのデザインをA/Bテストにかけた結果、片方の売上げがもう一方の1.01倍だったとき、それが有意な差なのかどうかを知るには「カイ二乗検定を使う」ことや、因果関係の向き、つまり製品購入者に広告を見た人が多かったとき、それは広告を見たから製品を買ったのか、あるいは製品を買ったから広告を見るようになったのか、どちらなのかを判別するための解決方法、回帰分析や重回帰分析はどのように使い分ければいいのか、など。

ビジネスの現場のヒントがある

本書の有用性は統計を俯瞰し、そこにどんな道具があり、ビジネスにどう使えるのか、どう考えるべきなのか、などの広い視点を与えたうえで、それぞれの手法の意味を理解させてくれるところにあります。

ただし、各手法の計算方法について詳しく解説することは本書の守備範囲外にあるため、個別の手法の詳細などはそれぞれの専門書を改めて当たる必要があります。しかしビジネスにおいて統計学がどれだけ強力なツールであり、それを正しく用いるためにどんな知識が必要となるのかを広く知ることができる点で、マーケティングに関わる人、データを基に経営判断をする人、それをサポートするIT関係の方々に広く本書をおすすめします。

第1章 なぜ統計学が最強の学問なのか?
01 統計リテラシーのない者がカモられる時代がやってきた
02 統計学は最善最速の正解を出す
03 すべての学問は統計学のもとに
04 ITと統計学の素晴らしき結婚
第2章 サンプリングが情報コストを激減させる
05 統計家が見たビッグデータ狂想曲
06 部分が全体に勝るとき
07 1%の制度に数千万円をかけるべきか?
第3章 誤差と因果関係が統計学のキモである
08 ナイチンゲール的統計の限界
09 世間にあふれる因果関係を考えない統計解析
10 「60」億円儲かる裏ワザ」のレポート
11 p値5%以下を目指せ!
12 そもそも、どんなデータを解析すべきか?
13 「因果関係の向き」という大問題
第4章 「ランダム化」という最強の武器
14 ミルクが先か、紅茶が先か
15 ランダム化比較実験が社会科学を可能にした
16 「ミシンを2台化ったら1割引き」で売上げは上がるのか?
17 ランダム化の3つの限界
第5章
18 疫学の進歩が証明したタバコのリスク
19 「平凡への回帰」を分析する回帰分析
20 天才フィッシャーのもう1つの偉業
21 統計学の理解が劇的に進む1枚の表
22 重回帰分析とロジスティック回帰
23 統計学者が極めた因果の推論
第6章 統計家たちの仁義なき戦い
24 社会調査法vs疫学・生物統計学
25 「IQ」を生み出した心理統計学
26 マーケティングの現場で生まれたデータマイニング
27 言葉を分析するテキストマイニング
28 「演繹」の計量経済学と「帰納」の統計学
29 ベイズ派と頻度論派の確率をめぐる対立
終章 巨人の肩に立つ方法
30 「最善の答え」を探せ
31 エビデンスを探してみよう

統計学が最強の学問である 統計学が最強の学問である
本書では最新の事例と研究結果をもとに、基礎知識を押さえたうえで統計学の主要6分野「社会調査法」「疫学・生物統計学」「心理統計学」「データマイニング」「テキストマイニング」「計量経済学」を横断的に解説するという、今までにない切り口で統計学の世界を案内する。

あわせて読みたい

機械学習・AI ビッグデータ 書評




タグクラウド

クラウド
AWS / Azure / Google Cloud
クラウドネイティブ / サーバレス
クラウドのシェア / クラウドの障害

コンテナ型仮想化

プログラミング言語
JavaScript / Java / .NET
WebAssembly / Web標準
開発ツール / テスト・品質

アジャイル開発 / スクラム / DevOps

データベース / 機械学習・AI
RDB / NoSQL

ネットワーク / セキュリティ
HTTP / QUIC

OS / Windows / Linux / 仮想化
サーバ / ストレージ / ハードウェア

ITエンジニアの給与・年収 / 働き方

殿堂入り / おもしろ / 編集後記

全てのタグを見る

Blogger in Chief

photo of jniino

Junichi Niino(jniino)
IT系の雑誌編集者、オンラインメディア発行人を経て独立。2009年にPublickeyを開始しました。
詳しいプロフィール

Publickeyの新着情報をチェックしませんか?
Twitterで : @Publickey
Facebookで : Publickeyのページ
RSSリーダーで : Feed

最新記事10本