(目次)
序文
序章 いま起きているビッグデータ革命
パートⅠ 大きなデータ、小さなデータ
第1章 直感は裏切り者
パートⅡ ビッグデータの威力
第2章 夢判断は正しいか?
第3章 何がデータになるのか~驚くべき新データの世界
第4章 秘められた検索
第5章 絞り込みという強力な手法
第6章 世界中が実験室
パートⅢ ビッグデータ、取扱注意
第7章 できること、できないこと
第8章 やってはいけないこと
結びに ここまで読み通して来た人は何人?
【序章】
人々が情報を求める検索は、それ自体が情報である。人々が検索するとき、それは、彼らの本当の考え、望み、怖れについて、どんな推測よりも正確に明かす(P15)
人種差別的な検索の多発地域では、オバマの得票率は、彼の前の民主党大統領選候補者だったジョン・ケリーの得票率よりもはるかに低かった。当該地域におけるこの関係は、学歴、年齢、教会活動への参加、銃所有率など他のどんな要因でも説明できなかった(P21)
トランプ支持が最も強かった地域は、「ニガーnigger」という語を最もよく検索していた地域だった(P26)
オバマは全米で、あからさまな人種差別によって、4%の票を失っていた(P21)
過去3度の大統領選では、検索語として先に入力された候補が当選している(P23)
グーグルのデータの価値が非常に高いのは、規模が大きいからではない。人々が真情を吐露しているからだ(P35)
【第1章】
大半の米国人は、最も成功しているNBA選手は貧困家庭の出身だと思っている。しかし、最富裕地域に生まれた黒人の子供は、最貧地域に生まれた黒人の子供より2倍NBA入りする可能性が高いし、白人の子供の場合、最富裕地域の子は最貧地域の子より1.6倍有利だ(P50∼P51)
困難な出自の少年たちがNBAで不利な2番目の理由は、ある種の社会的スキルを欠くことがあるからかもしれない(P55)
【第2章】
(ビッグデータの4つの威力)
①かつて推測するしかなかった「人の性衝動」という新しい領域のデータを入手できる
②正直なデータの入手
③小さい部分集合に絞り込んでも有意義な分析ができる
④手軽に比較対象試験ができる
【第3章】
他の検索エンジンは、ユーザーが入力した検索ワードを最も多く含んでいたサイトを上位表示していた。これに対しグーグルの検索エンジンは、検索ワードに関して数多くリンクされているサイトを上位表示することで、有用な情報源を表示した(P77∼P78)
ジェフ・セダーは、携帯式の超音波測定装置を自作し、左心室の大きさが馬の将来の戦績を最も左右する変数であることを突き止めた。脾臓も大切だった。またある種の足並みが戦績に関わっていることを見出した(P85~P86)
ボルドー地方のワインの品質は、概ねブドウの栽培期間の天候で説明がつく。その計算式は次のとおり(P91)
価格=12.145+0.00117冬季降水量+0.0614栽培期間平均気温-0.00386収穫期降水量
【第4章】