「ビッグデータの残酷な現実」が示すホントのところ【読書レビュー#20】

2017年20冊目。なかなか快調な滑り出し。



最近AIブームで、統計とかビッグデータ系の本はご無沙汰だった気がします。
そんなところでこの一冊。

この「ビッグデータの残酷な現実」はKindle版のタイトルのようで、
紙の書籍のタイトルは・・・

「ハーバード数学科のデータサイエンティストが明かす ビッグデータの残酷な現実―――ネットの密かな行動から、私たちの何がわかってしまったのか?」

長すぎだろっ!笑

しかも原題は、たったひとこと。

  Dataclysm

なんだ、この差は 笑


Dataclysmは筆者による造語で、Dataと(当たり前)、Cataclysmの造語です。

  Cataclysmってなに?

ってなると思うんですが、自分で調べてください。
というのもあんまりなので、ちょっと検索かけましたが、ろくなもんじゃなし。

唯一まともだったのがアルクの英辞郎で、これ。

cataclysm
【名】
〔社会の〕大変動、激変◆社会に大きな変化をもたらすような戦争や地震などを指す。
《地学》地殻の大変動◆【同】catastrophe
大洪水


ただこれだと間違いじゃないけど、肝心のところがなにもいえてなくて、
ヒントは「大洪水」のところにあるんですが、聖書にトンとうとい、
自分のような日本人でも知っているであろう「ノアの箱船」の大洪水のことなんですね。

つまりそれにかけて、大量のデータが集まることで見えてきた、今までわからなかった社会の大きな変動、
というのと、今後さらにデータ量が膨大に増えていき、テクノロジーも進化していくことで、
目に見えたり見えなかったりする社会の変化、の二つを意味させているんだと、説明されてます。

そんなニュアンスもなにもあったもんじゃない邦題ですね、これ。
まぁ「ハーバード数学科」とか「データサイエンティスト」とか「ビッグデータ」とかとか、
並べると売りにつながる、っていう判断なんでしょうけど。
どう思います?

なんか中身のレビューにいく前にタイトルだけでこんなに引っ張ってしまったんですが・・・。

このクリスチャン・ラダーってひとは、全米が泣いたりはしないけど(笑)
アメリカ最大(?)の出会いサイト、Okキューピッドの創業者で、
「たしかに」データサイエンティスト。

で、そのユーザーの膨大なデータから見えてくる、そして普段は表に出ることがない、
人種間の差や、男女間の差、同性愛者の差、等々に切り込んでます。

人種差別的な発言は許せない、とかって公言してる割に、黒人は評価が低い、
つまり腹の中では差別感がある、みたいなことを白日のもとにさらしてます。
それよりももっと評価が、そしてたぶんクラスターの中で一番低いアジア系の男子、
涙目です。黒人なんか比じゃない。

著者もいうように、出会い系サイトのユーザーなのでデータセットの偏りはあるものの、
逆にフェースブックみたいな実名サイトでは表に出てこない発見もあるわけで、
なかなか興味深いです。

中で分析されているデータはOkキューピッドのデータだけではなく、
ツイッターだったりGoogleの検索データだったりと、多岐にわたってます。

で、ずっとずーっと気になってて、やっぱり読んどかないとねぇ、と思ったのが、
ネイト・シルバーですねぇ。


それと最終章近くに、エドワード・スノーデンと、
彼が暴いたPRISMという大規模監視システムのことも出てきたりして、
スノーデンも見ておかないとなぁ、と。



なれないとちょっとグラフとかがたくさん出てくるのでしんどいかもしれませんが、
統計の専門的な話しは著者も意識してはぶいているので、意外と軽く読めます。
これ系の話しがキライじゃなければオススメですよ。





この記事へのコメント

  • ともちん

    こんにちは。
    ともちんと言います。
    なるほど、確かに興味深い話ですね。
    でも、きっとこちらのブログの解説の方が、
    わたしには分かり良いと思います。
    応援しますね。
    2017年02月11日 10:21

この記事へのトラックバック