その情報はお化粧した?それともパネマジ?『統計でウソをつく法』

[この記事は約 7 分で読めます]

今回の書評は『統計でウソをつく法―数式を使わない統計学入門 (ブルーバックス)』です。

統計でウソをつく法成分

統計という道具でデータを盛る手口を紹介

ある綺麗な女性のスッピンがひどかったら、あなたは怒りますか?もしくは、かっこいいと思っていた男性の素顔が汚かったら、あなたは怒りますか?

可愛いは作れる。まさにその通りです。

そもそもお化粧は人前に出ても失礼のないようにするための身だしなみです。しかし写真の場合は光り加減、カメラの角度などでいくらでも盛れるので、ときにパネマジと言われてしまいます(パネマジの意味についてはGoogle検索してください)。

人の容姿だけではありません。私たちが目にする情報の多くは作られたものです。うわさ話だって本当かどうかわからないものが多いです。

本書は、わたしたちが普段接する情報にだまされないようにするにはどうすればよいか?を提案した本です。

空き巣の被害にあわないためには泥棒のやり方(手口)を知るのがいいですね?同じように、だまされないためには、発表された情報がどのように盛られているのか知るのがよいでしょう。

取り扱っている話題は、平均値の使い分け(平均値には少なくとも算術平均、幾何平均、中央値がある)、サンプリング、データのかたより、原因と結果の関連性の見極め、意味のある結果かどうか(検定の考え方)、割引・割増などのパーセンテージ率などです。

難しそうな話題ばかりですが、いずれも数式を使わずに「考え方」を教えてくれます。例えば本書ではこのような内容を扱っています。

  • ある歯磨き粉は他社製よりも虫歯に効果があると言えるのはなぜか?
  • パーセンテージの使い方を工夫すると、その会社の給料が上がったように「見える」のはどうしてか?
  • なぜ平均値を使ってデータを良く見せることができるのか?

これらには必ずトリックがあります。

先ほどの「可愛いは作れる」について、著者のダレル・ハフ氏は「あるリンスを使い始めて女性が美しくなったのは、写真家の力では?」と皮肉を言っています(kindle版位置No.1041付近)。

このように著者は豊富な事例を使ってひとつずつそのトリックを暴いていきます。イラストやグラフも使って説明してくれるため、数学が苦手な初心者向けとして読むことができます。

しいて欠点を挙げるなら、取り扱っている話が古いことでしょうか。出版されたのが50年以上前で、しかもアメリカの話ばかりです。現代風へのアレンジは求められます。

それでも、世に出回っているフェイクニュースにだまされたくない人には是非読んでいただきたい一冊です。

普段ニュースで目にする統計データはそれほど高度な解析はしていません。本書で取り扱っているポイントをしっかり押さえれば、かなり慎重にニュースを見ることができるでしょう。

写真も情報もグラフも見る側の判断に任される

では情報はどのように作られるのでしょうか?ひとつ作ってみましょう。

私はいつも「為替情報は作られてない?」と思っています。なぜならば、下のグラフにあるように操作できるからです。

円対ドルチャートを操作したグラフ

このグラフは直近1ヶ月分の円対ドルの相場を表しています。どちらも全く同じデータですが、グラフ左側の目盛りだけが違います。しかし左のグラフは激しく上下しているように見えて、右のグラフは相場が安定しているように見えませんか?

私がニュースで見る相場のグラフは左のパターンがほとんどです。

もちろん大金を持っている人にとっては、わずかな変動でも大きな差になるでしょう。FX(外国為替証拠金取引)をやっている人にとっては死活問題かもしれません。

しかしこれらを含めても、私にとっては情報を操作しているように感じます。

先ほどのグラフの目盛りは簡単に変えられます。エクセル上のグラフを何回かクリックすればいいのですから。スマホアプリで簡単に写真を加工できる(可愛く作れる)ように、グラフの操作も手軽にできます。

このように、統計ツールも道具です。

だまされたからといって、道具が悪いのではありません。あくまでも見る側、情報を受け取る側が慎重にならなければいけません。

包丁という道具で肉や魚をさばくことができれば、自分の指を切ってしまうこともあります。それと同じで、データは良くも悪くも加工して見せることができます。

上記のグラフの例は私が作ってみました。本書の第6章ではグラフを加工するテクニックについても説明しています。

道具は使う人によって結果が変わります。だからデータも分析する人によって結果が変わります(データを分析する人の仕事をデータサイエンティストといいます)。

以上、フェイクニュースは起こるべくして起きるのです。偶然はありえません。

利益のためなら専門家も大企業もウソを発表する

なぜこのような発表が後を絶たないのでしょうか?

著者は本書で核心を突いた指摘をしています。少し長いですが引用させていただきます。

多分、ここでもっと重要で、心に留めておかなければいけないことは、ごまかすネライに合わせて、統計データを歪曲〔わいきょく〕し、操作するのは、かならずしも統計の専門家ではないということである。おそらく、統計家の机上で導き出されるけがれのない数字が、セールスマンやPR専門家やジャーナリストやコピーライターなどの手にかかって、いつの間にかねじ曲げられ、誇大にされ、極端に簡略化され、取捨選択によってゆがめられていたということなのだろう。

ダレル・ハフ(著)、高木秀玄(翻訳) 『統計でウソをつく法―数式を使わない統計学入門』 講談社ブルーバックス (1968) kindle版位置No.1220付近より引用
〔〕内は筆者が補足

つまり、社会貢献よりも自分たちの利益のためにやるのです。

自社の製品をもっと売りたい、自分たちの考えが正しいことを示したい、そのためにはデータを加工してでも良く見せたいのです。

著者は本書を出版する以前、雑誌の編集者としてメディア業界で活躍した時期がありました。メディアによる情報操作や世論操作を著者は目の当たりにしてきた。だからこそ、本書では具体的な例をたくさん紹介できたのでしょう。

このような情報操作には信頼を失うリスクがあるのに、それよりも承認要求やお金といった欲望が勝ってしまうのでしょう。健康関連では今でもトラブルが多いです。

最近の例では、DeNAが運営していたWELQ(ウェルク)という医療情報のまとめウェブサイトの問題がありました。「死にたい」で情報検索した人に、転職を紹介して利益(紹介料や広告収入)を得ていました。また信頼性に欠ける医療情報を提供して利用者を混乱させました。

東証一部上場の大会社が平気でこういうことをやるわけです。

もちろん大問題になったためWELQは閉鎖になり、DeNAの経営陣は謝罪しました。しかし、このケースは専門家であるはずの医者まで加担していたのでたちが悪いです。

またテレビが情報源だった時代、「発掘!あるある大辞典」という番組でも問題はありました。この番組で納豆のダイエット効果を取り上げたところ、放送の翌日に納豆がものすごく売れました。

しかしこの情報は捏造であることがわかり、番組打ち切りのきっかけとなりました。テレビ局は「納豆にダイエット効果がある」という結論ありきで取材し、またそれに応じた医者の映像も使われていました。

当時レギュラー出演していた志村けんさんが激怒していたのは私も記憶に残っています。

外部リンク:発掘!あるある大事典 – Wikipedia(番組が終了するまでの経緯あり)

このように、わたしたちが目にする情報には慎重になる必要があります。しかし、私も含めて人間は楽をして生きたいので、どうしても都合の良い情報を信じてしまいがちです。

発信する人によって情報はどうしても偏ってしまうのです。だからこそ、誰が発信したか確認する必要があります。

本書の最後には「統計のウソを見破る5つの質問」があります(第10章)。この質問に答えながらニュースを見れば、内容が怪しいかどうか判断できます。活用してみてください。

今回紹介した本