■ 『統計でウソをつく法』  統計学入門  (2025-3-6)







いま手元にあるこのブルーバックスの奥付をみると、発行年(初版)は1968年、2001/10には第66刷を重ねている。
超ロング・セラーだ。いまや、データを扱うすべての人にとって「必須・教科書」というべき存在ではないか。


はしがきによれば、本書の目的は「だまされないために、だます方法を知ることのすすめ」とある。なかなか皮肉な表現ですね。統計用語を正しく理解していないと、統計がだます方法になっていることを見逃してしまうという。もちろん、「統計データを、あやまりなく、誤解されないように、正確に伝える技術」として本書を参考にすることが大切だ。

事実がものをいう社会では,「人に訴える力」が大きく注目される。統計学は、物ごとを評価したり,誇張したり、混乱させたり、また極度に単純化するのに効果的な手段である。社会や経済の動向、企業の経営状態、世論調査、国勢調査などの膨大なデータを記録するには欠かせないものだ。

「平均値」と聞いて、それがどの種類の平均値か――いわゆる平均値(算術平均)それとも中央値(中位置)、あるいは最頻値(並み数)のどれであるかを理解することが求められる。例えば、人間の体位に関するデータであれば、それぞれの平均値が一カ所に寄ってくる。もとの体位データが正規分布であり、算術平均も中央値も最頻値も同じになる。

サンプリング(標本調査)の問題は、「統計」に言及するときに、最も重要な見逃せないテーマである。サンプルには偏りがつきもの。偏りがあったり、小さかったりするサンプルから導きだされた結論には、多くの問題が背後にひそんでいることを理解しよう。

サンプルの重要性を示す有名な失敗例がある。米国の1936年の大統領選挙で、「リテラリー・ダイジェスト」誌は、ランドン候補(共和党)370に対して、ルーズベルト候補(民主党)は161と、共和党の勝利を自信をもって発表した。ところが、ランドン候補は36.5%にとどまり、ルーズベルト候補は60,8%と圧勝し大統領になった。

この失敗の原因はサンプルの偏りを見逃したことだ。前回1932年の大統領選挙で結果を正確に予測したリストからサンプルとして、1000万人の電話所有者と雑誌購読者を抽出した。当時、電話を所有しこの雑誌を購読する人たちというのは経済的にも特別であった。サンプルに共和党支持者が多いという偏りがあったのだ。

本書の結尾では、統計のウソを見破る方法として「5つのカギ」を挙げている。統計データについて心して読めば効果があるだろう。
(1)誰がそういっているのか? (2)どういう方法でわかったのか?
(3)足りないデータはないか? (4)いっていることが違ってやしないか?
(5)意味があるかしら?


◆『統計でウソをつく法 数式を使わない統計学入門』 ダレル・ハフ著/高木秀玄訳
    講談社ブルーバックス、1968/7初版、2001/10第66刷

    HOME      読書ノートIndex     ≪≪ 前の読書ノートへ    次の読書ノートへ ≫≫