数字やデータ分析をするときに、
「平均」は最も馴染み深い値でしょう。
しかし、「平均」は、時に嘘をつきます。
例えば、
「私の友人5人の平均年収1億円です」
という人がいるとします。
平均年収1億円と聞けば、
友人は皆高収入のすごい人ばかり、と思うかもしれません。
しかし本当に、お金持ちの集まりでしょうか?
カラクリを見てみましょう。
実は、1人だけ年収5億円で、他の4人は0円でした。
そうすると、5億円を5人で割り算すると、
平均で1億円になります。
他の人が低くても、1人だけ高ければ、
平均を取るとこのようになってしまいます。
これが「平均の嘘」です。
まあ、嘘というのは適切ではないかもしれませんが、
簡単に印象が操作されてしまうのです。
ここで、「平均」ではなく、
「最頻値」を調べてみましょう。
「最頻値」とは、
そのデータの中で最も数多く出てくる値のことです。
先ほどの例で考えると、
1人が5億円で、4人が0円ですので、
最頻値は0円です。
「平均」よりも「最頻値」の方が、
集団の年収としてはイメージが合います。
ちなみに今回のケースでは
サンプル数が少なすぎるため、
「最頻値」が適切というわけではありません。
あくまで、「平均」の罠にひっかからないようにね、
という意味で紹介しただけなので、
誤解の無いようにお願いします。
世の中で良く出てくる数字として、
日本人の平均年収や
平均貯蓄
平均寿命など
色々と「平均」を使っているものがあります。
平均や統計の数字を見ると、
信憑性が高く見えたり、
確かに「らしく」見えますが、
それがどのような意味を持つのか、
疑って見てみるようにしましょう。
今日の課題:
何か「平均」の数字を探してみましょう。
そして、その「平均」に含まれている数字が何なのか、
検証してみましょう。