中央値と最頻値を知っておこう!
では、平均値が参考にならなそうな場合、一体どうしたら良いのでしょうか? 今回は、知っておくと便利な代表値を紹介します。一つ目は「中央値(メジアン)」です。ざっくり説明すると、「順番に並べたときの真ん中の値」のことです。
「極端な値がある場合」で紹介した年収の例では
Aさん:320万円
Bさん:400万円
Cさん:460万円 ←真ん中
Dさん:520万円
Eさん:2億円
なので、中央値は460万円となります。
「格差がある場合」で紹介したテストの点数の例では
Aさん:14点
Bさん:19点
Cさん:21点
Dさん:28点 ←真ん中
Eさん:91点
Fさん:98点
Gさん:100点
なので、中央値は28点となります。
二つ目は「最頻値(モード)」です。ざっくり説明すると、「一番多く発生している値」のことです。
「極端な値がある場合」で紹介した年収の例を、100万円刻みで年収を分類すると
300万円以上400万円未満:1人
400万円以上500万円未満:2人 ←人数最多
500万円以上600万円未満:1人
2億円以上2億100万円未満:1人
その他:0人
となります。この場合の最頻値は、「400万円以上500万円未満」の中間の値である450万円とするのが一般的です。
「格差がある場合」で紹介したテストの点数の例を、10点刻みで年収を分類すると
10点以上20点未満:2人
20点以上30点未満:2人
90点以上100点以下:3人 ←人数最多
その他:0人
となります。この場合の最頻値は、「90点以上100点以下」の中間の値である95点とするのが一般的です。
以上、上で挙げた2つのケースについて平均値、中央値、最頻値をまとめると、以下のようになります。
①「極端な値がある場合」の例
平均値:4340万円
中央値:460万円
最頻値:450万円
②「格差がある場合」の例
平均値:53点
中央値:28点
最頻値:95点
どちらのケースも、中央値と最頻値が、平均値とはかなり違った値になっていますね。
では最後に、実社会のデータにおいて、「平均値・中央値・最頻値」を見てみましょう。
厚生労働省が発表した平成29年調査の「所得分布(所得金額階級別世帯数の相対度数分布)」を見てみると…
平均値:560万2000円
中央値:442万円
最頻値:350万円
となっています。平均値と中央値には100万円以上の差があり、平均値と最頻値には200万円以上もの差があるのです。さらに、詳しくデータを見てみましょう。100万円刻みの各階級が占める割合をランキングにしてみると…
1位 300万円以上400万円未満:13.8%
2位 200万円以上300万円未満:13.3%
3位 100万円以上200万円未満:12.3%
4位 400万円以上500万円未満:10.6%
5位 500万円以上600万円未満:8.9%
となっています。平均値560万2000円が入っているのは「500万円以上600万円未満」なので、5位です。
つまり「平均値くらいの人が一番多そう」というイメージに反していることがわかります。1位~4位を、平均値より低い所得の層が占めているのも気になるところです。
こんな風にデータを読みとってみると、平均値だけを見ていたときよりも、多くの情報を読み取ることができます。
「今、私たちの生きる社会では何が起こっているのだろう?」と考えるヒントになるのです。
ちなみに、今回紹介した「平均値・中央値・最頻値」の話は、2020年現在の高校数学課程の数学Ⅰ「データの分析」に含まれています。
高校の数学、けっこう役に立っていますね!
記事内容に一部誤りがあったため、修正して再送しております。