「平均値」と「中央値」の違い
「平均値」は一連の数値の合計を、その数値の数で割ったものです。たとえば、数値が「1、2、3」の場合、その平均値は(1+2+3)/3=2となります。
一方、「中央値」は数値を大きさの順に並べたときに中央に位置する数値のことを指します。もし数値の数が偶数である場合は、中央の2つの数値の平均を取ります。例えば、「1、2、3、4」の中央値は、(2+3)/2=2.5となります。
平均値は全体のデータを考慮しますが、外れ値の影響を強く受ける傾向があります。一方、中央値は外れ値の影響を受けにくいという特性があります。したがって、どちらを使用するかはデータの特性や目的によります。
なお、「外れ値」とは、データセットの他の値から大きく異なる値のことを指します。具体的には、他のデータポイントから大きく離れているため、統計的な分析やモデルの構築において影響を及ぼす可能性があります。
それぞれの意味
「平均値」の意味
「平均値」は一連の数値の合計を、その数値の数で割ったもので、これを算術平均とも呼びます。具体的な計算方法は以下の通りです:
平均 = (数値1 + 数値2 + 数値3 + … + 数値n)/ n
ここで、nは数値の数を表します。
平均値はデータの「中心的な傾向」を示すと言われています。データ全体を考慮に入れるので、データセットの全体像を良く反映します。一方、平均値はデータセット内の極端な値(外れ値)に大きく影響を受ける傾向があります。つまり、数値が1つまたは数つの極端な値によって引き上げられたり下げられたりすると、平均値はその影響を強く受け、データセットの真の「中心」を表現しきれなくなることがあります。
たとえば、あるクラスのテストの平均点数が85点であるとします。この情報だけでは、全員が85点を取ったのか、それともほとんどの生徒が100点近くで一部の生徒が非常に低い点数を取ったのか、あるいは他の様々な組み合わせがあるのかはわかりません。平均値はこのような詳細な情報を省略しますが、それでも全体的なパフォーマンスを大まかに示す有用な指標となります。
また、科学的な研究では、平均値はしばしばそのばらつきとともに報告されます(例えば、標準偏差や標準誤差)。これにより、データが平均値の周囲にどれほど集中(または分散)しているかの感覚を得ることができます。
「中央値」の意味
「中央値」は、数値データを昇順または降順に並べたときに中央に位置する値を指します。データの数が奇数の場合、中央値はちょうど中央の値です。データの数が偶数の場合、中央値は中央の2つの値の平均となります。
例えば、「1、2、3、4、5」のデータセットでは、中央値は3です。しかし、「1、2、3、4」のデータセットでは、中央値は(2+3)/2 = 2.5となります。
中央値の主な特徴は、データセットの外れ値に対する抵抗性です。極端な値が存在する場合でも、その影響を受けにくいです。たとえば、「1、2、3、1000」のデータセットの中央値は2.5で、この値は1000という極端な値の影響を受けていません。
中央値はデータセットの「真ん中」にある値を示すため、データの分布が非対称である場合や、一部の値が他の値と大幅に異なる場合に特に有用です。例えば、給与データなど、分布が歪んでいる(つまり、非常に高い値や非常に低い値が存在する)データセットにおいては、平均値よりも中央値の方が「典型的な」値をより正確に表すことがしばしばあります。
ただし、中央値はデータ全体の情報を考慮しないため、すべての値が完全に等しく扱われる平均値とは対照的に、データの形状や全体的な特性を必ずしも反映しない可能性があります。そのため、データを解釈する際には、中央値だけでなく他の統計量(平均値、モード、範囲、分散、標準偏差など)も考慮することが重要です。
「平均値」と「中央値」の使い方・使用例
「平均値」の使用例
- 全社員の平均年収は600万円である。
- 今回のテストのクラス平均は78点だった。
- 地元の気象局によると、今年の平均気温は25.2℃だ。
- そのバスケットボール選手は、今シーズン平均20得点を挙げている。
- 株式市場の平均リターンは年率7%である。
「中央値」の使用例
- 我が国の世帯の中央所得は500万円である。
- 売られた家の価格の中央値は5千万円だった。
- 今回のテストの中央値は80点だった。
- 調査によると、一日のスマートフォン利用時間の中央値は3時間である。
- 町の年齢分布では、中央値は40歳だった。
「平均値」と「中央値」に似た言葉
- 最頻値 (Mode): 一連の数値の中で最も頻繁に現れる値。データセット内で最も多く出現する値。
- 分散 (Variance): データのばらつきの度合いを示す指標。各データと平均値との差を二乗して、その平均を取ったもの。
- 標準偏差 (Standard Deviation): 分散の平方根として得られる値。データのばらつきの程度を示す。
- 範囲 (Range): データセット内の最大値と最小値との差。データの全体的なばらつきの大きさを示す。
「平均値」と「中央値」の違いに関するみんなのツイート
給与所得の平均値と中央値の違いが重要なのは、年齢を例に考えるなら、サンプル100人の中にデーモン小暮がいた時、中央値が50歳くらいでも、平均値は1000歳超えるようなことが起こるからだ。
— 林 譲治 (@J_kaliy) January 24, 2022
💰二人以上世帯平均貯蓄額💰
年代 平均値 中央値
20代 212万円 63万円
30代 752万円 238万円
40代 916万円 300万円
50代 1,386万円 400万円
60代 2,427万円 810万円
70代 2,209万円 1,000万円
平均値と中央値の違いはリプ欄👇— せいか🍀頑張らないゆるふわ資産形成 (@hokyo_yu) June 21, 2023
おはようございま~す☺️
昨日、平均値と中央値の違いについて社員同士が話していたところに遭遇しました☘️
ヤバい…正確な所がよく分からない😨
スマホに電話がかかってきたフリをしてその場を逃げ去り、トイレでネットで調べて意気揚々と戻ったら誰もいませんでした😭
本日も宜しくお願いします☺️
— 草吉 (@kusakichi0316) July 11, 2023
1分でわかる統計
平均値と中央値の違い
それぞれ5人の年収。A:300
B:300
C:300
D:400
E:1400の5人がいて
合計3000。
平均値は600
中央値は300
2倍も違う!平均値は合計したのを人数で割るから600万
中央値は高い順か低い順に並べたときの真ん中なので
300万
というカラクリ。— zack@臨戦体制時間持ち (@zack32319636) January 23, 2021