代表値は、データ全体の「中心的な傾向」を1つの数値で表すものです。
全てのデータの合計をデータ数で割った値です。
計算式:
xˉ=nx1+x2+...+xn=n1i=1∑nxi 例: 5人のテスト成績が [70, 80, 85, 90, 95] の場合
平均=570+80+85+90+95=5420=84 特徴:
データを小さい順に並べたときの真ん中の値です。
求め方:
例1(奇数): [65, 70, 80, 85, 90] → 中央値は 80
例2(偶数): [65, 70, 80, 85, 90, 95] → 中央値は (80 + 85) / 2 = 82.5
特徴:
データの中で最も頻繁に出現する値です。
例: [70, 80, 80, 85, 90, 90, 90, 95] → 最頻値は 90(3回出現)
特徴:
データセット1: [60, 70, 80, 90, 100]
データセット2: [10, 70, 80, 90, 100]
→ 平均は外れ値(10)に引っ張られて低くなっています。
あるクラスの年収データ(万円):
平均: 1,019万円 ← 高所得者1人に引っ張られている
このケースでは中央値の方が「典型的な年収」を表しています。
問1: 次のデータの平均、中央値、最頻値を求めてください:
問2: なぜ収入データでは平均値よりも中央値が使われることが多いのでしょうか?
問3: 以下のデータで平均と中央値を比較し、どちらがより適切か考えてください:
次のセクション: 2.2 散布度(分散・標準偏差)
Last updated