記述統計は、収集したデータの特徴を数値やグラフで要約・表現する手法です。
データの中心を表す代表値(平均、中央値、最頻値)
データのばらつきを表す散布度(分散、標準偏差)
データを視覚的に表現する方法
大量のデータをそのまま見ても、全体の傾向を把握するのは困難です。記述統計を用いることで:
データ全体の傾向を一目で理解できる
異なるデータセット同士を比較できる
データの異常値や偏りを発見できる
100人の学生のテスト成績(0〜100点)があるとします:
85, 72, 90, 65, 88, 76, 92, 81, 70, 95, ...
このデータを記述統計で要約すると:
平均点: 78.5点
中央値: 80点
標準偏差: 12.3点
最高点: 98点
最低点: 45点
これにより、「平均的な成績は78.5点で、ばらつきは12.3点程度」という簡潔な情報が得られます。
代表値(平均・中央値・最頻値)
散布度(分散・標準偏差)
データの可視化
それでは、具体的な手法を学んでいきましょう。
Last updated 2 months ago