第2章 記述統計

記述統計は、収集したデータの特徴を数値やグラフで要約・表現する手法です。

この章で学ぶこと

  • データの中心を表す代表値(平均、中央値、最頻値)

  • データのばらつきを表す散布度(分散、標準偏差)

  • データを視覚的に表現する方法

記述統計の目的

大量のデータをそのまま見ても、全体の傾向を把握するのは困難です。記述統計を用いることで:

  • データ全体の傾向を一目で理解できる

  • 異なるデータセット同士を比較できる

  • データの異常値や偏りを発見できる

実例

100人の学生のテスト成績(0〜100点)があるとします:

85, 72, 90, 65, 88, 76, 92, 81, 70, 95, ...

このデータを記述統計で要約すると:

  • 平均点: 78.5点

  • 中央値: 80点

  • 標準偏差: 12.3点

  • 最高点: 98点

  • 最低点: 45点

これにより、「平均的な成績は78.5点で、ばらつきは12.3点程度」という簡潔な情報が得られます。

この章の構成

  1. 代表値(平均・中央値・最頻値)

  2. 散布度(分散・標準偏差)

  3. データの可視化

それでは、具体的な手法を学んでいきましょう。

Last updated