1.2 データの種類

統計分析を行う前に、扱うデータの種類を理解することが重要です。データの種類によって、適用できる統計手法が異なります。

データの分類

質的データ(カテゴリカルデータ)

数値で表せない、カテゴリや属性を示すデータです。

名義尺度(Nominal Scale)

順序に意味がないカテゴリデータ

例:

  • 性別(男性、女性)

  • 血液型(A型、B型、O型、AB型)

  • 居住地域(東京、大阪、福岡)

順序尺度(Ordinal Scale)

順序に意味があるカテゴリデータ

例:

  • 満足度(非常に不満、不満、普通、満足、非常に満足)

  • 学年(1年生、2年生、3年生)

  • 成績(優、良、可、不可)

量的データ(数値データ)

数値で表されるデータです。

間隔尺度(Interval Scale)

差に意味があるが、比には意味がないデータ(絶対的な0がない)

例:

  • 温度(摂氏): 20℃は10℃の2倍暖かいとは言えない

  • 西暦年

  • IQスコア

比率尺度(Ratio Scale)

差にも比にも意味があるデータ(絶対的な0がある)

例:

  • 身長、体重

  • 年齢

  • 収入

  • 売上高

データの種類と統計手法の対応表

データの種類
代表値
使える統計手法

名義尺度

最頻値

カイ二乗検定

順序尺度

中央値

ノンパラメトリック検定

間隔尺度

平均値

t検定、分散分析

比率尺度

平均値

t検定、回帰分析

実践例

あるアンケート調査で収集されたデータを分類してみましょう:

  1. 年齢: 比率尺度(量的データ)

  2. 性別: 名義尺度(質的データ)

  3. サービス満足度(5段階評価): 順序尺度(質的データ)

  4. 月収: 比率尺度(量的データ)

  5. 好きな色: 名義尺度(質的データ)

練習問題

問1: 以下のデータを適切に分類してください:

  • a) 郵便番号

  • b) テストの点数

  • c) 映画のレビュー星の数(5段階)

  • d) 走った距離

問2: なぜデータの種類を理解することが重要なのか、説明してください。


次の章: 第2章 記述統計

Last updated