# 1.2 データの種類

統計分析を行う前に、扱うデータの種類を理解することが重要です。データの種類によって、適用できる統計手法が異なります。

## データの分類

### 質的データ（カテゴリカルデータ）

数値で表せない、カテゴリや属性を示すデータです。

#### 名義尺度（Nominal Scale）

順序に意味がないカテゴリデータ

**例:**

* 性別（男性、女性）
* 血液型（A型、B型、O型、AB型）
* 居住地域（東京、大阪、福岡）

#### 順序尺度（Ordinal Scale）

順序に意味があるカテゴリデータ

**例:**

* 満足度（非常に不満、不満、普通、満足、非常に満足）
* 学年（1年生、2年生、3年生）
* 成績（優、良、可、不可）

### 量的データ（数値データ）

数値で表されるデータです。

#### 間隔尺度（Interval Scale）

差に意味があるが、比には意味がないデータ（絶対的な0がない）

**例:**

* 温度（摂氏）: 20℃は10℃の2倍暖かいとは言えない
* 西暦年
* IQスコア

#### 比率尺度（Ratio Scale）

差にも比にも意味があるデータ（絶対的な0がある）

**例:**

* 身長、体重
* 年齢
* 収入
* 売上高

## データの種類と統計手法の対応表

| データの種類 | 代表値 | 使える統計手法     |
| ------ | --- | ----------- |
| 名義尺度   | 最頻値 | カイ二乗検定      |
| 順序尺度   | 中央値 | ノンパラメトリック検定 |
| 間隔尺度   | 平均値 | t検定、分散分析    |
| 比率尺度   | 平均値 | t検定、回帰分析    |

## 実践例

あるアンケート調査で収集されたデータを分類してみましょう:

1. 年齢: **比率尺度**（量的データ）
2. 性別: **名義尺度**（質的データ）
3. サービス満足度（5段階評価）: **順序尺度**（質的データ）
4. 月収: **比率尺度**（量的データ）
5. 好きな色: **名義尺度**（質的データ）

## 練習問題

**問1**: 以下のデータを適切に分類してください:

* a) 郵便番号
* b) テストの点数
* c) 映画のレビュー星の数（5段階）
* d) 走った距離

**問2**: なぜデータの種類を理解することが重要なのか、説明してください。

***

次の章: [第2章 記述統計](https://ringa-hyjs-organization.gitbook.io/ringa_read_site/ji-chu-bian/chapter2)
