# 5.2 t検定

最もよく使われる統計的検定の1つ、t検定を学びます。

## t検定とは

母集団が正規分布に従い、母分散が未知の場合に使う平均値の検定

**3つのタイプ:**

1. 一標本t検定: 標本平均と基準値を比較
2. 対応のあるt検定: 同じ対象の前後を比較
3. 対応のないt検定: 2つの独立したグループを比較

## 1. 一標本t検定

### 目的

標本の平均が、ある特定の値と異なるかを検定

### 仮説

* H₀: μ = μ₀
* H₁: μ ≠ μ₀

### 検定統計量

$$
t = \frac{\bar{x} - \mu\_0}{s / \sqrt{n}}
$$

自由度: n - 1

### 実践例

**問題:** ある製品の規格値は100g。サンプル10個の重量:

```
98, 102, 99, 101, 97, 103, 100, 98, 102, 100
```

規格通りか検定せよ（α = 0.05）

**解答:**

Step 1: 統計量を計算

* 標本平均: $\bar{x}$ = 100g
* 標本標準偏差: s = 2.0g
* n = 10

Step 2: 仮説

* H₀: μ = 100
* H₁: μ ≠ 100

Step 3: t値を計算

$$
t = \frac{100 - 100}{2.0 / \sqrt{10}} = 0
$$

Step 4: 判定

* 自由度9のt分布で、臨界値（両側5%）= ±2.262
* |t| = 0 < 2.262
* p値 = 1.0 > 0.05

**結論:** 帰無仮説を棄却できない。規格通りと判断。

## 2. 対応のあるt検定（ペアt検定）

### 目的

同じ対象の2回の測定値を比較

### 使用場面

* 治療前後の比較
* 同じ人の左右の測定
* 同じ商品の変更前後

### 仮説

* H₀: μ\_d = 0（差の平均が0）
* H₁: μ\_d ≠ 0

### 検定統計量

$$
t = \frac{\bar{d}}{s\_d / \sqrt{n}}
$$

ここで、$\bar{d}$ は差の平均、$s\_d$ は差の標準偏差

### 実践例

**問題:** 10人の学生が補習を受けた。成績は上がったか?

| 学生 | 前  | 後  | 差 |
| -- | -- | -- | - |
| 1  | 60 | 65 | 5 |
| 2  | 55 | 60 | 5 |
| 3  | 70 | 75 | 5 |
| 4  | 65 | 70 | 5 |
| 5  | 50 | 52 | 2 |
| 6  | 75 | 80 | 5 |
| 7  | 68 | 70 | 2 |
| 8  | 72 | 78 | 6 |
| 9  | 58 | 63 | 5 |
| 10 | 63 | 68 | 5 |

**解答:**

* 差の平均: $\bar{d}$ = 4.5点
* 差の標準偏差: $s\_d$ = 1.43
* n = 10

$$
t = \frac{4.5}{1.43 / \sqrt{10}} = 9.95
$$

* 自由度9の臨界値（両側5%）= 2.262
* t = 9.95 > 2.262
* p < 0.001

**結論:** 有意に成績が上がった（p < 0.001）

## 3. 対応のないt検定（独立標本t検定）

### 目的

2つの独立したグループの平均を比較

### 使用場面

* 男性vs女性
* 治療群vs対照群
* A社製品vsB社製品

### 仮説

* H₀: μ₁ = μ₂
* H₁: μ₁ ≠ μ₂

### 検定統計量（等分散の場合）

$$
t = \frac{\bar{x}\_1 - \bar{x}\_2}{\sqrt{s\_p^2 \left(\frac{1}{n\_1} + \frac{1}{n\_2}\right)}}
$$

プールされた分散:

$$
s\_p^2 = \frac{(n\_1-1)s\_1^2 + (n\_2-1)s\_2^2}{n\_1 + n\_2 - 2}
$$

自由度: n₁ + n₂ - 2

### 実践例

**問題:** 新しい教授法の効果を検証

**A組（従来法）:** n=15, 平均=70, SD=10 **B組（新手法）:** n=15, 平均=78, SD=12

α = 0.05で有意差はあるか?

**解答:**

Step 1: プールされた分散を計算

$$
s\_p^2 = \frac{14 \times 100 + 14 \times 144}{28} = \frac{1400 + 2016}{28} = 122
$$

Step 2: t値を計算

$$
t = \frac{70 - 78}{\sqrt{122 \left(\frac{1}{15} + \frac{1}{15}\right)}} = \frac{-8}{\sqrt{122 \times 0.133}} = \frac{-8}{4.03} = -1.99
$$

Step 3: 判定

* 自由度28の臨界値（両側5%）≈ ±2.048
* |t| = 1.99 < 2.048
* p ≈ 0.056 > 0.05

**結論:** 有意水準5%では有意差があるとは言えない（ギリギリ）

## Welchのt検定（不等分散の場合）

分散が等しくない場合に使用

**検定統計量:**

$$
t = \frac{\bar{x}\_1 - \bar{x}\_2}{\sqrt{\frac{s\_1^2}{n\_1} + \frac{s\_2^2}{n\_2}}}
$$

自由度の計算が複雑（ソフトウェアで自動計算）

## t検定の前提条件

1. **正規性**: データが正規分布に従う
   * 小サンプル: 厳密に必要
   * 大サンプル（n≥30）: 中心極限定理で緩和
2. **独立性**: 観測が互いに独立
3. **等分散性**（対応なしの場合）:
   * F検定やLevene検定で確認
   * 違反時はWelchのt検定を使用

## 効果量（Effect Size）

統計的有意性とは別に、効果の大きさを表す指標

### Cohen's d

$$
d = \frac{\bar{x}\_1 - \bar{x}\_2}{s\_p}
$$

**解釈:**

* |d| = 0.2: 小さい効果
* |d| = 0.5: 中程度の効果
* |d| = 0.8: 大きい効果

前述の教授法の例:

$$
d = \frac{70 - 78}{\sqrt{122}} = \frac{-8}{11.05} = -0.72
$$

→ 中〜大程度の効果

## t検定のまとめ

| 種類   | 使用場面        | 例        |
| ---- | ----------- | -------- |
| 一標本  | 標本平均 vs 基準値 | 製品が規格通りか |
| 対応あり | 同じ対象の前後     | 治療前後の比較  |
| 対応なし | 2つの独立グループ   | 男性vs女性   |

## 練習問題

**問1:** 以下のデータで、μ=50と有意に異なるか検定してください（α=0.05）:

```
48, 52, 49, 51, 47, 53, 50, 48, 52, 49
```

**問2:** 対応のあるt検定と対応のないt検定の使い分けを説明してください。

**問3:**

* グループA: n=20, 平均=85, SD=15
* グループB: n=25, 平均=78, SD=18

対応のないt検定を実施し、有意差があるか判定してください（α=0.05）。

**問4:** p=0.06とCohen's d=1.2の結果をどう解釈しますか?

***

次の章: [第6章 回帰分析](https://ringa-hyjs-organization.gitbook.io/ringa_read_site/ying-yong-bian/chapter6)