# 練習問題の解答

各章の練習問題の解答例です。

## 第1章 統計学とは

### 1.1 統計学の役割

**問1:** 記述統計と推測統計の違いを説明してください。

**解答:**

* **記述統計**: 手元のデータを要約・可視化する手法。例：平均、標準偏差、グラフ作成
* **推測統計**: 標本データから母集団の特性を推測する手法。例：仮説検定、信頼区間

**問2:** 日常生活で統計学が使われている例を3つ挙げてください。

**解答例:**

1. 天気予報（降水確率）
2. 視聴率調査
3. 商品レビューの星評価

### 1.2 データの種類

**問1:** 以下のデータを適切に分類してください:

**解答:**

* a) 郵便番号 → **名義尺度**（数字だが計算に意味がない）
* b) テストの点数 → **比率尺度**（絶対的な0がある）
* c) 映画のレビュー星の数（5段階）→ **順序尺度**（順序に意味あり）
* d) 走った距離 → **比率尺度**（連続値、0がある）

**問2:** なぜデータの種類を理解することが重要なのか、説明してください。

**解答:** データの種類によって使える統計手法が異なるため。例えば、名義尺度には平均値は計算できないが、順序尺度以上なら中央値が使える。適切な手法を選ぶためにデータの種類を正しく理解する必要がある。

## 第2章 記述統計

### 2.1 代表値

**問1:** 次のデータの平均、中央値、最頻値を求めてください:

```
[12, 15, 18, 18, 20, 22, 18, 25]
```

**解答:**

* **平均**: (12+15+18+18+20+22+18+25) / 8 = 148 / 8 = **18.5**
* **中央値**: ソート済み \[12, 15, 18, 18, 18, 20, 22, 25]、真ん中2つの平均 = (18+18)/2 = **18**
* **最頻値**: **18**（3回出現）

**問2:** なぜ収入データでは平均値よりも中央値が使われることが多いのでしょうか?

**解答:** 収入データは右に歪んだ分布（少数の高所得者）になりやすく、平均は高所得者に引っ張られて実態より高くなる。中央値は外れ値の影響を受けにくいため、「典型的な収入」をより正確に表す。

### 2.2 散布度

**問1:** 次のデータの分散と標準偏差を求めてください:

```
[10, 12, 15, 18, 20]
```

**解答:**

* 平均: (10+12+15+18+20) / 5 = 15
* 各データと平均の差: \[-5, -3, 0, 3, 5]
* 差の二乗: \[25, 9, 0, 9, 25]
* **分散**: (25+9+0+9+25) / 5 = 68 / 5 = **13.6**
* **標準偏差**: √13.6 ≈ **3.69**

**問3:** なぜ分散では「差の二乗」を使うのでしょうか? 単純に差の合計ではだめでしょうか?

**解答:** 差の単純な合計は、正の差と負の差が打ち消し合って0になってしまう。二乗することで:

1. 全ての値が正になる
2. 大きな差がより強調される
3. 数学的に扱いやすい性質を持つ

## 第3章 確率の基礎

### 3.1 確率とは

**問1:** トランプ52枚から1枚引く。スペードのエースが出る確率は?

**解答:** スペードのエースは1枚のみ → **1/52**

**問2:** サイコロを2個振る。目の合計が7になる確率は?

**解答:**

* 合計7になる組み合わせ: (1,6), (2,5), (3,4), (4,3), (5,2), (6,1) = 6通り
* 全ての組み合わせ: 6×6 = 36通り
* 確率: **6/36 = 1/6**

**問3:** 袋に白玉5個、黒玉3個。2個同時に取り出すとき、両方白である確率は?

**解答:**

* 2個選ぶ組み合わせ: C(8,2) = 28
* 白2個選ぶ組み合わせ: C(5,2) = 10
* 確率: **10/28 = 5/14 ≈ 0.357**

### 3.3 正規分布

**問1:** 標準正規分布で、P(-1.96 ≤ Z ≤ 1.96) を求めてください。

**解答:** 正規分布表より:

* P(Z ≤ 1.96) = 0.975
* P(Z ≤ -1.96) = 0.025
* P(-1.96 ≤ Z ≤ 1.96) = 0.975 - 0.025 = **0.95 (95%)**

**問2a:** ある試験の点数が平均60点、標準偏差15点の正規分布に従うとき、75点以上の人の割合

**解答:**

* Z = (75-60)/15 = 1
* P(Z ≥ 1) = 1 - 0.8413 = **0.159 (約16%)**

**問4:** あるデータの平均が50、標準偏差が5で、ある観測値が70だった。これは外れ値と言えるか

**解答:**

* Z = (70-50)/5 = 4
* |Z| = 4 > 3 なので、**外れ値と判定できる**（3σルール）

## 第4章 統計的推定

### 4.1 標本と母集団

**問2:** 標本サイズを4倍にすると、標準誤差はどう変化しますか?

**解答:** 標準誤差 = σ/√n なので、nを4倍にすると: SE\_new = σ/√(4n) = σ/(2√n) = SE\_old / 2 → **標準誤差は1/2になる（精度が2倍向上）**

### 4.2 点推定と区間推定

**問1:** 20人の学生のテスト成績: 平均75点、標準偏差10点。母平均の95%信頼区間を求めてください（自由度19のt値=2.093）

**解答:** 95%信頼区間: 75 ± 2.093 × (10/√20) = 75 ± 2.093 × 2.236 = 75 ± 4.68 = **\[70.32, 79.68]**

**問3:** 800人中480人が賛成のアンケート結果。母比率の95%信頼区間を求めてください。

**解答:**

* 標本比率: 480/800 = 0.6
* 95%信頼区間: 0.6 ± 1.96 × √(0.6×0.4/800)
* \= 0.6 ± 1.96 × 0.0173
* \= 0.6 ± 0.034
* \= **\[0.566, 0.634] = \[56.6%, 63.4%]**

## 第5章 統計的検定

### 5.2 t検定

**問1:** 以下のデータで、μ=50と有意に異なるか検定してください（α=0.05）:

```
[48, 52, 49, 51, 47, 53, 50, 48, 52, 49]
```

**解答:**

* 標本平均: 49.9
* 標本標準偏差: 2.02
* n = 10
* t = (49.9 - 50) / (2.02/√10) = -0.1 / 0.638 = -0.157
* 自由度9の臨界値（両側5%）= ±2.262
* |t| = 0.157 < 2.262
* **結論: 有意差なし（μ=50と異なるとは言えない）**

## 第6章 回帰分析

### 6.1 単回帰分析

**問1:** 以下のデータから回帰式を求めてください:

| x | 1 | 2 | 3 | 4 | 5  |
| - | - | - | - | - | -- |
| y | 3 | 5 | 7 | 9 | 11 |

**解答:**

* 平均: x̄ = 3, ȳ = 7
* b = Σ(x-x̄)(y-ȳ) / Σ(x-x̄)² = 20 / 10 = 2
* a = 7 - 2×3 = 1
* **回帰式: y = 1 + 2x**

**問2:** R² = 0.6の意味を説明してください。

**解答:** 説明変数xが、目的変数yの変動の60%を説明できることを意味する。残り40%は他の要因や誤差による。

***

これで全ての章の主要な練習問題の解答を網羅しました。
