練習問題の解答

各章の練習問題の解答例です。

第1章 統計学とは

1.1 統計学の役割

問1: 記述統計と推測統計の違いを説明してください。

解答:

  • 記述統計: 手元のデータを要約・可視化する手法。例:平均、標準偏差、グラフ作成

  • 推測統計: 標本データから母集団の特性を推測する手法。例:仮説検定、信頼区間

問2: 日常生活で統計学が使われている例を3つ挙げてください。

解答例:

  1. 天気予報(降水確率)

  2. 視聴率調査

  3. 商品レビューの星評価

1.2 データの種類

問1: 以下のデータを適切に分類してください:

解答:

  • a) 郵便番号 → 名義尺度(数字だが計算に意味がない)

  • b) テストの点数 → 比率尺度(絶対的な0がある)

  • c) 映画のレビュー星の数(5段階)→ 順序尺度(順序に意味あり)

  • d) 走った距離 → 比率尺度(連続値、0がある)

問2: なぜデータの種類を理解することが重要なのか、説明してください。

解答: データの種類によって使える統計手法が異なるため。例えば、名義尺度には平均値は計算できないが、順序尺度以上なら中央値が使える。適切な手法を選ぶためにデータの種類を正しく理解する必要がある。

第2章 記述統計

2.1 代表値

問1: 次のデータの平均、中央値、最頻値を求めてください:

解答:

  • 平均: (12+15+18+18+20+22+18+25) / 8 = 148 / 8 = 18.5

  • 中央値: ソート済み [12, 15, 18, 18, 18, 20, 22, 25]、真ん中2つの平均 = (18+18)/2 = 18

  • 最頻値: 18(3回出現)

問2: なぜ収入データでは平均値よりも中央値が使われることが多いのでしょうか?

解答: 収入データは右に歪んだ分布(少数の高所得者)になりやすく、平均は高所得者に引っ張られて実態より高くなる。中央値は外れ値の影響を受けにくいため、「典型的な収入」をより正確に表す。

2.2 散布度

問1: 次のデータの分散と標準偏差を求めてください:

解答:

  • 平均: (10+12+15+18+20) / 5 = 15

  • 各データと平均の差: [-5, -3, 0, 3, 5]

  • 差の二乗: [25, 9, 0, 9, 25]

  • 分散: (25+9+0+9+25) / 5 = 68 / 5 = 13.6

  • 標準偏差: √13.6 ≈ 3.69

問3: なぜ分散では「差の二乗」を使うのでしょうか? 単純に差の合計ではだめでしょうか?

解答: 差の単純な合計は、正の差と負の差が打ち消し合って0になってしまう。二乗することで:

  1. 全ての値が正になる

  2. 大きな差がより強調される

  3. 数学的に扱いやすい性質を持つ

第3章 確率の基礎

3.1 確率とは

問1: トランプ52枚から1枚引く。スペードのエースが出る確率は?

解答: スペードのエースは1枚のみ → 1/52

問2: サイコロを2個振る。目の合計が7になる確率は?

解答:

  • 合計7になる組み合わせ: (1,6), (2,5), (3,4), (4,3), (5,2), (6,1) = 6通り

  • 全ての組み合わせ: 6×6 = 36通り

  • 確率: 6/36 = 1/6

問3: 袋に白玉5個、黒玉3個。2個同時に取り出すとき、両方白である確率は?

解答:

  • 2個選ぶ組み合わせ: C(8,2) = 28

  • 白2個選ぶ組み合わせ: C(5,2) = 10

  • 確率: 10/28 = 5/14 ≈ 0.357

3.3 正規分布

問1: 標準正規分布で、P(-1.96 ≤ Z ≤ 1.96) を求めてください。

解答: 正規分布表より:

  • P(Z ≤ 1.96) = 0.975

  • P(Z ≤ -1.96) = 0.025

  • P(-1.96 ≤ Z ≤ 1.96) = 0.975 - 0.025 = 0.95 (95%)

問2a: ある試験の点数が平均60点、標準偏差15点の正規分布に従うとき、75点以上の人の割合

解答:

  • Z = (75-60)/15 = 1

  • P(Z ≥ 1) = 1 - 0.8413 = 0.159 (約16%)

問4: あるデータの平均が50、標準偏差が5で、ある観測値が70だった。これは外れ値と言えるか

解答:

  • Z = (70-50)/5 = 4

  • |Z| = 4 > 3 なので、外れ値と判定できる(3σルール)

第4章 統計的推定

4.1 標本と母集団

問2: 標本サイズを4倍にすると、標準誤差はどう変化しますか?

解答: 標準誤差 = σ/√n なので、nを4倍にすると: SE_new = σ/√(4n) = σ/(2√n) = SE_old / 2 → 標準誤差は1/2になる(精度が2倍向上)

4.2 点推定と区間推定

問1: 20人の学生のテスト成績: 平均75点、標準偏差10点。母平均の95%信頼区間を求めてください(自由度19のt値=2.093)

解答: 95%信頼区間: 75 ± 2.093 × (10/√20) = 75 ± 2.093 × 2.236 = 75 ± 4.68 = [70.32, 79.68]

問3: 800人中480人が賛成のアンケート結果。母比率の95%信頼区間を求めてください。

解答:

  • 標本比率: 480/800 = 0.6

  • 95%信頼区間: 0.6 ± 1.96 × √(0.6×0.4/800)

  • = 0.6 ± 1.96 × 0.0173

  • = 0.6 ± 0.034

  • = [0.566, 0.634] = [56.6%, 63.4%]

第5章 統計的検定

5.2 t検定

問1: 以下のデータで、μ=50と有意に異なるか検定してください(α=0.05):

解答:

  • 標本平均: 49.9

  • 標本標準偏差: 2.02

  • n = 10

  • t = (49.9 - 50) / (2.02/√10) = -0.1 / 0.638 = -0.157

  • 自由度9の臨界値(両側5%)= ±2.262

  • |t| = 0.157 < 2.262

  • 結論: 有意差なし(μ=50と異なるとは言えない)

第6章 回帰分析

6.1 単回帰分析

問1: 以下のデータから回帰式を求めてください:

x
1
2
3
4
5

y

3

5

7

9

11

解答:

  • 平均: x̄ = 3, ȳ = 7

  • b = Σ(x-x̄)(y-ȳ) / Σ(x-x̄)² = 20 / 10 = 2

  • a = 7 - 2×3 = 1

  • 回帰式: y = 1 + 2x

問2: R² = 0.6の意味を説明してください。

解答: 説明変数xが、目的変数yの変動の60%を説明できることを意味する。残り40%は他の要因や誤差による。


これで全ての章の主要な練習問題の解答を網羅しました。

Last updated