練習問題の解答
各章の練習問題の解答例です。
第1章 統計学とは
1.1 統計学の役割
問1: 記述統計と推測統計の違いを説明してください。
解答:
記述統計: 手元のデータを要約・可視化する手法。例:平均、標準偏差、グラフ作成
推測統計: 標本データから母集団の特性を推測する手法。例:仮説検定、信頼区間
問2: 日常生活で統計学が使われている例を3つ挙げてください。
解答例:
天気予報(降水確率)
視聴率調査
商品レビューの星評価
1.2 データの種類
問1: 以下のデータを適切に分類してください:
解答:
a) 郵便番号 → 名義尺度(数字だが計算に意味がない)
b) テストの点数 → 比率尺度(絶対的な0がある)
c) 映画のレビュー星の数(5段階)→ 順序尺度(順序に意味あり)
d) 走った距離 → 比率尺度(連続値、0がある)
問2: なぜデータの種類を理解することが重要なのか、説明してください。
解答: データの種類によって使える統計手法が異なるため。例えば、名義尺度には平均値は計算できないが、順序尺度以上なら中央値が使える。適切な手法を選ぶためにデータの種類を正しく理解する必要がある。
第2章 記述統計
2.1 代表値
問1: 次のデータの平均、中央値、最頻値を求めてください:
解答:
平均: (12+15+18+18+20+22+18+25) / 8 = 148 / 8 = 18.5
中央値: ソート済み [12, 15, 18, 18, 18, 20, 22, 25]、真ん中2つの平均 = (18+18)/2 = 18
最頻値: 18(3回出現)
問2: なぜ収入データでは平均値よりも中央値が使われることが多いのでしょうか?
解答: 収入データは右に歪んだ分布(少数の高所得者)になりやすく、平均は高所得者に引っ張られて実態より高くなる。中央値は外れ値の影響を受けにくいため、「典型的な収入」をより正確に表す。
2.2 散布度
問1: 次のデータの分散と標準偏差を求めてください:
解答:
平均: (10+12+15+18+20) / 5 = 15
各データと平均の差: [-5, -3, 0, 3, 5]
差の二乗: [25, 9, 0, 9, 25]
分散: (25+9+0+9+25) / 5 = 68 / 5 = 13.6
標準偏差: √13.6 ≈ 3.69
問3: なぜ分散では「差の二乗」を使うのでしょうか? 単純に差の合計ではだめでしょうか?
解答: 差の単純な合計は、正の差と負の差が打ち消し合って0になってしまう。二乗することで:
全ての値が正になる
大きな差がより強調される
数学的に扱いやすい性質を持つ
第3章 確率の基礎
3.1 確率とは
問1: トランプ52枚から1枚引く。スペードのエースが出る確率は?
解答: スペードのエースは1枚のみ → 1/52
問2: サイコロを2個振る。目の合計が7になる確率は?
解答:
合計7になる組み合わせ: (1,6), (2,5), (3,4), (4,3), (5,2), (6,1) = 6通り
全ての組み合わせ: 6×6 = 36通り
確率: 6/36 = 1/6
問3: 袋に白玉5個、黒玉3個。2個同時に取り出すとき、両方白である確率は?
解答:
2個選ぶ組み合わせ: C(8,2) = 28
白2個選ぶ組み合わせ: C(5,2) = 10
確率: 10/28 = 5/14 ≈ 0.357
3.3 正規分布
問1: 標準正規分布で、P(-1.96 ≤ Z ≤ 1.96) を求めてください。
解答: 正規分布表より:
P(Z ≤ 1.96) = 0.975
P(Z ≤ -1.96) = 0.025
P(-1.96 ≤ Z ≤ 1.96) = 0.975 - 0.025 = 0.95 (95%)
問2a: ある試験の点数が平均60点、標準偏差15点の正規分布に従うとき、75点以上の人の割合
解答:
Z = (75-60)/15 = 1
P(Z ≥ 1) = 1 - 0.8413 = 0.159 (約16%)
問4: あるデータの平均が50、標準偏差が5で、ある観測値が70だった。これは外れ値と言えるか
解答:
Z = (70-50)/5 = 4
|Z| = 4 > 3 なので、外れ値と判定できる(3σルール)
第4章 統計的推定
4.1 標本と母集団
問2: 標本サイズを4倍にすると、標準誤差はどう変化しますか?
解答: 標準誤差 = σ/√n なので、nを4倍にすると: SE_new = σ/√(4n) = σ/(2√n) = SE_old / 2 → 標準誤差は1/2になる(精度が2倍向上)
4.2 点推定と区間推定
問1: 20人の学生のテスト成績: 平均75点、標準偏差10点。母平均の95%信頼区間を求めてください(自由度19のt値=2.093)
解答: 95%信頼区間: 75 ± 2.093 × (10/√20) = 75 ± 2.093 × 2.236 = 75 ± 4.68 = [70.32, 79.68]
問3: 800人中480人が賛成のアンケート結果。母比率の95%信頼区間を求めてください。
解答:
標本比率: 480/800 = 0.6
95%信頼区間: 0.6 ± 1.96 × √(0.6×0.4/800)
= 0.6 ± 1.96 × 0.0173
= 0.6 ± 0.034
= [0.566, 0.634] = [56.6%, 63.4%]
第5章 統計的検定
5.2 t検定
問1: 以下のデータで、μ=50と有意に異なるか検定してください(α=0.05):
解答:
標本平均: 49.9
標本標準偏差: 2.02
n = 10
t = (49.9 - 50) / (2.02/√10) = -0.1 / 0.638 = -0.157
自由度9の臨界値(両側5%)= ±2.262
|t| = 0.157 < 2.262
結論: 有意差なし(μ=50と異なるとは言えない)
第6章 回帰分析
6.1 単回帰分析
問1: 以下のデータから回帰式を求めてください:
y
3
5
7
9
11
解答:
平均: x̄ = 3, ȳ = 7
b = Σ(x-x̄)(y-ȳ) / Σ(x-x̄)² = 20 / 10 = 2
a = 7 - 2×3 = 1
回帰式: y = 1 + 2x
問2: R² = 0.6の意味を説明してください。
解答: 説明変数xが、目的変数yの変動の60%を説明できることを意味する。残り40%は他の要因や誤差による。
これで全ての章の主要な練習問題の解答を網羅しました。
Last updated