〈解説〉点推定 point estimation

点推定

母平均を直接調査することはほぼ不可能なので、少数の標本データをもとに、母平均を推定します。このとき、標本平均を母平均の推定値とすることを点推定といいます。ただし、標本は母集団のごく一部ですから、点推定はほぼ必ず間違えます。つまり、たまたま運よく、標本平均が母平均にきわめて近い値になることはありますが、ぴたりと一致することはありません。

一致性・不偏性

標本サイズが大きくなるほど、標本平均は、より母平均に近い値をとりやすくなります。このような性質を一致性といいます。また、標本平均の期待値は、母平均と一致します。このような性質を不偏性といいます。

〈使用方法〉点推定はかならず失敗するか

分布パラメータと標本サイズの指定

正規分布のパラメータ(平均、標準偏差)、および、標本サイズを指定します。初期値は、平均\(\mu=0\)、標準偏差\(\sigma=1\)、標本サイズ\(n=10\)です。

許容範囲の指定

抽出された標本の平均値\(\bar x = \frac1n \sum x_i\)と、母平均とのずれをどの程度まで許容するかを指定します。初期値は0.01で、\(|\bar x - \mu|\lt 0.01\)のとき、点推定が成功したと考えます。

繰り返し回数の指定と的中回数の予想

指定した条件で何回シミュレーションを繰り返すかを指定し、そのうち何回的中するかを予想します。

所要時間は、繰り返し回数1000で約70秒です(Windows10, Core i7, Chrome 124 で測定。ご利用の環境に依存します)。

〈学習課題〉点推定とその許容範囲

  1. 乱数データのプロット(グレーの小さい点)よりも、その平均値のプロット(赤い点)のほうが、値のばらつきが小さい(プロットの範囲が狭い)のはなぜですか。正規分布の再生性をつかって説明してみましょう。
  2. 許容範囲の値を一定(たとえば0.01)にして、標本サイズが小さいとき(たとえば\(n=3\))と、やや大きいとき(たとえば\(n=30\))とで、平均値が許容範囲内である確率はどう変わるか試してみましょう。また、そのようになる理由を説明してみましょう。
  3. 繰り返し回数の95%くらい「成功」させるためには、許容範囲をどのくらいの値にすればいいでしょうか。また、その許容範囲の値は、標準偏差や標本サイズの値をもちいて計算できないでしょうか。考えてみましょう。
  4. ローデータを使って、各試行ごとの標本平均をもとめ、母平均との差がどれくらいになるかを計算してみましょう。そして、許容範囲内にある試行が何回あったかを数え、画面表示された結果と整合することを確かめましょう。
  5. ローデータをつかって、乱数データの分散が母分散とどれくらい一致するかをみてみましょう。1回ごとの試行について分散を計算し、それをヒストグラムに表します。標本分散と不偏分散では、ヒストグラムの形状がどのくらい異なるかも試してみましょう。

設定と実行

平均値\(\mu=\)   標準偏差\(\sigma=\)   標本サイズ\(n=\)
許容範囲 (母平均と標本平均との差がこの値未満なら点推定は「成功」とみなす)

繰り返し回数   「成功」回数予想