最近は東京大学出版会の統計学入門を用いて、統計学に再入門しています。標本分散の定義に が出てくるのはなぜだっけ?というところからよくわかっていなかったので、何回かに分けてその理由をメモしていきます。
推定とはなにかというところから出発します。若干迂遠に感じられるかもしれませんが、間違い探しだと思ってお付き合いください。
-
-
- -
-
確率的に変動する要素がある場合、わたしたちはその変動をできるだけ正確に見積もりたいのに対して、厳密に調べつくすことは現実的ではないという問題に遭遇します。
例えばさいころを振ることを考えても、実際にはわたしたちは有限回しかさいころを振るという行動はできません。
したがって、「理想的なさいころであればそれぞれの目が出る確率は になるはずだ」ということに対して、手元にあるさいころの背後にある確率分布を精密に調べることは不可能です。
そうであれば、実験、調査、測定などによって得られたデータ(これを標本と呼ぶ)のどのような性質を見れば、確率分布の持つ平均や分散などといった特徴(これを母数と呼ぶ)を調べられるでしょうか?また、性質の見方には指標があるでしょうか?ということを考える必要が生じます。
この記事群では一致推定量、不偏推定量という観点から、母平均と母分散を"推定"することを考えていきます。*1
*1:実は個人的に計算でつまづいたところがあったので、自分用メモの側面もあります。