教師のための統計入門-136/233page
問2 生のデータから求めた平均値 -x と,度数分布表から求めた平均値 -x'との差は,どのように考えればよいのですか。
(答え) 度数分布表の階級の幅を c としますと, | -x−-x' | ≦ c/2き,容易に証明できます。つまり,次の不等式が成立します。
例えば, c=10 としますと, -x と -x' との間には,最大限±5の差があることになり,ちょっと,大きなずれのような気がします。したがって,できるだけくわしく平均値を求めたいときには,階級の幅cを小さくしなければなりません。しかし,逆にcを小さくしますと,度数分布表から,全体の傾向がつかみにくくなります。
要するに,そのデータから,どの程度のことが知りたいのか,そこをよく確かめてから度数分布表をつくるようにします。どうしてもくわしい平均値を知る必要があるときには,生のデータから平均値を計算しなければなりません。
ちょっと固いことをいいましたが,実際には, n がある程度大のとき, -x と -x' との差はそう大きなものにはならないようです。また,この理論的背景には,次のことがあげられます。
階級内の各値の誤差 Xi が一様分布をする,と仮定しますと,
したがって, n が十分大のときには,誤差の平均値一文の分布は,
正規分布(0, c2/12)に近似します。そして,誤差の平均値と,度数分布表から得られた平均値の誤差Eとは一致しますので,