教師のための統計入門-010/233page
3. 代表値
(1) 平均値(算術平均相加平均ともいう。xやmで表す。)
n個の値X1,X2,……,Xnの平均値x(エックスバー)は,次の式で定義されます。X=X1+X2+…+Xn/n
この式をみてもわかりますように,平均値は,全部の値を"ならした"値であり,データの一つ一つの値が,それぞれ自分自身の持つ情報を提供していることもわかります。そして,この各自の情報が提供されている点が,あとで説明する中央値や並み数にくらべて優れています。
しかし,平均値が,中央値や並み数にくらべて,代表値として最もよく用いられる理由は,実は,統計学の理論を展開するのに,平均値が極めて都合のよいことがわかっているからです。
少し極端にいえば,統計学とは,「平均値に関する学問である」といってもよいくらいなのです。
なお,平均値には,データの各値が,等しく影響する,という長所があるわけですが,この長所は,ときには短所に変ずることもあります。
例えば,極端な値が一つあって,他の値は大体同じ程度の値をとる場合などでは,平均値は,この極端な値に強く影響されて(同時に,その極端な値の情報が薄められて),代表値としての意味を持たなくなります。何のために平均値を求めるのかといえば,それはデータの特徴をつかむために求めるのですから,こういう場合は,その極端な値の取り扱いを,「データの特徴をつかむ」という目標にてらして,どのように取り扱ったらよいのか,十分検討する必要があります。
この例として,次のようなデータをあげることができます。
50,60,55,55,45,100
この平均値は,およそ61ですが,これには100という極端に大きな値が強く影響していることがわかります。同時に,100という極端な値の情報が薄められ