基本的な統計量

データの特徴を表す数値を統計量といいます。
特に分布の中心を表す 平均値、中央値、最頻値や、分布のばらつきを表す 分散や標準偏差 などを基本統計量といいます。データ例として 【10,11,13,13,15,22】という6個のデータがあるとします。

平均値
データの合計 ÷ データの個数 で求めることができます。データ例の平均は (10+ 11+13+13+15+22)/6 = 14 です。

中央値
データを小さい方から並べていった時の真ん中の値です。データが偶数の場合は、真ん中の2つの数値の平均を取ります。データ例の中央値は 13 です。

最頻値
データの中で最も多く現れる値です。データ例の最頻値は 13 です。

分散についてですが
まず、各データの平均との差を偏差といいます。データ例で言うと、平均が 14 なので、偏差は -4,-3,-1,-1,1,8 となります。偏差がばらつきを表しているので、この平均を考えたいのですが、そのまま足すと0で平均も0です。そこで「偏差の2乗」をとります。偏差の2乗は 16,9,1,1,1,64 となります。この偏差の2乗の平均を分散といいます。データ例の分散は (16+9+1+1+1+64)/6 = 15.33…です。

分散の √ (ルート)をとったものが、標準偏差です。
データ例の標準偏差は、√15.33… ≒ 3.9 です。

コメント