二項分布、正規分布

二項分布
ベルヌーイ試行と呼ばれる「成功 ◯ or 失敗 ☓」の2つしかおきない事柄を、独立に 数回行った時に、何回成功するかという確率分布のことです。

例)コインがあって、表裏 1/2 で出る。
コインを 3 回投げた時の、表が出る枚数を X、確率を P(X) とする。

表 0 回・・・☓☓☓ → (1/2)3
表 1 回・・・◯☓☓ → 1/2 × (1/2)2 × 3C1
表 2 回・・・◯◯☓ → (1/2)2 × 1/2 × 3C2
表 3 回・・・◯◯◯ → (1/2)3

となります。
3C13C2 は、◯ がどこで出るかを3回の中から選ぶ通りです。例えば表 1 回であれば、◯☓☓ だけでなく、☓◯☓、☓☓◯ もあるため掛けています。

成功確率 p、失敗確率 1-p で、ベルヌーイ試行を独立に n 回行った時、r 回成功する確率は 『nCr × pr(1-p)n-r』と一般に表します。また、二項分布が「Binary Distribution」なので 頭文字を取り、B(n,p) と表されます。先程のコイン3回投げる場合の確率分布は B(3,1/2) です。

正規分布
巨大な n に対する 二項分布といえます。巨大な n として 1 万回、コインを1万回投げる場合を考えてみましょう。この時、表が 1 回しか出ないというのは、まぁなかなかおきません。大体 5000 回付近にぎゅっと分布が集まります

このように、平均値付近にぎゅっと集まるデータの分布が正規分布です。平均を μ(ミュー)、分散を σ2(シグマ 二乗)とした時、1/√2π σ e{-(x-μ)^2/2σ^2} という形で表される分布です。(この関数を覚える必要はありません。へー、式で表されるんだー、ぐらいで十分です。)

正規分布の特徴として、中央付近に分布が集まるだけでなく「平均、最頻、中央値が一致する」、「左右対称」、「適当に値を1個選んだ時、μ±σ に約 68%、μ±2σ に約95%、μ±3σに約 99.7% 含まれる」などがあげられます。

確率変数として Z = (X ー μ)/σ を考えると、 Z も正規分布に従い、平均 0、分散 1 の特別な正規分布である標準正規分布を取ることが知られています。

コメント