検定

少数の標本から母集団を推定するのが推測統計学です。推測統計学の一分野である検定は『母集団について仮定した命題について、標本データを統計的に分析し検証する』ことです。

検定は、以下のようなステップ(step1 ~ step4) を経ます。
step1:仮説を立てる。
※ここでの仮説は「主張したい説を否定したもの」とする。

例として
『降圧薬 A が、血圧を本当に下げるか判定したい』とします。
主張したい説は「降圧薬 A を飲んだら、血圧が下がる」です。従って、検定の step1 で立てる仮説は「降圧薬 A が血圧を下げないと仮定する」となります。このような仮説を帰無仮説といい H0 でよく表します。主張したい説は対立仮説と呼ばれ H1 でよく表します。

step2:有意水準(めったに起きない確率)を決める。
めったに起きない低い確率 について決めます。例えば 5% といった具合です。1%,5% がよく用いられます。この「めったに起きない」が大体 1%,5% というのは文化的なものとしてひとまず受け入れてください。

step3:標本から得た統計量(検定統計量)に注目し、仮説が 真であるとした場合の統計量の分布を統計学的に求める。

例で言うと『降圧薬 A が血圧を下げない』という仮説が真とします。すると、標本集団の血圧は下がらず、一般的血圧の範囲内におさまるはずです。一般的血圧についてはわかっており、血圧の平均は 120、分散(σ2) 25 の正規分布に従うとします。そうであれば、血圧は 大体 110 ~ 130 の間に 95% の確率で入るはずと、統計学的に求めることができます。(正規分布は、平均 ±2σ 内に約 95% です。)

step4:実際の標本から得た統計量が、もしもめったに起きない値、例で言えば標本集団における血圧の平均が 110 未満 であった場合、仮説を否定する。結果、主張したい説が採用される。

※重要な点として、仮説が否定出来なかった場合は、仮説も主張したい説もとれず、この検定結果からはなんともいえない という結論が得られる、という点に注意してください。

以上が検定の流れです。

検定において
「仮説が否定された」パターンが、理想的流れです。なぜなら、主張したい説が採用されるからです。しかし残念ながら小さい確率で「とてつもなく小さな可能性しかない値が偶然標本から出てくる」ため、検定が誤った結論を導くことは避けられません。『仮説を否定し、主張したい説を採用したが、偶然によるもので、誤りであった』場合を第一種の誤り(過誤)といいます。

逆に仮説が否定されなかったが、実際は否定されるべきであった場合の誤りを第二種の誤り(過誤)といいます。

誤っちゃうって、意味あるの?と感じるかもしれませんが
『慎重に、確実に言えそうなことを、どれぐらい確実に言えるかもしっかりと認識しながらすくい取る考え方』が検定です。「A じゃないなら B」といったすぱすぱした推論ではありません。

そうはいっても、検定して結局外してる可能性もあるってごちゃごちゃしててなんだかなぁ。。。と思うかもしれませんが、少ない標本から本当に意味ある情報を抽出し、誤解なく共有するための推測形式です。現実世界においてパワフルなツールです。ぜひしっかり理解しましょう!

コメント