問 題
帰無仮説検定の一つである t 検定又は2群間の差を表す効果量に関する記述として最も妥当なのはどれか。
1. t 検定を行う際は、得られたデータを見てから両側検定か片側検定を選択しなければならない。2群の平均値のうち一方の値が他方の2倍以上の場合には、片側検定による t 検定を行う。
2. 観測された結果よりも極端な値が得られる確率を p 値という。危険率を0.05(5%)と設定し,分析の結果得られた p 値が0.08(8%)であったとき、帰無仮説が正しいことが証明される。
3. t 検定を行って1% 水準で有意差が認められたとしても、その結果は5% 水準で有意差が認められた場合よりも差が大きかったことを意味するわけではない。
4. 2群を比較する際の標本効果量は、各群の平均値の差の絶対値を各群の標準偏差の和で割ることで求められる。このとき、効果量は0から1の値をとり、数値が1に近いほど効果量は大きい。
5. 群間差を表す効果量は測定単位には依存しない一方で、標本サイズの大小には直接的に依存する。標本サイズが大きければ効果量は大きくなり、標本サイズが小さければ効果量は小さくなる。
解 説
選択肢 1 ですが
データを見てから両側検定にするか片側検定にするかを選択すると、恣意的に結果をコントロールできる可能性が生じます。明らかに誤りです。
選択肢 2 ですが
危険率 5% なので、100 回やって 5 回程度しかでない偏った結果だったら、帰無仮説を棄却する、というデザインの検定です。分析結果の p値 8% ということは 100 回やって 8 回程度は出るような偏った結果ということです。従って、帰無仮説は棄却されません。とはいえ、それで帰無仮説が正しいというわけでもありません。あくまでも、帰無仮説が棄却できない結果であった といえるだけです。よって、選択肢 2 は誤りです。
選択肢 3 は妥当な記述です。
水準が 1% か 5% かで有意差が認められやすいか認められにくいかはありますが、別にその差が大きいということを意味するわけではありません。
選択肢 4,5 ですが
効果量とは、群間での平均値の差の程度などを標準化したものです。サンプルサイズに影響を受けない量です。検定では差が「あるかないか」を考えますが、効果量は「差の程度」について表す量となります。
t 検定において、2 群の平均の差を考える時の効果量 d は 平均の差(絶対値)を標準偏差の「平均」で割ったものです。「標準偏差の和」ではありません。また、d は定義からもわかるように、1 を超えることがあります。よって、選択肢 4,5 は誤りです。
コメント