郑冰刚提到 P 值,说 P 值的定义(着重号是笔者加的,英文是从 WikiPedia 摘来的):
P 值就是当原假设为真时,比所得到的样本观察结果更极端的结果出现的概率。
以下延续白话系列,解释一下,“什么是 P 值,什么是极端”,算是郑文的一个长长的注脚。
回到上次的硬币试验,那是一次二项试验,每次试验投 100 次,记下出现正面的次数, 比如,如果
每次出现的正面数都是 50,你就有把握认为这是一枚均匀的硬币;
正面数等于 45 或者等于 55,你就有一点点的怀疑它是均匀的;
正面数等于 30 或者等于 70,比较怀疑;
正面数等于 10 或者等于 90,非常怀疑。
如上,正面数和反面数的差异越大,你就越有把握认为硬币不是均匀的(拒绝原假设)。重复一下 P 值的定义,“P 值就是当原假设为真时,比所得到的样本观察结果更极端的结果出现的概率”,把这个定义套入上述硬币试验的场景中,比如你观察到 “正面数是 10 或者 90,正反面次数差异是 80”:
如果原假设为真(硬币是均匀的),P 值就是你投 100 次,所得的正反面数差异大于 80 的概率。
如果这个 P 值很大,表明,每次投 100 次均匀的硬币,经常有正反面差异大于 80 的情形出现。如果这个 P 值很小,表明,每次投 100 次均匀的硬币,你很难看到正反面的差异会超过 80。
以前说过,10-90 是 A 博士的接受区域。如果一枚硬币投出的正反面次数,差异大于 80,——这真是一个 “极端” 的情形,连保守的 A 博士看了都摇摇头,不能接受原假设,只好认为原假设不对,硬币是有偏的。这里的逻辑是:
在假定原假设为真的情况下,出现所看到的偏差(正反面差异为 80),是这么地不可能(P 值很小),以至于我们不再继续相信原假设。
参考资料:
- 维恩堡《数理统计初级教程》(常学将等译,太原:山西人民出版社,1986,Statistics: An Intuitive Approach By George H. Weinberg and John Abraham Schumaker)
- Statistics I: Course Notes, 2008 SAS Institute Inc. Cary, NC, USA
发表 / 查看评论