Ysu2008 发表于 2021-11-28 14:22

置信区间真是折磨人啊

某乎上关于置信区间的讨论,有人贴出这两张照片,应是他的教科书。

此书作者认为“置信区间以一定概率包含参数真值”这个说法是错的。如果真是错的,估计置信区间有何意义呢?


Ysu2008 发表于 2021-11-28 14:39

本帖最后由 Ysu2008 于 2021-11-28 15:44 编辑

照书中的解释,置信区间还有何意义呢?

试想一下,我们计算出一个置信区间。
问:此区间包含真值吗?
答:要么包含要么不包含。

又问:此区间有多大概率包含真值?
又答:不能这样问,这个问法本身就是错误的。

再问:那么到底包含不包含真值?
再答:不知道。

:P:P

luyuanhong 发表于 2021-11-28 19:21

这只不过是一个说法的问题:

由于真值是一个固定常数,不是随机变量,没有概率分布,所以说“真值落在置信区间中的概率”,确实是不妥的。

但是,置信区间的上下限是随机变量,有概率分布,所以如果改为说“置信区间套住真值的概率”,那就没有问题了。

Ysu2008 发表于 2021-11-28 20:22

本帖最后由 Ysu2008 于 2021-11-30 12:24 编辑

luyuanhong 发表于 2021-11-28 19:21
这只不过是一个说法的问题:

由于真值是一个固定常数,不是随机变量,没有概率分布,所以说“真值落在置 ...

陆老师,赞同您的说法。



主要是最后这段,作者认为一个特定的、具体的区间不存在“以多大概率包含总体参数真值”的问题。

这个说法就有问题了。一个具体的、95%置信度区间,有没有包含真值我们当然不知道,无从得知,但我们有95%的把握相信该区间包含了真值。我们之所以有这把握,原因就在于该区间有95%的概率覆盖总体真值。

Ysu2008 发表于 2021-11-28 21:17

本帖最后由 Ysu2008 于 2021-11-30 12:30 编辑

类比有放回抽球模型:袋子里有100个从外观上无法区分种类的橙子,其中甜味橙子95个,酸味橙子5个。

【情形一】 尚未从袋子里取出橙子,问:从袋子里随机抽取一个橙子是甜橙的概率为多少?
答案:95% .

【情形二】已从袋子里随机取出一个橙子,问:这个橙子是甜橙的概率为多少?
答案:95% .

这里的甜味橙子相当于就是95%置信度区间,【情形一】就是抽样计算区间前,【情形二】就是计算出一个具体区间后。作者书中说法之所以有误,在于他认为【情形二】随机抽样已经完成,不存在随机性,因而不存在概率的问题。事实上【情形二】的橙子有可能是甜的,也可能是酸的,只有当我们剥开品尝以后,随机性才会消失。

置信区间与橙子的区别仅仅在于,我们永远无法“品尝”区间的“味道”。
置信区间可能盖住真值,也可能没盖住,不确定性一直都在。
页: [1]
查看完整版本: 置信区间真是折磨人啊