分类:统计检验的逻辑

来自Big Physics
Jinshanw讨论 | 贡献2018年1月17日 (三) 08:25的版本

分类:其他 分类:研究成果 分类:文献讨论

这是对我们最近的一个关于统计检验的工作[1]的总结。

[2]讨论了统计检验的通常做法的逻辑问题。

一般来说,在统计检验中,给定数据[math]\displaystyle{ D }[/math]之后,我们想知道某个结果[math]\displaystyle{ H_{1} }[/math]正确的可能性,也就是我们想算出来[math]\displaystyle{ P\left(H_{1}|D\right) }[/math]。但是,一般来说我们的理论模型是倒过来的,也就是已经知道某个结论的情况下,产生的这个数据会怎样,也就是[math]\displaystyle{ P\left(D|H_{1}\right) }[/math]。怎么办?我们不能直接用后者来代替前者。

靠Bayesian公式,[math]\displaystyle{ P\left(H_{1}|D\right)=\frac{P\left(D|H_{1}\right)P\left(H_{1}\right)}{P\left(D|H_{1}\right)P\left(H_{1}\right)+P\left(D|H_{0}\right)P\left(H_{0}\right)} }[/math]。其中[math]\displaystyle{ H_{0} }[/math]就是[math]\displaystyle{ H_{1} }[/math]的否命题。于是,这个时候,我们需要以下四个量的指:[math]\displaystyle{ P\left(D|H_{1}\right),P\left(H_{1}\right), P\left(D|H_{0}\right), P\left(H_{0}\right) }[/math]。如果我们的统计检验是考虑了所有的这四个量,然后再计算出来[math]\displaystyle{ P\left(H_{1}|D\right) }[/math],则是没有任何问题的。当然,根据实际情况,有可能[math]\displaystyle{ P\left(H_{1}\right), P\left(D|H_{0}\right) }[/math]可以认为差不多,于是忽略。但是[math]\displaystyle{ P\left(D|H_{1}\right), P\left(H_{0}\right) }[/math]都是要检验的。

可是,在大多数统计检验问题中,仅仅[math]\displaystyle{ P\left(H_{0}\right) }[/math]是考察的目标。这确实是有问题的。但是,这仅仅表示统计检验的习惯用法有问题,不表示统计检验本身有逻辑问题。

我们最近的工作[1]指出来了这个细致的区别。将来还会写下来一个R语言统计检验的扩展包,来补充通常的统计检验。


References

[2] [1]

  1. 1.0 1.1 1.2 Wu, Jinshan(2018), Is there an intrinsic logical error in null hypothesis significance tests? Commentary on: “null hypothesis significance tests. a mix-up of two different theories: the basis for widespread confusion and numerous misinterpretations”, Scientometrics, in progress.
  2. 2.0 2.1 Schneider, JW (2015), Null hypothesis significance tests. a mix-up of two different theories: the basis for widespread confusion and numerous misinterpretations. SCIENTOMETRICS, 102:411–432.

本分类目前不含有任何页面或媒体文件。