分类:Surprised by the Gambler’s and Hot Hand Fallacies
Miller, Joshua Benjamin and Sanjurjo, Adam, Surprised by the Gambler's and Hot Hand Fallacies? A Truth in the Law of Small Numbers (November 15, 2016). IGIER Working Paper No. 552. Available at SSRN: https://ssrn.com/abstract=2627354 or http://dx.doi.org/10.2139/ssrn.2627354
Abstract
We prove that a subtle but substantial bias exists in a standard measure of the conditional dependence of present outcomes on streaks of past outcomes in sequential data. The magnitude of this novel form of selection bias generally decreases as the sequence gets longer, but increases in streak length, and remains substantial for a range of sequence lengths often used in empirical work. The bias has important implications for the literature that investigates incorrect beliefs in sequential decision making---most notably the Hot Hand Fallacy and the Gambler's Fallacy. Upon correcting for the bias, the conclusions of prominent studies in the hot hand fallacy literature are reversed. The bias also provides a novel structural explanation for how belief in the law of small numbers can persist in the face of experience.
总结和评论
这篇李克强推荐给我神奇的文章讨论了这样一件事情:当我们重复扔上[math]\displaystyle{ N }[/math]次硬币的时候,我们做下面的一个记录——如果我们遇到了一个正面(H)就把下次的观测值记录下来;接着,在这个观测记录中,我们来计算正面的比例[math]\displaystyle{ p^{H}_{1}\lt math\gt ,并且看这个比例是否接近硬币的内在概率\lt math\gt q^{H} }[/math].
这个例子还可以推广成为连续观测到[math]\displaystyle{ k }[/math]次以后开始记录,再来计算[math]\displaystyle{ p^{H}_{k} }[/math],然后和[math]\displaystyle{ q^{H} }[/math]比较。
这个问题的背景是手热效益:是否连续投球成功以后成功率变高,或者反过来叫做赌徒的谬误:是否连续出现正面之后正面的概率变小。当然,实际问题中,前者更复杂一些,因为有可能确实会出现打出上风球于是球场气氛得到了改变,从而有可能改变了投球成功率。之前有理论和实际研究[1]表明理论上[math]\displaystyle{ p^{H}_{k}=q^{H} }[/math],并且在篮球实际统计结果中确实不存在手热效益。
本文对之前的研究提出了挑战,认为:理论上[math]\displaystyle{ p^{H}_{k}\neq q^{H}\lt math\gt ,并且实际上篮球实际统计结果中存在手热效益。 初看起来,如果这个结果是正确的,那么,不仅否定了之前文章的结果,还会对理论造成冲击:\lt math\gt p^{H}_{k} }[/math]不过就是一个条件概率,怎么会在独立事件(扔硬币)的条件下,不等于[math]\displaystyle{ q^{H}\lt math\gt ?看起来实在太神奇了,意义太非凡了,也太不可能是正确的了! 仔细读了这篇文章以后,我发现,实际上,是统计方式的问题。当我们问“在这个观测记录中,正面的比例是多少”的时候,问题是没有清楚的定义的,存在两种理解。第一种,在一轮实验记录中——一轮的意思是\lt math\gt N\lt math\gt 此结果的一个序列\lt math\gt x_{1}, x_{2}, \cdots, x_{N} }[/math],做上面的规定好的统计。第二种,在很多很多轮的结果的集合中,也就是把一大堆[math]\displaystyle{ \left\{x_{1}, x_{2}, \cdots, x_{N}\right\} }[/math]中来做上面规定好的统计。两者的答案可能是不一样的。以[math]\displaystyle{ k=1 }[/math]为例,前者相当于在单次结果上来计算这个比例[math]\displaystyle{ \frac{HH}{HH+HT} }[/math]。如果后面还把这样的很多次结果做一个平均的话,实际上相当于计算[math]\displaystyle{ \left\langle\frac{HH}{HH+HT}\right\rangle }[/math]。后者相当于直接计算统计平均[math]\displaystyle{ \frac{\left\langle HH\right\rangle}{\left\langle HH+HT \left\langle} }[/math]
=参考文献
- ↑ Gilovich, T., R. Vallone, and A. Tversky (1985): “The Hot Hand in Basketball: On the Misperception of Random Sequences,” Cognitive Psychology, 17, 295–314.
本分类目前不含有任何页面或媒体文件。