分类:概率匹配和赌徒谬误

来自Big Physics


这个研究从根子上说,其实是前景理论(带概率的决策问题中对概率和收益的主观模型)的动态版,或者说带有概率的决策问题。如果没有概率,则所有的决策问题,本质上就是明确的目标函数明确的变量下求极值。但是,一旦有了概率,则目标函数怎么写,是不是还求极值,都成了问题。经济学决策的世界这么复杂,就是因为有了概率。沿着这个,我在想,如果有一天,我们需要面对量子系统——其状态描述需要用到量子概率也就是密度矩阵——来决策,那就正好需要量子决策和量子博弈了。

概率匹配指的是这样的一个现象:面对一个有偏硬币(正面几率[math]\displaystyle{ P=0.7 }[/math]),大多数人在做多次决策的时候会做概率匹配——也就是按照之前已经发生的正反面的频率来调整下一次猜什么而且通常是去猜测(补足)那个频率偏低的面。

研究背景

赌徒谬误指的是:在例如选择硬币正反面(生男生女)或者赌大小的游戏中,赌徒经常选择那个前面出现次数低的选项。一定程度上,这样的选择是为了平衡概率,或者叫做概率匹配——也就是希望对一段时间实际出现的事件的频率和事先知道的概率相匹配。弹坑效应实际上也是指的同样的现象,只不过那里时要尽量避开炮弹,于是尽量选择已经被炸过的地方。不过,要注意,很可能两者背后的理据性是不一样的。例如,抛硬币很可能可以看做独立事件,而打炮弹的射手可能并不会真的做到前后基本独立。顺便,这里需要把获益(猜硬币)和损失条件(被炮弹打中)做一个对比,看看被试在这两种情形下其概率估计是否是稳定的。注意,由于这个事件固有的随机性,不同被试在事件次数比较少的时候,其主观估计出来的概率(如果被试确实尝试估计的话)有可能和给定的客观概率有比较大的偏差。

热手效应指的是:在投篮等运动的过程中,如果前一次或者几次投中,则投手对于自己下一次投中的信心甚至实际频率会更高。

以上解释见赌徒谬误和热手效应

热手效应和赌徒谬误实际上是两个相反的信念:在热手效应中,投手觉得事件出现的概率偏向于已经出现频率高的那个事件;在赌徒谬误中,赌徒觉得事件出现的概率偏向于已经出现频率低的那个事件。

当然,如果是独立事件,则以上两种信念都是“假象”而已。那么,是不是说,这两个不同的信念可能是人们对于“独立性”的信任程度、理解程度不一样造成的。比如说,在热手效应中,人们相信连续投中确实会改变投手的心理状态,也是导致准确率更高呢;在赌徒谬误中,人们相信独立性,但是对概率的独立性存在误解(认为整体多次时间合起来统计需要平衡,需要匹配),于是人为来选择平衡和匹配呢?

那么,我们能不能找到产生这样的决策的原因到底是什么,以及,在机制设计的问题中该利用的时候利用,该避免的时候避免呢,比如说在纳税稽查问题中?

纳税稽查问题指的是:每一个被试在获得一定的游戏点数之后,会决定一个申报额,然后有一定的几率被抽查,如果查到其获得的游戏点数高于其申报额,则这个被试要承受高额罚款。现在,假设我们的稽查概率是常数(更复杂的稽查方式另外讨论),并且被试知道这个事实甚至知道这个已知的常数(或者不知道数值,但是知道是个常数),那么请问,那些由于偶然因素而被抽查到的频率比较高的被试,其下面的选择到底是会倾向于提高还是降低申报额呢?

如果这个被试是相信赌徒谬误的,则其会认为之后其被抽查到的概率会降低(匹配之前的高频率),于是降低申报额。如果这个被试是相信热手效益的,则其会认为其被抽查的概率会增加(或者会认为稽查系统会专门抽查那些已经被发现低报的,不过,这个很容易区分开来,区分被抽查概率高的被试中被罚款的和没有被罚款的),于是提高申报额。如果是完全理性的被试,理解独立性也相信实验设置,则会选择一个不依赖于是否之前被稽查或者惩罚的申报比例。

研究问题

  1. 我们检验实际事件的概率以及主观决策的概率:
    1. 事件本身是否满足独立性,并且概率基本一致,也就是是否零阶Markovian过程,还是说确实就是一阶或者更高阶的Markovian过程,也就是看看满足独立性,还是更像热手效应,还是更像赌徒谬误;
    2. 被试如果自己估计主观概率的话,这个主观概率是否满足独立性,还是更像一阶或者更高阶的Markovian过程,也就是看看满足独立性,还是更像热手效应,还是更像赌徒谬误;
    3. 决策是否出现了对上一次或者之前若干次的结果的某种依赖,也就是一阶或者更高阶的Markovian过程,也就是看看满足独立性,还是更像热手效应,还是更像赌徒谬误。
  2. 联合概率匹配实验
    1. 对于那些做概率匹配的被试,多次被查之后,对被查几率的估计会变低,原则上其申报额会降低,如果不是这样那就需要考虑其他因素
    2. 对于那些不做概率匹配的被试,多次被查之后,对被查几率的估计不低,原则上其申报额会不变,如果不是这样那就需要考虑其他因素
    3. 顺便,看看在概率匹配实验中是否会存在“相信热手效应”的被试(这个应该不太会有,但是,如何检验呢,例如让被试写下来其估计的下一次出现正面的概率是大于、等于、小于那个给定值?)
  3. 联合风险态度实验,其他因素方面应该包含风险态度的影响,其实还有情感的影响(例如,被罚多了,怕了,不仅仅是考虑能够得到多少钱的问题)
  4. 被试决策机制都否稳定,如果稳定,在损失表述(先给一笔入场费,然后没猜中罚款)情形和获益表述(不给入场费,猜中获奖)情形下其决策机制是否相同,例如都是高估已经出现频率高的事件(热手效应),还是低估已经出现频率高的事件(概率匹配、赌徒谬误、弹坑效应)
  5. 被试决策机制都否稳定,如果稳定,在损失现状(被罚款的次数据多)情形和获益现状(获奖的次数居多)情形下其决策机制是否相同,例如都是高估已经出现频率高的事件(热手效应),还是低估已经出现频率高的事件(概率匹配、赌徒谬误、弹坑效应)。这个和上面那个不同的地方在于:一个人猜正面,赢多输少,他可以继续正面,热手效应,也可以见好就收,平衡一下反面;一个人猜正面,输多赢少,他可以继续正面,平衡一下,也可以猜反面,热手效应
  6. 参照前景理论(在损失表述情形和获益表述情形下人们对概率的估计不一样——获益情况下放大小概率,损失情形下缩小小概率),研究损失现状情形和获益现状情形下对概率本身的估计。

实验设计的一些细节

  1. 不能欺骗,可以选择一部分信息不告知被试(但是要把告知与否的分开研究)
  2. 各个被试获得的点数随机,维持总数不变,这样可以知道整体是否有人申报少了,但是不会知道到底谁申报少了,除了被抽查到

本分类目前不含有任何页面或媒体文件。