分类:概率测试和最后通牒研究

来自Big Physics


研究背景和问题

在最后通牒博弈[最后通牒]中,博弈者的行为经常偏离基于完全理性的博弈理论的预测[1]:提议者给出的offer经常大于 [math]\displaystyle{ 40\% }[/math],接受者经常拒绝少于[math]\displaystyle{ 30\% }[/math]的offer。问:到底哪些因素使得实际行为和理论有了这么大的偏离?

很容易想到,公平、利他、声誉等可能是原因之一,也有可能提议者的行为是对接受者的最优响应——也就是说这个结果的出现完全就是由接受者决定的。为了一定程度上区分这两个因素,Nick等人就提出来一个人与机器的实验[2],把接受者替换成机器——计算机算法:对于每一个offer,都有一个固定的接受概率,并且这个概率满足offer越大则概率越高,但是,同时还维持平均来看给最低的offer提议者得到的收益最大。他们的研究发现在这个条件下,均值还是显著高于理论预测。于是,得到的结果是:博弈者的学习能力可能是最后通牒中出现偏离理论值的原因,因为在他们的实验中,原则上只要学习到机器的概率信息,就是一个简单的最优化决策问题,自然就会选到那个最大收益的理论值。

基于同样的问题——为什么最后通牒博弈中,实验和理论有这么大的差别,我们也在思考这个问题。考到上面的研究之后,一个直接的问题就是,是不是文中的假设“只要学到信息就会选择理论最优”是正确的,如果不是,可能是什么因素。于是,我们设计了以下的实验。

实验设计

在讨论概率测试的效益的时候,我们尽量去掉公平、利他、声誉等因素的影响,因此,我们采用Nick等人提出来的人与机器的实验设置,在此基础上开展以下研究:第一、直接显示概率,不用被试来学习;第二、在人与机器最后通牒博弈的基础上,加上概率匹配实验。本项目研究:

  1. 是否给了概率以后,博弈者就会选择理论上的最优值。
  2. 在最后通牒博弈中,通过/不通过概率测试的提议者是否中给出来更低/高的分配给接受者的钱。

其中,概率匹配实验(指的是[概率匹配实验])就是给定一个色子,得到正面的几率是0.7,得到反面的几率是0.3,问被试如果有十次机会来做预测,如果预测的答案和实际出现的正面或者反面相同,则获得一定量的钱。这时候,如何选择。前人的实验发现,在这个问题中,大多数人选择做概率匹配,也就是不是选择正面,而是看情况基本上做到0.7的比例的情况下猜测正面,0.3猜测反面。

主要结果

我们发现

  1. 是否给了概率以后,博弈者的选择还是会很大程度上偏离理论上的最优值,当然比没有给概率的时候更加接近了一点理论值。
  2. 在最后通牒博弈中,通过概率测试的提议者确实给出来更低分配给接受者的钱。
  3. 在我们最近完成的独裁者博弈中(等待许彬老师总结),发现了不同的现象:通过和不通过概率测试的提议者的行为没有什么区别。这是可以理解的:独裁者博弈中已经没有了概率或者说威胁的因素。

整体来说,我们在弥补最后通牒的平均offer值和理论完全理性值之间的鸿沟上,往前走了一步:前人的工作发现了利他公平等因素的贡献(通过对比人-人实验和人-机实验),我们进一步发现了学习过程的贡献(通过对比不给出概率和给出概率的情况的结果),以及发现了概率理解是不是好的贡献(通过对比能够通过概率匹配实验来的被试的行为)。

PMUG.jpg PMUGE.jpg

下一步的工作

  1. 完成论文写作和发表的工作。
  2. 做一下统计等跟概率有关的专业的补充实验:看看这个概率理解好坏和行为上的关联,是不是在相关专业的学生里面照样是存在的。小规模就行。
  3. 做一下补充实验,把最有选项改到别的地方(例如不是50而是100,具体的offer值和概率需要进一步确定)去会怎样的工作。先做小规模预实验。
  4. 思考和设计这个决策过程的其他因素的影响的实验,直到把均值拉到理论值附近。例如风险态度分类:把被试按照风险态度分类,探后每一类的决策行为,如果风险中性或者洗好的选择更加接近理论值,那就是再往前走了一步了。按照我们最近完成的进一步实验(等待李耕许彬总结),确实风险喜爱的个体更加接近理论值。同时,这个研究还和风险态度的测量有关。
  5. 回到双人最后通牒,看看前面研究得到的概率理解和风险的影响,在实际博弈中,加了利他性考虑之后,到底怎样。这个要把最后通牒和后面两个实验结合,并且分组讨论对比。

其中,第一个补充实验简单,就是看看对于特殊人群,结果是否还正确。第二个补充实验的主要目的就是验证一下同样的现象在理论最优值不再是最低选择的时候还是不是正确。一个额外的目标是:如果说实验结果发现,在把最优值移到更高的地方更容易被选择的话,那么,就有意思了(等待李耕的总结),博弈者的决策过程里面有其他的未知因素(例如风险厌恶)在起作用。如果确实如此,那再开展后续研究。

最后的那个进一步实验还需要慢慢思考。例如计算能力分类(给出来每一个选项的收益均值和方差,给出来所有历史信息等),例如风险态度分类。

独裁者博弈和概率匹配的关系

在独裁者博弈中,收益只依赖于提议者,反馈者只存在但是不做决策。因此,正好,仅仅保留下来公平性、利他性等考量,原则上概率学习和概率决策不再发挥作用。这个正好和目前的人机最后通牒相互补充(在这里,理想上去掉了公平性、利他性等考量,仅仅留下概率学习和概率决策)。因此,原则上,我们可以预期,独裁者的实验结果应该和概率匹配的实验结果没有关系。我们将对此展开实验研究。如果真的发现几乎没有关联,则进一步验证了我们的上面的结论。如果有关联,就更有意思了,那会是什么因素在发挥作用呢?

任何机器实验中情感的影响

理论上,在任何机器的实验中,由于每个人类被试都明白对家是机器,不获取收益、没有情感没伤害、也不伤害人类被试的情感,就剩下概率学习和概率决策两个因素了。但是,正如我们在计算机对手情况下的情感因素的研究中发现的,潜在情感(无意识情感状态)也会对行为有很大的影响,并且可以通过一定的方式来抑制,在这里,我们也想每次(或者只在开头和结尾、或者目前一样实验过程中不提示)提醒被试,“你的对家是机器,不获取收益、没有情感没伤害、也不伤害人类被试的情感”,来看看被试的行为是否会改变。

参考文献

  1. Camerer, C., 2003. Behavioral game theory: Experiments in strategic interaction. Princeton University Press.
  2. Brenner, T., Vriend, N. J., 2006. On the behavior of proposers in ultimatum games. Journal of Economic Behavior & Organization 61 (4), 617-631.

本分类目前不含有任何页面或媒体文件。