分类:简化的群体最后通牒博弈

来自Big Physics


研究背景和问题

由于网络的兴起,以及对多人博弈的关心,多人的最后通牒博弈经常成为研究对象。至于在网络和多人博弈中,研究的问题,可以是网络和多人如何促进或者阻碍公平,可以是检验某种描述博弈的理论——例如Novak流的基于演化博弈的空间博弈理论——是不是正确,甚至用博弈来解决网络科学的问题——例如网络上的顶点聚类算法。当然,严格来说,后者不能算是博弈研究,而应该算到网络科学的研究中去。

如果完全按照原始的最后通牒[1]来做多人的,则每一次接受者都需要对每一个提议者的offer来做一个响应——最后通牒博弈实际上是一个序贯博弈而不是同时博弈。这样做起来会有点困难。同时,有的时候,有的多人博弈中也会让一个被试同时扮演提议者和响应者的角色,这个时候,如果把博弈改成同时博弈,而不是序贯博弈会容易实现很多。于是,经常,最后通牒博弈被改成了这样的简化版本:

提议者给出一个offer,接受者给出一个最小能够接受的值,把提议者和接受者匹配,如果offer大于最小可接受值,则交易实现双方按照offer的方式分配,否则双方没有收益。接受者的最小可接受值的信息在有的实验中是提供给提议者的,而不仅仅是最后的分配结果。

对于这样的一个博弈,实际上,问题本身可能已经改变。例如,当只有两个人的时候来做这个博弈的时候,实际上,提议者思考的可能是尽可能把接受者的可接受的底线找出来,而接受者思考的是尽可能把自己的可接受值提高但是又能够在提议者的可能给出来的offer的范围内。这件事情和原始最后通牒博弈中双方的相互威胁有一定相似性,但是和以下的一种可能的理想模型不太一样:在提议者看来,接受者是一个offer值的概率响应函数,并且这个响应函数是offer值的增函数。简化以后的博弈相当于假定这个响应函数是一个阶梯函数(step function)。

从原始的最后通牒博弈的角度来说,响应者的策略到底是什么也是一个很重要的问题。例如,当响应者完全理性,仅考虑金钱收益,不考虑公平性等一切情感因素的时候,实际上,我们可以认为响应者实际上是一个阶梯函数——在最小可获得收益[math]\displaystyle{ \epsilon }[/math]的地方接受的几率就是[math]\displaystyle{ 1 }[/math],仅仅在最小收益之前是[math]\displaystyle{ 0 }[/math]。当然,考虑了情感因素例如公平性以后,单独考虑公平性的效用函数——或者说愤怒函数——应该是一个收益的减函数;收益部门的效用函数应该是一个收益的增函数。这个时候,如果仅仅考虑这两个因素的对比,响应者在愤怒带来的效用损失大于收益带来的效用增加的情况下,就会选择拒绝,否则选择接受。这样的话,看起来,响应者的策略还是应该是一个阶梯函数,只不过这个跳跃的点,可能在一个[math]\displaystyle{ e\gt \epsilon }[/math]的地方。也就是说,看起来,阶跃函数的假设还是合理的,仅仅是换了跳跃点。有一种可能可以直接获得这样的阶跃函数的实验方式叫做“策略显示方法”——给响应者提供一个表格,包含各种可能面对的offer,让响应者选择接受还是拒绝。之后,匹配好提议者和响应者,按照这个表格来实现支付。已经有其他人研究了“策略显示方法”和直接实验的比较,发现有的相同,有的不同[2]

研究清楚最后通牒中的响应者的策略还可以更好地搞清楚提议者的行为——提议者的行为可以看做是对响应者的一种估计和响应。当然,这个研究另外一个目的,就是,去看看是否这样的简化版本的——让响应者给出最小可接受值并且同时决策——是否真的是某种和原始版本的最后通牒相近的实验。如果实际上,两者考虑的决策因素很不一样,那么,两者的实验结果和理论研究,就不应该被看做相互有参考价值的研究。

而且如果是多次[3][4]的话,原始的最后通牒里面接受者的信息是不明确的——提议者仅仅得到最后的分配是否成功的信息而没有接受者的具体的值的信息;但是,在简化版本中,这个信息有的时候是提供给提议者的。当然,为了让两个博弈更像也可以选择不提供。

当然,两个实验还是有很多相似的地方的。例如,如果都做单次博弈的话,实际上,提议者面对的是一个接受者的群体的某种代表,因此,就算每一个接受者个体具有一个最小可接受值,提议者看来,也相当于一个分布函数。

因此,有必要研究以下原始的和简化的最后通牒在两人、多人上的结果的异同。在搞清楚这个异同之前,任何简化博弈上的研究结果都不能迁移到原始博弈上去。当然,研究者可以说,那么我就研究这个简化以后的博弈的问题好了。这是完全可以的,如果研究者用另一个名字来称呼这个博弈,例如双向最后通牒博弈(double ultimatum):实际上,在简化版本中双方同时决策,因此,双方的地位实际上是相等的,提议者或者接受者的区别仅仅是要满足前者的offer大于后者给出的值这一点上。

研究问题:

  1. 响应者的策略是不是一个阶跃函数
  2. 三种最后通牒博弈——原始的、最低可接受值的、策略显示方法的——是不是可以认为在做同一个博弈的研究。考察在三种情况下,博弈结果的异同。
  3. 在多人和多轮博弈中,三种方式的关系
  4. 在多人和多轮的情况下,每一种,或者某一种实验,结果的区别,以及这个区别说明了什么问题。这个问题还需要进一步定位:多人和多轮究竟可能差别在什么地方,实验结果可能可以怎么检验这些差别的地方的猜想,这些差别如果得到验证的话,学术意义是什么?

实验设计

为了研究最后通牒和双向最后通牒在结果上的异同,我们采用同一组被试来做以下实验:

  1. 原始最后通牒博弈,在这里,提议者和响应者是异步的,并且响应者的策略是隐藏式的
  2. 最小值版本的最后通牒博弈,在这里,提议者和响应者是同步的,并且响应者的策略是显式的
  3. 策略显示版本的最后通牒博弈,在这里,提议者和响应者是同步的,响应者的策略是显式的
  4. 还可以考虑双向最后通牒博弈,也就是通常网络上的博弈的版本

主要结果

下一步的工作

  1. 文献综述,总结一下看看其他人的结果
  2. 了解这个异同之后,决定是否采用双向最后通牒来做多人和网络对于博弈的影响的研究
  3. 把多人和网络的影响的问题具体化,到底研究什么问题,提出来什么样的假设,并做出实验设计

参考文献

  1. Güth, W., Schmittberger, and Schwarze (1982). "An Experimental Analysis of Ultimatum Bargaining". Journal of Economic Behavior and Organization. 3 (4): 367–388.
  2. Brandts, Jordi and Charness, Gary 2011. The strategy versus the direct-response method: a first survey of experimental comparisons Experimental Economics 14(3), 375-398.
  3. Bolton, Gary, E., and Axel Ockenfels. 2000. "ERC: A Theory of Equity, Reciprocity, and Competition." American Economic Review, 90(1): 166-193.
  4. Martin A. Nowak, Karen M. Page, Karl Sigmund 2000. Fairness Versus Reason in the Ultimatum Game, Science 289(5485) 1773-1775.

本分类目前不含有任何页面或媒体文件。