分类:社会学习

来自Big Physics


问题背景

社会学习指的是决策者[1],或者称为先学习后决策的个体(这个个体可以是个体的人,组织等agent),在综合前人的决策和自己对世界的认知之后做来认知世界并作出决策的过程。

例如,消费者在决定购买某产品的时候,可以基于自己对产品的认知、周围的朋友的是否购买的(甚至购买意愿的)比例、更大的甚至不认识的群体的购买比例来做决定。也就是说,可能是这个消费者自己喜欢,也可能是由于其他人喜欢(自己要么随大流,要么想成为其他人构成的群体的一部分)而购买这个产品。例如,小罐茶、背背佳,百度上卖药的竞价排名。当然,也不是说,只有本身不好的产品可以和需要来运用社会学习的知识和研究结果,iPhone的销售也类似,更大地基于同辈压力,而不完全是靠广告,或者说广告本身的点也在于增加“买我”的同辈压力。

在科学的发展和传播,技术和产品的发明和扩散中,同样存在类似的场景。普通大众采纳了一个科学结论(科学概念、科学方法)可能因为其真的搞懂了这个科学结论的背后的逻辑,也可能是因为周围的其他人,甚至科普作者,甚至科学家,都这么说。甚至,一个科学家决定来做某个科学研究,也可能因为这个科学家真的觉得这个科学问题值得研究,也可能是周围的人都在发这个研究问题的论文,或者社会大众说这个问题特别值的研究。比如内源性心脏干细胞的研究。技术也是如此。

那么,这个社会学习的现象如何用数学模型来描述呢?这样的描述是否可以增加我们对相应的现实现象的理解呢?甚至,是否可以进一步帮助我们更好地解决相应的问题,比如说,让学习者更准确地认知世界从而做出来对于学习者个体的收益或者整个社会的福利最高的决策?

基本数学模型

世界有两个真实状态[math]\displaystyle{ w=\pm 1 }[/math]。任何一个具体的世界只能处于其中之一的状态,相应的概率分别为[math]\displaystyle{ q }[/math][math]\displaystyle{ (1-q) }[/math]

决策者不知道所处的世界到底是什么状态,但是,他会从世界接收到一个信息[math]\displaystyle{ s=\pm 1 }[/math]。这个信息[math]\displaystyle{ s=\pm w }[/math],相应的概率分别为[math]\displaystyle{ p }[/math][math]\displaystyle{ (1-p) }[/math][math]\displaystyle{ p\gt 0.5 }[/math]

决策者[math]\displaystyle{ i }[/math]还可以观测到前人的决策[math]\displaystyle{ a_{j}, i-L_{i}\lt j\lt i }[/math]。特别地,也可以让[math]\displaystyle{ L_{i}=i,i-L_{i}=0 }[/math],也就是决策者[math]\displaystyle{ i }[/math]还可以观测到前面所有其它决策人的决策。

决策者类型

  1. 模仿者:在决策的时候忽略自己的信息,只看其他人的决策信号。例如,[math]\displaystyle{ a_i=\mbox{sign}\left(\sum_{j\lt i}a_{j}\right) }[/math]
  2. 固执者:在决策的时候忽略他人的信息,只看自己收到的世界信号。例如,[math]\displaystyle{ a_i=s_{i} }[/math]
  3. 寻找真相者:直接综合自己收到的世界信号和其他人的决策信号。例如,[math]\displaystyle{ a_i=\mbox{sign}\left(s_{i}+\sum_{j\lt i}a_{j}\right) }[/math],或者[math]\displaystyle{ a_i=\mbox{sign}\left[s_{i}+\mbox{sign}\left(\sum_{j\lt i}a_{j}\right)\right] }[/math]。其中后者比前者更看重自己收到的世界信号。
  4. 完全理性决策者:从其他人的决策信号([math]\displaystyle{ \vec{a}^{\lt } }[/math])中,推断出来其他人收到的世界信号([math]\displaystyle{ \vec{s}^{\lt } }[/math]),然后结合自己收到的世界信号([math]\displaystyle{ s }[/math]),来作出决策([math]\displaystyle{ a_{i}=\mbox{sign}\left(\sum_{j\lt i}s_{j}^{\lt }+s_{i}\right) }[/math])。这个完全理性的计算见[2]


研究问题

前人的研究已经发现,在社会学习这样的情境中,很容易出现羊群效益(有的人也称之为塌缩状态),也就是后来的决策者很容易就进入到和前面的决策者的众数决策行为相同。当然,很多时候,这样的和前面的决策者相同的决策的结果,确实指向世界的真实状态。因此,这个结果不差。尤其是,当某些决策者的信息和决策能力都不太足的时候。

但是,这样的结果,也会使得一部分本来完全理性的决策者也不得不成为跟从者。一旦在某些问题中,一开始决策者们收到的信号由于随机性现实相反的状态更多,进入了塌缩状态,那么,后来的人也就拧不过来了。

一个以模仿者或者寻找真相者为基础思考过程,就可以显示这样的塌缩状态是如何自然地出现的。第一个决策者,假设具有一定理性的话,只能按照其自身的信号来决策,因为也没有什么别的信号。也就是说,其收到这个手机值的购买,则就买;收到不值得购买,则不买。第二个人的决策,当收到的信号和第一个人的决策信号相符,那也没什么好说的,就按照这个相符的结果来选。但是,当其接收到的信号和第一个人的决策信号相反的时候,我们假设他必须从买和不买中选一个,则就有了随机性。他可能是随便地从买和不买之中选了一个。但是,这个看起来无辜的随机选择,对后来的人具有很大的影响。

等到第三个人来决策的时候,假设第二个人的随机决策结果刚好导致了其决策结果和第一个人的决策结果相同,则第三个人无论什么信号,都没有意义了。当然,如果第二个人随机决策的结果和第一个人的决策结果相反,则第三个人的私有信息会发挥关键作用。

因此,我们发现,第二个人的随机决策(在前两个决策者收到的信号刚好是相反的情况下)会很大程度上决定整个决策过程所塌缩到的状态。然后,这个时候,这个结果,因为出现的真实信号是一正一反,刚好就是世界本来的状态或者和本来状态相反的状态的概率完全相同!

这就是社会学习的困境,或者说,“乌合之众”困境——尽管乌合会使得平均来看正确的决策的可能性更大,尤其是其一定程度上保护了获取真实信号的能力和作出决策的水平不够的人,但是,在某些偶然条件下,使得整个世界走向错误状态的可能也很高。

这样的场景,在那些还没有被大量的大众所熟悉所认知的问题,或者特别敏感而重要的决策问题中,就会出现,而且可能很重要,因此,再一次拧过来的代价太大,可能性很小。比如说,科学家的科学研究,新技术的发明和推广,新理念和新概念的提出和传播。这也是为什么,科学家、真正的企业家、真正的政治家,往往需要的是独立思考者,并且鼓励后来人持期待的批判态度——就是期待着科学家的新的科学研究是对的,但是,同时用尽一切可能会质疑这个研究,直到所有的质疑都不成立,则暂时接受这个研究。

也就是说,那些固执者——严格按照自己获取的信号来作出决策的人,对于真正了解世界的真实状态是非常关键的。这也是为什么,科学家写论文的时候,一定要把真实思考和研究的过程揭示出来,这样,后来人可以尽可能地直接看到其接收到的信号,而不是仅仅只有其决策信号,判断结果。

回到一般情形,我们就会很好奇:

  1. 在一个人类群体中,针对某些特定问题(或者其实可以跨越很多特定问题,甚至完全对问题不特定,成了决策者的性格特征)的这些不同类型的决策者都有什么样的比例呢?
  2. 如果我们把某些关键类型的个体,例如模仿者、完全理性决策者和固执者,放到不同的位置,是不是结果会有很大的不同呢,也就是是不是有一个关键位置的概念呢?

当然,这个研究结果一旦清除了,一方面可能可以被有心人用来控制世界塌缩到特定的状态,也可能被用来预防某些塌缩的发生。不过,这是工程层面的问题了。我们现在更加关注科学的问题,也就是决策者类型、类型比例、每个类型的关键位置等问题。

研究计划

  1. 做文献调研,看看没有有类似的研究,同时提炼决策者类型
  2. 做实验研究:
    1. 对包含不同类型的处于不同位置的决策者的决策过程做数值计算,得到理论预期结果1
    2. 对包含不同类型的处于不同位置的决策者的决策过程做计算机模拟,得到理论预期结果2
    3. 识别和区分被试类型(或者采用受训被试),开展对包含不同类型的处于不同位置的决策者的决策过程的实验研究,得到实验结果
  3. 调整理论模型,使得理论和实验在误差范围内相符
  4. 提炼关于关键位置、被试类型等方面的研究结论

参考文献

  1. Catherine A. Glass, David H. Glass, Opinion dynamics of social learning with a conflicting source, Physica A: Statistical Mechanics and its Applications, 563, 2021, 125480
  2. Dai W, Wang X, Di Z, Wu J (2014) Logical Gaps in the Approximate Solutions of the Social Learning Game and an Exact Solution. PLoS ONE 9(12): e115706. https://doi.org/10.1371/journal.pone.0115706

本分类目前不含有任何页面或媒体文件。