分类:从区域姓氏数据到人口迁移

来自Big Physics


问题背景

历史上的人口迁移的研究依赖于历史上的人口迁移数据,或者至少每过一段时间的人口统计数据。这样的数据都很难拿到。那么,历史上的人口迁移如何研究呢?实际上是有一些从当前的数据来研究历史上的人口迁移的方法的。例如,DNA的相似性的对比就是一个方法。比如说,考虑现在各个地区的DNA,如果有一个某个人群特有的DNA在某个地方特别多,然后,在另一些地方也出现,并且这些个地方连起来,还能和某个历史事件印证,那可能就有一定的道理,可能是真实的历史上的人口迁移了。实际上,人类从非洲出来,以及对成吉思汗的基因的扩散和对应的战争的研究,就是走的这样的道路。姓也具有类似的作用——因为其背后往往是父系基因的传递。某个姓比较集中,另外的地方比较少,那么,看起来就可能是从比较集中的地方扩散到那个比较少的地方的。当然,姓氏的特异性没有上面的DNA那么好。因此,在实际研究中,比较两个地区不能依赖于一个姓,而是很多个姓一起来比较。这就叫做地区之间的同姓率[1][2][math]\displaystyle{ S_{ij}=\sum_{s}\frac{x^{s}_{i}}{\sum_{q} x^{q}_{i}}\frac{x^{s}_{j}}{\sum_{q}x^{q}_{j}} }[/math]。然后,认为这个同姓率大的区域之间的迁移概率(或者说迁移流量)比较高。有了迁移概率,则后续的分析就可以以迁移概率为基础来做了。

实际上除了同姓率,还可以用其他几个类似的定义。

核心idea

从问题背景描述中,我们知道了,整个研究的直接基础,或者说最想得到的数据,其实是任意两个地区之间的迁移概率或者说迁移流量。同时,已经有的数据,通常是每个地区的某种性质——例如姓氏,例如标记性DNA——的人口数量。从人口数量或者其他数量等存量数据,有没有什么办法获得流量数据?

这个问题在国际贸易、人类移动、交通等研究中,同样非常基础和关键。在那里,人们发明和检验了各种办法。于是,现在的思想很简单,能不能把用于从人口数据获得人类移动的流量数据的办法来从人口数据中得到人口迁移中的流量数据?例如,最简单的引力模型,或者更复杂一点的热辐射模型

以引力模型为例,流量[math]\displaystyle{ f_{ij}=\frac{m_{i}m_{j}}{r^{2}_{ij}} }[/math],其中[math]\displaystyle{ m_{i}, m_{j} }[/math]是地区i,j的人口,[math]\displaystyle{ r_{ij} }[/math]是i,j之间的距离。当然,更一般地,还可以修改底下的指数,不一定非得是2。借用到人口迁移,那么,我们就可以假设:迁移不改变姓氏,两个地区之间某一姓氏的人口的迁移数量正比于这两个地区这个姓氏的人的乘积。于是,i,j地区的总流量就是[math]\displaystyle{ f_{ij}=\sum_{s} \frac{x^{s}_{i}x^{s}_{j}}{r^{\alpha}_{ij}} }[/math]。有了流量绝对值,还可以定义迁移概率,[math]\displaystyle{ w^{i}_{j}=\frac{f_{ij}}{\sum_{k} f_{ik}} }[/math],注意这个时候取和k可以包含i本身,或者不包含。

一旦有了这个迁移矩阵[math]\displaystyle{ w }[/math],那么,之前研究什么就可以类似的研究什么了。

更一般地,还可以借鉴人类移动的其他更准确的模型,包含热辐射模型以及加权机会模型[3]

下一步工作

  1. 调研人类学中是否有类似的工作
  2. 调研人类移动研究中,有哪些比较好的模型(小勇补充一下)
  3. 决定在姓氏数据上用什么样的流量估计模型,并做后续分析和结果解读
  4. 有了矩阵[math]\displaystyle{ w }[/math],实际上我们还可以用广义投入产出分析来讨论间接迁移的效果,也就是i跑到k接着从k跑到j的人口迁移。

参考文献

  1. Liu, Yan, Liujun Chen, Yida Yuan, and Jiawei Chen. "A study of surnames in China through isonymy." American Journal of Physical Anthropology 148, no. 3 (2012): 341-350.
  2. Shi, Yongbin, Le Li, Yougui Wang, Jiawei Chen, Yida Yuan, and H. E. Stanley. "Regional surname affinity: A spatial network approach." American Journal of Physical Anthropology (2018).
  3. Yan, X.-Y., Zhao, C., Fan, Y., Di, Z.-R. & Wang, W.-X. Universal predictability of mobility patterns in cities. J. R. Soc. Interface, 2014, 11: 20140834. http://rsif.royalsocietypublishing.org/content/11/100/20140834

本分类目前不含有任何页面或媒体文件。