分类:数据驱动的带相互作用的交通出行模型

来自Big Physics


背景和动机

不管是为了解决交通拥堵问题提高交通效率本身,还是为了把交通当做其他模型,例如传染病传播、商品流通等,的一部分,我们都需要对交通过程建模。一个交通问题典型地包含:给定输出流产生的地区[math]\displaystyle{ i }[/math],它的产出流量会到哪里去,会通过哪条路径过去;给定输入流的地区[math]\displaystyle{ j }[/math],流向它的流量都从哪里来,会通过那条路径过来;给定输出输入对[math]\displaystyle{ ij }[/math],流量会选择什么样的路径。也就是,目的地、来源地、路径的选择问题。

前人研究

在前人的研究中,大家发现,引力类模型[math]\displaystyle{ f_{ij}=I\frac{m_{i}m_{j}}{r^{d}_{ij}} }[/math]比较好地给出来了[math]\displaystyle{ ij }[/math]之间的流量。其中[math]\displaystyle{ I }[/math]是某段时间内所有区域之间的总流量,[math]\displaystyle{ m_{i} }[/math][math]\displaystyle{ i }[/math]区域的总人口(或者其他总体性的特征,例如总GDP),[math]\displaystyle{ r_{ij} }[/math][math]\displaystyle{ ij }[/math]之间的距离(或者某种有效距离成本),[math]\displaystyle{ d }[/math]是一个常数。这个问题相当于解决了目的地和来源地两个问题,也就是如果只看来源地[math]\displaystyle{ i }[/math]就把目的地[math]\displaystyle{ j }[/math]求和,反之亦然。于是,剩下的问题就是,如何选择路径,分配流量的问题。那交通里面有其他关于流量分配的模型和算法。

闫小勇等人的研究[1]把路径选择问题和目的地选择问题整合了起来,通过设定和运用一个收益函数[math]\displaystyle{ U^{i}_{j}\left(l^{i}_{j}, P^{i}_{j}\right) }[/math],以及一个优化一个关于[math]\displaystyle{ i }[/math]的目标函数[math]\displaystyle{ H^{i}\left(U^{i}, P^{i}\right) }[/math]。其中[math]\displaystyle{ U^{i} }[/math][math]\displaystyle{ i }[/math]的目的地收益函数矢量,[math]\displaystyle{ P^{i} }[/math][math]\displaystyle{ i }[/math]的去往各个目的地的概率的矢量([math]\displaystyle{ P^{i}_{j} }[/math]是分量),[math]\displaystyle{ l^{i}_{j} }[/math][math]\displaystyle{ i }[/math][math]\displaystyle{ j }[/math]的一条路径。[math]\displaystyle{ U^{i}_{j}\left(l^{i}_{j}, P^{i}_{j}\right) }[/math]包含了[math]\displaystyle{ P^{i}_{j} }[/math],相当于考虑来自于同一个来源地的流量的相互作用,例如拥堵导致出行成本增加、自己和他人去多了导致收益降低(或者先增加再降低,看具体的函数形式)。[math]\displaystyle{ U^{i}_{j}\left(l^{i}_{j}, P^{i}_{j}\right) }[/math]包含了[math]\displaystyle{ l^{i}_{j} }[/math],可以用于路径选择。

新的研究思路

实际上,这里面还有两个问题:不同来源地去往同一个地方,或者用到了同一段路(部分路径相同),导致的收益的变化;具体的[math]\displaystyle{ U^{i}_{j} }[/math]到底怎么写?顺便,为了考虑这两个问题,我们还必须往前再走一步,综合考虑个体优化和整体优化的问题。因此,我们需要做如下的改变。

收益函数

考虑一个[math]\displaystyle{ N }[/math]区域的交通问题。让我们暂时假设这是一个封闭区域(外界对这个区域的供给和需求暂时不考虑)。每个区域有自身的功能,例如居民区、日杂购物区、餐饮服务区、工业区、办公区等等等等。实际上,一般来说,生活中一个人需要用到各个区的结合;生产区也需要考虑到工人和其他原材料的输入以及产品和服务的输出。也就是说,根本上说,交通问题应该是由这些区域之间的相互配合来决定的。那就是说,实际上应该存在这一个从这些特征到收益的函数[math]\displaystyle{ u^{i}_{j}\left(C^{i},D_{j}\right) }[/math],其中[math]\displaystyle{ C^{i} }[/math]就是描述[math]\displaystyle{ i }[/math]这个区域的需求特征的一个矢量,[math]\displaystyle{ D_{j} }[/math]就是描述[math]\displaystyle{ j }[/math]这个区域的供给特征的一个矢量。例如百分之多少是居民功能,百分之多少是办公功能等等。本质上说,我们应该从底层数据来建模来得到这个特征矢量。但是,我们可以用另一个方法,例如,假设 [math]\displaystyle{ u^{i}_{j}=\sum_{mn}M^{m}_{n}C^{i}_{m}D_{j}^{n}\right) }[/math]。然后,我们从出行数据中通过机器学习把[math]\displaystyle{ M, C, D }[/math]都反解出来。

当然,为了真的能够反解出来,我们还需要一个从[math]\displaystyle{ u^{i}_{j} }[/math]得到[math]\displaystyle{ U^{i}_{j} }[/math],以及到出行目的地、来源地、路径选择[math]\displaystyle{ P^{i}_{j} }[/math]的机制。注意,这里的[math]\displaystyle{ P^{i}_{j} }[/math]既可以看作是固定了[math]\displaystyle{ i }[/math]的终点[math]\displaystyle{ j }[/math]分布函数,也可以看作是固定了[math]\displaystyle{ i }[/math]的终点[math]\displaystyle{ j }[/math]分布函数再乘以起点[math]\displaystyle{ i }[/math]的分布函数,[math]\displaystyle{ Q^{i}\hat{P}^{i}_{j} }[/math]。这正好就是下面的优化目标要解决的问题。

优化目标

  1. 第一种优化方式:每一个个体通过选择合适的[math]\displaystyle{ P^{i}_{j} }[/math]来优化[math]\displaystyle{ H^{i}=\sum_{j}P^{i}_{j}U^{i}_{j} - \tau \sum_{j}P^{i}_{j}\ln{P^{i}_{j}} }[/math]。其中[math]\displaystyle{ U^{i}_{j}=U^{i}_{j}\left(u^{i}_{j}, l^{i}_{j}, P^{i}_{j};P^{-i}_{j}\right) }[/math],是上面的区域特征矢量,路径选择,目的地选择的函数。[math]\displaystyle{ P^{\left(-i\right)}_{j} }[/math]的含义是起点不在[math]\displaystyle{ i }[/math]但是终点是[math]\displaystyle{ j }[/math]的几率。
  1. 第二种优化方式:所有个体合起来选择合适的[math]\displaystyle{ \vec{P} }[/math]来优化[math]\displaystyle{ H=\sum_{i,j}P^{i}_{j}U^{i}_{j} - \tau \sum_{i,j}P^{i}_{j}\ln{P^{i}_{j}} }[/math]

相互作用体现在哪里

  1. 第一,[math]\displaystyle{ u^{i}_{j} }[/math]体现了区域匹配的相互作用(特征矢量相乘)。
  2. 第二,[math]\displaystyle{ U^{i}_{j}=U^{i}_{j}\left(u^{i}_{j}, l^{i}_{j}, P^{i}_{j};P^{\left(-i\right)}_{j}\right) }[/math],包含了同一个起点的到达[math]\displaystyle{ j }[/math]的流量之间的竞争合作关系[math]\displaystyle{ P^{i}_{j} }[/math],还包含了不同起点的到达[math]\displaystyle{ j }[/math]的竞争合作关系[math]\displaystyle{ P^{\left(-i\right)}_{j} }[/math]
  3. 更一般地来说,当把路径选择也当做收益函数后者说出行选择[math]\displaystyle{ P^{i}_{j} }[/math]的一部分的时候,实际上,我们也包含了流量分配问题,拥堵问题。

下一步工作

  1. 做一下调研,看看这个idea是否有人做过。
  2. 细化研究方案。
  3. 在模拟数据上检验模型。例如构建一个几个区域的例子,让其中的交通流量满足某个机制(这个机制不能被一会儿用于求解模型),输出模拟出来的交通数据,用于建模。建模实验上面的分析,看看是否可以用于这个模型或者类似模型的预测。
  4. 收集实际数据,在实际数据上建模、检验结果 

参考文献

  1. Xiaoyong Yan, Tao Zhou.(2019). Destination choice game: A spatial interaction theory on human mobility. Scientific Reports, 9 (01) . DOI: 10.1038/s41598-019-46026-w. https://www.nature.com/articles/s41598-019-46026-w.pdf

本分类目前不含有任何页面或媒体文件。