新冠肺炎各国再生数

来自Big Physics

There is an English version of this page: COVID-19 Time-Varying Reproduction Numbers on Global

背景和动机

当前,COVID-19已经对全地球人的健康形成了威胁。同时,在中国和新加坡等地区的传播已经基本得到控制。为了帮助大家更清楚地看到每个国家的疫情发展情况,甚至给疫情防控作参考,我们从各个国家的病人数量时间序列计算了有效再生数时间序列。

一个传染病的基本再生数[math]\displaystyle{ R_{0} }[/math](不采取干预措施的条件下,平均一个人传染多少个人)和时间变化的有效再生数[math]\displaystyle{ R\left(t\right) }[/math](采取干预措施以后,在每个时间点[math]\displaystyle{ t }[/math],平均一个人感染多少人)是反映这个传染病的内在属性和检测防控的重要指标。

在这里,我们将提供我们能够获取到数据的全球各个地区的有效再生数时间序列。同时,我们也会按照这个有效再生数时间序列做一些简单外推型的预测。

分析方法

我们在前期研究中,注意到输入病人的有效再生数[math]\displaystyle{ R_{0}^{1}\left(t\right) }[/math]可能和本地病人的有效再生数[math]\displaystyle{ R_{1+}^{2+}\left(t\right) }[/math],因此我们

  1. 从统计数据中区分了各个地区的输入性病人(零代)[math]\displaystyle{ I^{0}\left(t\right) }[/math]、输入性病人传染的本地病人(一代)[math]\displaystyle{ I^{1}\left(t\right) }[/math]和本地病人传染的本地病人(二代以及以上)[math]\displaystyle{ I^{2+}\left(t\right) }[/math]
  2. 推导了从[math]\displaystyle{ I^{0}\left(t\right), I^{1}\left(t\right), I^{2+}\left(t\right) }[/math]计算[math]\displaystyle{ R_{0}^{1}\left(t\right), R_{1+}^{2+}\left(t\right) }[/math]的公式,
  3. 在软件EpiEstim的基础上,实现了上面的计算分析。

顺便,软件本身的测试版已经提供在Github上。计算公式的初稿马上就会放出来。

在获得再生数时间序列的基础上,我们还构造了两个简单外推模型来做一些非常粗糙的预测

  1. 简单外推:把所关心的地区的再生数时间序列的时间上最末尾的值简单延拓——假设将来的再生数就取这个末尾的值,来计算每天新感染的人数,
  2. 用传染病传播情况基本稳定的典型区域来衔接外推:在所关心的地区的现有的再生数时间序列的基础上——接上——典型地区的再生数时间序列,来计算这个地区每天新感染的人数。

至于接上的方法,如果目标地区的现有的再生数时间序列的时间上最末尾的值已经小于典型地区的最大值,则,从典型地区的时间序列中找到那个和目标地区最末尾的值相等的值,把之后的时间序列接上;如果如果目标地区的现有的再生数时间序列的时间上最末尾的值大于典型地区的最大值,则,把典型地区的时间序列做左侧延拓(具体我们用了splinefun函数)直到插值得到那个和目标地区最末尾的值相等的值,然后把插值得到的时间序列接到目标地区上。这样做,相当于,

  1. 第一种,假设目标地区的防控措施和效果完全不变,则后续会怎样,
  2. 第二种,假设目标地区将采取典型地区的防控措施,效果假设和典型地区类似,则后续会怎样。

这个方法由于受各个目标地区的数据可获得性的限制,例如目标地区很难获得分开的零代、一代、二代以及以上的病人数据,因此,很多时候,我们仅仅用了所有病人数据。另外,这个分析框架目前来说,都是把目标区域当做唯一的研究对象,然后把全世界的其他地方当做其输入和输出的外界,并且假设这些输入和输出是已知的或可以忽略的。实际上,将来这个框架也可以直接用于多区域的分析,把区域间输入输出的数据用交通数据来补全就可以。

方法部分的附录:核心公式

如果你还对我们的计算框架的细节感兴趣,这是其中的几个核心公式。

  1. 特定城市输入病人(称为零代病人)的一代感染者数量[math]\displaystyle{ I^{1}\left(t\right)=\sum_{\tau=0}^{\infty}I^{0}\left(t-\tau\right)R_{0}^{1}\left(t\right)\omega\left(\tau\right) }[/math]
  2. 本地城市二代以及二代以上以上感染者数量[math]\displaystyle{ I^{2+}\left(t\right)=\sum_{\tau=0}^{\infty}\left(I^{1}\left(t-\tau\right)+I^{2+}\left(t-\tau\right)\right)R_{1+}^{2+}\left(t\right)w\left(\tau\right) }[/math]

相应的再生数为,

  1. [math]\displaystyle{ R_{0}^{1}\left(t\right)=\frac{I^{1}\left(t\right)}{\sum_{\tau=0}^{\infty}I^{0}\left(t-\tau\right)\omega\left(\tau\right)} }[/math]
  2. [math]\displaystyle{ R_{1+}^{2+}\left(t\right)=\frac{I^{2+}\left(t\right)}{\sum_{\tau=0}^{\infty}\left[I^{1}\left(t-\tau\right)+I^{2+}\left(t-\tau\right)\right]w\left(\tau\right)} }[/math]

更多解释见[考虑输入病人的模型]。

典型地区有效再生数时间序列

中国中国除去湖北之外的地区的再生数,以及,新加坡的再生数时间序列是将来做外推计算的基础。我们先把结果放在这里。

典型地区一:中国除去湖北之外的再生数

我们区分了中国湖北之外的数据中的输入、输入感染、本地感染三种病人,用发展了的方法做了有效再生数的计算。顺便,注意区分三种病人和不区分得到的再生数时间学列的结果相差非常大。

中国湖北之外的再生数,区分输入、输入感染、本地感染三种病人的计算

中国湖北之外的再生数,区分输入、输入感染、本地感染三种病人的计算

中国湖北之外的再生数,区分输入、本地两种病人的计算

中国湖北之外的再生数,区分输入、本地两种病人的计算

注意,我们的新冠肺炎联合研究小组“公共安全和复杂系统”的学生处理了识别输入、输入感染、本地感染三种病人的数据。如果你有其他研究需要这个数据,请和我们联系。


典型地区二:新加坡的再生数

新加坡的再生数,由于数据限制没有输入和本地病人

这是新加坡的再生数时间序列。由于数据限制,没有输入和本地病人。

各个国家的有效再生数时间序列以及简单外推的预测结果

下面,我们展示各个国家的再生数时间序列,以及我们简单外推的预测结果。

日本的再生数时间序列和外推预测

日本再生数时间序列

日本的再生数,未区分输入和本地病人

日本的再生数,未区分输入和本地病人

日本简单外推预测

日本再生数末位值外推结果

日本再生数末位值外推结果

日本用中国和新加坡再生数时间序列接上得到的预测

日本用中国再生数时间序列接上的结果

日本用中国再生数时间序列接上的结果

日本用新加坡再生数时间序列接上的结果

日本用新加坡再生数时间序列接上的结果