分类:新冠肺炎研究

来自Big Physics

研究背景和问题

鉴于目前新冠肺炎的全球发展态势,我们希望能够通过一些计算,帮助到新冠肺炎的干预。长期来看,也可以以这些研究工作为基础,建立起来一个“多源数据融合的传染病计算平台”,用于传染病的风险准备和风险应对以及临近结束期的防控措施有序开放的管理。

在这里,我们主要想回答:武汉(以及湖北之内武汉之外的其他地方,以及全国其他地方)目前情况怎么样什么时候能够基本不再有新增病人,中国以外的其他国家的新冠肺炎病人数量在某写典型情境下将来会如何发展。其中,典型情景的设置主要是运用一些疾病控制态势已经基本明朗的地方当做典型,然后,把这个典型地区的有效再生数之间序列用来补充所感兴趣的其他地区。这样的典型地区包含中国-湖北(病人数据中去除湖北)、新加坡等。

计算逻辑和结果

总体来说,我们的计算思路是:从现有数据得到当地的有效再生数时间序列[math]\displaystyle{ R\left(t\leq t_{0}\right) }[/math],然后,对这个有效再生数时间序列做简单预测[math]\displaystyle{ R\left(t\gt t_{0}\right) }[/math],用预测出来的有效再生数来预测病人数量。

如果现有数据很少,我们就运用其他已经有比较长时间的有效再生数时间序列[math]\displaystyle{ R_{\mbox{ref}}\left(t\right) }[/math]当例子,构造典型场景(最简单的场景就是直接用其他地区的有效再生数时间序列),然后在这个场景下预测病人数量。

从再生数到病人数量和从病人数量到再生数的基本方程在下面。

湖北之内数据不足的处理

为了了解湖北武汉之外的其他地区和武汉,首先我们需要有比较可靠的相应的数据。但是,由于种种原因,湖北的官方病人时间序列数据不能直接用于研究。于是,为了解决这个问题,我们采用从武汉输入到中国其他地区的输入病人数据来估计武汉和湖北其他地区的情况。具体来说,就是假设在春运期间从武汉输入到其他城市的人口中的感染者的比例,和武汉本地的感染者比例是一样的。这样,只要我们从中国其他地区的武汉输入病人数据中获得(除以从武汉来的总输入人口)这个比例,就可以估算出来武汉封城当时的感染者数量。接着,利用武汉到湖北内其他地区的输入人口总量数据,就可以得到湖北内其他地区的封城当时的感染者。

输入病人数量和输入人口总数基本上成直线

输入病人数量和输入人口总数基本上成直线

输入病人数量到2月10日之后就基本上没有了

输入病人数量到2月10日之后就基本上没有了

注意,我们的新冠肺炎联合研究小组“公共安全和复杂系统”的学生处理了识别输入性病人的数据。如果你有其他研究需要这个数据,请和我们联系。

典型地区

这里仅仅用中国湖北之外当做典型地区的例子。这个时候,我们有湖北输入病人([math]\displaystyle{ D }[/math])、由湖北输入病人直接感染的当地病人([math]\displaystyle{ m_{D} }[/math])、由当地病人直接感染的当地病人([math]\displaystyle{ m_{C} }[/math])。其实还可以考虑从其他地区输入到当地的病人,暂时忽略。为什么要区分上面的三种病人呢?因为防控措施导致这输入病人和本地病人的传染能力——由有效再生数刻画——可能完全不一样。为了解决这个问题,我们首先去发展了处理这个不一样的分析方法。

区分输入病人和本地病人的有效再生数的分析方法和软件

  1. 特定城市输入病人(称为零代病人)的一代感染者数量[math]\displaystyle{ m_{D}\left(t\right)=\sum_{\tau=1}^{\infty}D\left(t-\tau\right)R_{D}\left(t\right)\sum_{\xi=0}^{\infty}\rho_{D}\left(\xi\right)w\left(\tau+\xi\right) }[/math]
  2. 其他城市输入病人(称为零代病人)的一代感染者数量[math]\displaystyle{ m_{O}\left(t\right)=\sum_{\tau=1}^{\infty}O\left(t-\tau\right)R_{O}\left(t\right)\sum_{\xi=0}^{\infty}\rho_{O}\left(\xi\right)w\left(\tau+\xi\right) }[/math]
  3. 本地城市二代以及二代以上以上感染者数量[math]\displaystyle{ m_{C}\left(t\right)=\sum_{\tau=1}^{\infty}m\left(t-\tau\right)R_{C}\left(t\right)w\left(\tau\right) }[/math]
  4. [math]\displaystyle{ m\left(t\right)=m_{D}\left(t\right)+m_{O}\left(t\right)+m_{C}\left(t\right) }[/math]

相应的再生数为,

  1. [math]\displaystyle{ R_{D}\left(t\right)=\frac{m_{D}\left(t\right)}{\sum_{\tau=1}^{\infty}D\left(t-\tau\right)w\left(\tau+T_{c}\right)} }[/math]
  2. [math]\displaystyle{ R_{O}\left(t\right)=\frac{m_{O}\left(t\right)}{\sum_{\tau=1}^{\infty}O\left(t-\tau\right)w\left(\tau+T_{c}\right)} }[/math]
  3. [math]\displaystyle{ R_{C}\left(t\right)=\frac{m_{C}\left(t\right)}{\sum_{\tau=1}^{\infty}\left[m_{D}\left(t-\tau\right)+m_{O}\left(t-\tau\right)+m_{C}\left(t-\tau\right)\right]w\left(\tau\right)} }[/math]

更多解释见[考虑输入病人的模型]。

改进以后的计算方法得到的再生数,模拟数据用的输入和本地不同的再生数

改进以后的计算方法得到的再生数,模拟数据用的输入和本地不同的再生数

原始的计算方法得到的再生数

原始的计算方法得到的再生数

区分实际病人数量和收治病人数量的分析方法和软件

更进一步,考虑到发布的每天新增病人数据实际上不是所有病人的数量而是被收治病人的数量,因此,我们构建了考虑这两者不同的模型和计算框架。目前,这部分结果还在整理中。将来,我们只需要收治病人中的输入、输入传播、本地传播数据[math]\displaystyle{ X^{0,1,2+}\left(t,\tau\right) }[/math](在[math]\displaystyle{ t }[/math]时刻被收治,是指当时已经得病[math]\displaystyle{ \tau }[/math]天的意思)就可以算出来[math]\displaystyle{ I^{0,1,2+}\left(t,\tau\right) }[/math]。然后,带入到上面已经发展出来的计算方法就可以得到所有再生数。

传染事件时间间隔(SI)计算

在计算再生数的过程中,有一个关于疾病传播的量非常关键——感染事件时间间隔分布,也就是一个病人从自己被感染到感染下一个人的时间。这个分布函数是可以从个案数据中估计的。但是个案数据往往难以获得。因此,除了参考其他人的结果,我们还收集和统计了个安病人数据来算这个时间间隔。

中国新冠肺炎传染事件时间间隔分布函数,均值为5.0,标准差为3.3

中国新冠肺炎传染事件时间间隔分布函数,均值为5.0,标准差为3.3

注意,我们的新冠肺炎联合研究小组“公共安全和复杂系统”的学生处理了识别个案数据。如果你有其他研究需要这个数据,请和我们联系。

典型地区之一中国湖北之外的有效再生数计算

我们区分了中国湖北之外的数据中的输入、输入感染、本地感染三种病人,用发展了的方法做了有效再生数的计算。顺便,注意结果相差非常大。

中国湖北之外的再生数,区分输入、输入感染、本地感染三种病人的计算

中国湖北之外的再生数,区分输入、输入感染、本地感染三种病人的计算

中国湖北之外的再生数,区分输入、本地两种病人的计算

中国湖北之外的再生数,区分输入、本地两种病人的计算


注意,我们的新冠肺炎联合研究小组“公共安全和复杂系统”的学生处理了识别输入、输入感染、本地感染三种病人的数据。如果你有其他研究需要这个数据,请和我们联系。

武汉以及湖北武汉之外的地区的感染者时间序列估计

有了初始条件——武汉和湖北武汉之外地区的封城时候的病人数量,有了再生数时间序列参考值,我们就可以来做预测了。我们假设,武汉封城以后的再生数时间序列就等于参考值——相当于假设武汉的防控措施和全国其他地区的效果一致。注意,这里面还有一点点小小的细节:再生数时间序列参考值的时间起点可能和所要预测的发病时间不一致,后期可能也不够长。这里,我们用几个方式来补齐头尾。第一,尾部用参考值的最末尾的值补全——相当于假设从那之后防控措施不变。第二,头部我们要么用参考值的起点值补全(S1),要么用参考值和所要预测的对象的再生数的值匹配上(S2),要么直接把参考值的第一天和所要预测的对象的第一天对齐(S3)。具体用哪一种根据具体情况来选择。

对于武汉,我们用S1和S3两种。下面是S1的结果。假设在一开始的几天,有效再生数不比我们后来已经知道的要低(这个很可能是真的),然后,后面的就按照参考值,最终尾部预测部分保持参考值的最末尾的再生数大小不变。

武汉用全国湖北之外的再生数时间序列当参考值来估计,S1场景

武汉用全国湖北之外的再生数时间序列当参考值来估计,用全国湖北之外的再生数时间序列代替而得到的结果

湖北武汉之外的地区用全国湖北之外的再生数时间序列当参考值来估计,S1场景

湖北武汉之外的地区用全国湖北之外的再生数时间序列当参考值来估计,用全国湖北之外的再生数时间序列代替而得到的结果

英国、意大利、法国、德国、美国、伊朗、新加坡、日本、韩国等感染者的时间序列估计

用各自地区自己的再生数时间序列来简单延拓

意大利用意大利自己的再生数时间序列的末尾的值来延拓而得到的病人数量

意大利病人数量,用意大利自身的再生数延拓而得到的预测

英国用英国自己的再生数时间序列的末尾的值来延拓而得到的病人数量

英国病人数量,用英国自身的再生数延拓而得到的预测

用中国湖北之外当做典型案例来构造场景

意大利用中国湖北之外的再生数时间序列当参考值来估计,S2场景

意大利病人数量,用中国湖北之外的再生数时间序列当参考值来估计的结果,先匹配,再拼上,再延拓


英国用中国湖北之外的再生数时间序列当参考值来估计,S2场景

英国病人数量,用中国湖北之外的再生数时间序列当参考值来估计的结果,先匹配,再拼上,再延拓


我们还把新加坡的再生数时间序列也当做场景的基础

新加坡的再生数已经基本稳定,其防控措施也非常有效,当做典型案例之一,用来构造场景。

意大利用新加坡的再生数时间序列当参考值来估计,S2场景

意大利病人数量,用新加坡的再生数时间序列当参考值来估计的结果,先匹配,再拼上,再延拓

英国用新加坡的再生数时间序列的末尾的值来延拓而得到的病人数量

英国病人数量,用新加坡的再生数时间序列当参考值来估计的结果,先匹配,再拼上,再延拓

其实,中国和新加坡的防控措施都是比较严格的,在各自的国家也是容易实现的,但是在其他国家不见得能实现。因此,我们还缺一个欧洲国家的稳定再生数时间序列来当典型案例。

总结

数据

目前存放在石墨文档,稍后会整理一下公开发布。如果在研究中使用,请一定联系我们。

本分类目前不含有任何页面或媒体文件。