科研动态

建立新型通用传染病预测模式,破解人类疫情预测国际难题

时间:2021.10.18 来源:物理海洋室 字号

自新冠疫情暴发以来,全球科技界为科学应对疫情做出了巨大贡献。据统计,新冠疫情迄今为止不到2年,但发表的疫情相关学术论文已经超过8.7万篇,这在人类科学史上尚属首次。但对如何准确预测疫情走向,仍然是一个悬而未决的重大科学难题。10月13日,国际著名科学杂志《英国皇家学会会刊》发表了自然资源部第一海洋研究所中国工程院外籍院士、美国国家工程院院士黄锷研究员和国际欧亚科学院院士乔方利研究员为共同第一作者,美国华盛顿大学KK Tung教授为通讯作者的学术论文。该文报道了每日新增病例(N)与每日康复与死亡之和(R)的比值(N/R)的对数符合一条直线分布这一重大科学发现,并以此为基础建立了对任何传染病均适用的新型通用数值预报模式。该模式可以更为精确地预测疫情拐点、所需最大医疗资源、感染者恢复期等疫情防控的核心指标,且具有使用简便、快捷的特点。详情如下:

1、约100年之前,1927年英国皇家学会院士W A Kermack和爱丁堡皇家学会院士A G McKendrick在《英国皇家学会会刊》发表了疫情数学理论的经典论文,建立了传染病“易感者-感染者-移出者(SIR)模式”,用来预测疾病发展变化的过程和传播规律,评估各种管控措施的效果,开创了传染病预测的新时代。虽然近百年来SIR模式不断发展与完善,但缺乏实质性的改进。比如,每日感染人数的时间分布与每日治愈人数的时间分布之间存在一段时间滞后,但目前的SIR模式不能反映这种滞后现象。此次建立的新型传染病预测模式,则能准确地反映这种时间滞后关系,是传染病预测模式的重大革新。

2、该文从纷繁复杂的数据资料中发现N/R的对数是一条直线的科学规律,并对该规律进行了严格的数学证明。该直线延伸至零值的时间点即是疫情拐点。由于直线的延伸误差最小,因此给出的预测会非常准确。在数据理想条件下,两天的数据即可确定这条直线。N/R在科学上克服了长期存在的一个关键障碍:因有的感染者是无症状的,有的感染者由于医疗资源的限制或者检测频率不足等没有检测出来等等,导致发现的感染者总是实际感染者的一部分。N/R则完美地突破了这一障碍,因此N/R的对数符合直线分布是隐藏在数据背后的一条本质性的科学规律,对疫情防控意义重大。

3、相对于原来的群体免疫,提出了“管控平衡”新概念。数据分析结果显示,“管控平衡”是此次新冠疫情科学合理的疫情应对方案。若在管控条件下,N/R取对数后的直线会变陡,且管控越严格则直线的斜率越陡,表明疫情会在更短时间内可以到达零值,即到达疫情的拐点。例如,中国、韩国和德国在“管控平衡”方面均取得良好的效果,特别是去除湖北以外的中国地区的疫情数据,严格分布在一条很陡的直线上,这完全符合该文章揭示的科学规律。但相比而言,美国和意大利疫情管控效果不彰。另一个例证是:新冠疫情首先在湖北武汉爆发,随后波及全国。按照传统的SIR模式,湖北应该先到达疫情拐点。但实际观测资料显示,我国湖北以外地区在2020年2月12日达到拐点,而湖北的疫情拐点则在2月19日达到,这主要是因为湖北以外地区严格的疫情管控,且防疫的医疗资源压力相比较小的缘故,这在新型模式中均有精确表达。

4、提出用疫情报告数据反推疫情基本再生数(或称基本传染数)(R0)的方法。R0是疫情最核心的参数,但医学界对其给出的估计千差万别,而这个参数又直接决定了疫情的预测,通常是要等到疫情过后用数值实验来估算该量值,这种估算在本质上是一个数学病态方程。该文提出用实际的常规观测数据反推R0的方法,避免了长期以来SIR模式依靠曲线拟合反推R0的窘境。利用该方法,计算得到初期新冠疫情R0约为4.0,转型为阿尔法病毒后的R0约为6.0,而转化为德尔塔病毒后R0增加到为9.0。

5、定量确定了疫苗接种率与管控平衡之间的关系。首先,以初期新冠疫情为例,其R0=4.0,若某种疫苗针对初期新冠病毒的有效率为90%,则需要(R0-1)/ R0÷90%=83%的全国或某一地区疫苗接种率才能控制住疫情在一个国家或某一地区的蔓延。其次,对于德尔塔病毒,R0=9.0,即使疫苗针对德尔塔新冠病毒的有效率仍可高达90%,则需要(R0-1)/R0÷90%=99%的疫苗接种率才能控制住疫情扩散,考虑到部分儿童和老人无法接种疫苗,在任何一个国家实现99%的疫苗接种率几乎是不可能的。因此,辅以必要的疫情管控措施,仍将是控制住德尔塔病毒新冠疫情蔓延的关键所在。管控为疫苗研制与推广赢得了时间,但同时管控的社会成本也较高。按此规律估计,针对此次新冠疫情,疫苗接种达到80%仍难以建立群体免疫屏障。

6、利用建立的新型模式,提出了一套准确且简单易行的预测方法,可以对疫情拐点、最大所需病床数(医疗资源)、平均住院天数等核心参数给出较为准确的预测。如该模式对湖北和整个中国的疫情拐点在2020年2月8日之前就给出了准确预测,即使2月12日单日确诊病例超过1.4万人,也没有对预测结果造成大的影响。又如对意大利疫情的预测,2020年4月21日出现拐点,早在6周之前新型模式预测的疫情拐点误差仅为4天。迄今为止,唯有该新型模式能够对新冠疫情做出如此精准的预测。

疫情是复杂的,感染者数量很小时不具有疫情的代表性。政府管控措施会根据实际情况随时调整,拐点过后或者医疗体系在长期高强度压力下可能会出现放松警惕等情况。另外,随着病毒变种,疫情防控难度会不同,且疫情会呈现脉冲式爆发,如美国迄今为止已经历了5波疫情。这些因素都会对预测的准确度带来影响。依靠原有的SIR模式进行预测会有很大的局限性。尽管该文所建立的传染病新型模式非常简单,但因为是基于实际数据而且是动态调整的,所以上述因素在模式中都能反映出来。可以预期,该文建立的新型通用传染病预测模式会为人类疫情防控和传染病科学应对提供重要的科技支撑。

论文:Huang NE, Qiao F, Wang Q, Qian H, Tung K-K. 2021. A model for the spread of infectious diseases compatible with case data. Proc. R. Soc. A 477: 20210551. https://doi.org/10.1098/rspa.2021.0551.

A model for the spread of infectious diseases compatible with case data.pdf