SARS 传播的数学模型
学生:赵 千 苏学渊 宋运吉
指导教师:杜鸿飞
摘要
本文分析了题目所提供的早期 SARS 传播模型的合理性与实用性,认为该模型可以
预测疫情发展的大致趋势,但是存在一定的不足.第一,混淆了累计患病人数与累计确
诊人数的概念;第二,借助其他地区数据进行预测,后期预测结果不够准确;第三,模
型的参数 L、K 的设定缺乏依据,具有一定的主观性.
针对早期模型的不足,在系统分析了 SARS 的传播机理后,把 SARS 的传播过程划分
为:征兆期,爆发期,高峰期和衰退期 4 个阶段.将每个阶段影响 SARS 传播的因素参数
化,在传染病 SIR 模型的基础上,改进得到 SARS 传播模型.采用离散化的方法对本模型
求数值解得到:北京 SARS 疫情的预测持续时间为 106 天,预测 SARS 患者累计 2514 人,
与实际情况比较吻合.
应用 SARS 传播模型,对隔离时间及隔离措施强度的效果进行分析,得出结论:“早
发现,早隔离”能有效减少累计患病人数;“严格隔离”能有效缩短疫情持续时间.
在建立模型的过程中发现,需要认清 SARS 传播机理,获得真实有效的数据.而题目
所提供的累计确诊人数并不等于同期累计患病人数,这给模型的建立带来不小的困难.
本文分析了海外来京旅游人数受 SARS 的影响,建立时间序列半参数回归模型进行
了预测,估算出 SARS 会对北京入境旅游业造成 23.22 亿元人民币损失,并预计北京海
外旅游人数在 10 月以前能恢复正常.
最后给当地报刊写了一篇短文,介绍了建立传染病数学模型的重要性.
1.问题的重述
SARS(严重急性呼吸道综合症,俗称:非典型肺炎)的爆发和蔓延使我们认识到,
定量地研究传染病的传播规律,为预测和控制传染病蔓延创造条件,具有很高的重要性.
现需要做以下工作:
(1) 对题目提供的一个早期模型,评价其合理性和实用性.
(2) 建立自己的模型,说明优于早期模型的原因;说明怎样才能建立一个真正
能够预测以及能为预防和控制提供可靠、足够信息的模型,并指出这样做的困难;评价
卫生部门采取的措施,如:提前和延后 5 天采取严格的隔离措施,估计对疫情传播的影
响.
(3) 根据题目提供的数据建立相应的数学模型,预测 SARS 对社会经济的影响.
(4) 给当地报刊写一篇通俗短文,说明建立传染病数学模型的重要性.
2.早期模型的分析与评价
题目要求建立 SARS 的传播模型,整个工作的关键是建立真正能够预测以及能为预
防和控制提供可靠、足够的信息的模型.如何结合可靠、足够这两个要求评价一个模型
的合理性和实用性,首先需要明确:
合理性定义 要求模型的建立有根据,预测结果切合实际.
实用性定义 要求模型能全面模拟真实情况,以量化指标指导实际.
所以合理的模型能为预防和控制提供可靠的信息;实用的模型能为预防和控制提供
足够的信息.
2.1 早期模型简述
早期模型是一个 SARS 疫情分析及疫情走势预测的模型,该模型假定初始时刻的病
例数为 0N ,平均每病人每天可传染 K个人(K一般为小数),K代表某种社会环境下
一个病人传染他人的平均概率,与全社会的警觉程度、政府和公众采取的各种措施有关.
整个模型的 K值从开始到高峰期间保持不变,高峰期后 10 天的范围内 K值逐步被调整
到比较小的值,然后又保持不变.
平均每个病人可以直接感染他人的时间为 L天.整个模型的 L一直被定为 20.则在 L
天之内,病例数目的增长随时间 t(单位天)的关系是:
tN
)(
N
0
1(
tk
)
考虑传染期限 L的作用后,变化将显著偏离指数律,增长速度会放慢.采用半模拟
循环计算的办法,把到达 L天的病例从可以引发直接传染的基数中去掉.
2.2 早期模型合理性评价
根据早期模型对北京疫情的分析与预测,其先将北京的病例起点定在 3 月 1 日,经
过大约 59 天在 4 月 29 日左右达到高峰,然后通过拟合起点和 4 月 20 日以后的数据定
出高峰期以前的 K=0.13913.高峰期后的 K值按香港情况变化,即 10 天范围内 K值逐步
被调整到 0.0273.L 恒为 20.由此画出北京 3 月 1 日至 5 月 7 日疫情发展趋势拟合图像以
及 5 月 7 日以后的疫情发展趋势预测图像,如图 1. 从图 1 可以看出,从 4 月 20 日至 5
月 7 日模型计算值与同期实际值的拟合程度比较好,但 5 月 7 日后模型计算值(即预测
值)随着日期的增长逐渐偏离实际值.
为了进一步验证上述分析,对模型计算值曲线和实际值进行残差分析,记 iy 表示
第 i 天实际累计病例,
iyˆ 表示第 i 天计算累计病例.计算
图 1 早期模型计算值与实际值对比图
e
*
i
其中,用 ˆ 作为 的估计:
y
e
i
i
ˆ
iy
,
i
,2,1
,
n
n
i
1
y
i
(
y
i
)ˆ
y
i
n
2
ˆ
做出标准化残差
*
ie 的分布图,如图 2:
图 2 早期模型的标准化残差分布图
可以很明显地看出,在后期,残差图上出现明显的单减规律性,预测值高于实际值,
说明预测值确实逐渐偏离实际值.
通过以上分析得合理性评价:
1 从预测准确度上有失合理性,虽然早期模型在拟合前期疫情时拟合程度较好,但
对后期情况的预测出现较大偏差.
2 尽管预测准确程度不高,但是该模型确实预测出了整个疫情的发展趋势.从这一
点上看,该模型还是切合实际的.
3 该模型选用公布数据直接拟合,从而预测后期疫情发展趋势,这有悖于模型本身
)(tN 实际代表的是 t 时刻全社会的累计 SARS 患者,而公布数据
的含义.因为模型中的
仅为同期的累计确诊 SARS 患者,显然前者是大于或等于后者的.如果把公布数据当成实
际数据处理,这必然导致模型解出现偏差,且解的实际意义不明确.对于这一点,我们
将在建立自己的模型时重点关注!
2.3 早期模型实用性评价
模型的实用性关注的是模型能否真实全面的模拟真实情况,从而用模型指导实际.
这里主要抓住早期模型的参数设置情况进行实用性评价:
1 该模型简单地以高峰期作为分析的临界点,这似乎对 SARS 发展的阶段没有了解
透彻.同时,模型没有提出高峰期的确定方法,整个模型的建立必须有实际高峰期附近
数据的支撑.如果仅有疫情爆发初期的数据,该模型就无法预测出疫情中后期发展的趋
势,模型的实际应用范围受到限制.
2 参数 K代表某种社会环境下一个病人每天传染他人的人数,与全社会的警觉程度、
政府和公众采取的各种措施有关.在初期,该模型将 K固定在一个比较高的定值,在疫
情高峰期过后,在 10 天内逐步调整 K值到比较小,然后保持不变.但模型并没有给出 K
值的具体算法,只是不断地进行人工调整,具有一定的主观性.同时沿用了香港疫情分
析中的数据来预测北京的情况,可见该模型未对北京的实际情况进行充分的考虑.
3 参数 L代表平均每个病人在被发现前后可以造成直接传染的期限,在此期限后失
去传染作用,可能的原因是被严格隔离、病愈不再传染和死去等等.该模型把 L的值固
定为 20,而实际的 L应该随疫情发展趋势变化而变化,固定 L势必使模型只能片面模拟
真实情况.
综上,早期模型的一部分分析脱离了实际,而且在整个模型的建立和求解中人工干
预过多,实际应用范围受到了限制,实用性不强.
3. SARS 传播过程的分析
由于早期模型缺少对 SARS 传播过程的系统分析,所以,要建立真正能预测病情发
展的模型,应该首先对整个传播过程有一个全面而详尽的分析.
SARS 的传播大致经历了 4 个过程,相关描述可按照 Kink 于 1986 年提出的危机“四
阶段说”.
第一阶段是征兆期.在 SARS 传播初期,由于 SARS 感染者需要经历一定时间才表现
出临床症状,所以在病毒实际上已经广泛传播的情况下,政府和公众并未引起注意.在
这个时期,携带病毒的传播源没受到控制,平均传播期长,但整个社会的发病率还较低.
第二阶段是迅速爆发期和蔓延期.当公众发现感染者不断增加时,恐慌情绪增加,
政府随即采取多种措施,但由于对病毒传播的特点不清楚,并未收到预期效果.在这个
时期,传播源的平均传播期依然较长,整个社会的发病率突然猛增.
第三个阶段是高峰期.当高强度的措施实施后,病毒扩散速度实际已经被控制,发
病人数保持稳定,处在一个高平台阶段.在这个时期,有效隔离措施的产生,大大缩短
了平均传染期,但由于病患基数较大,社会发病率依然很高.
第四个阶段是衰退期和有效控制期.在高平台现象一段时间以后,控制措施的作用
开始显现,患病人数开始下降,进入控制时期.在这个时期,平均感染期最短,社会发
病率低.疫情进入了 4 个阶段的最后时期.
有了以上的分析,建立的模型就应该体现 4 个不同时期下疫情的发展过程,并能够
在此基础上准确预测疫情变化情况,提出切实可行的控制措施.考虑在经典传染病 SIR
模型基础上,通过机理分析,加入合理的实际因素,建立适合 SARS 的分段微分方程模
型,称为 SARS 传播的 SIR 改进模型.
4. SARS 传播的 SIR 改进模型
4.1 模型的假设
1. SARS 的持续期不太长,可以忽略在 SARS 持续期内的城市人口的自然出生率和自然
死亡率.
2. 被 SARS 感染后经治疗康复的人群在 SARS 流行期不会被再次感染.
3. 病人被严格隔离、治愈或者死亡后,不再有感染作用.
4. 不考虑人口的流动,仅仅在一个城市范围内研究 SARS 疫情的发展过程.
4.2 模型的符号定义
)(tS
:易感类人群占城市人口总数的比例.
)(tI
)(tR
:传染类人群占城市人口总数的比例.
:排除类人群占城市人口总数的比例.
时刻被隔离的
时刻全社会
SARS
患者数
患者总数
t
t
)(t :SARS 患者的就诊率
:单位时间内一个传染者与他人的接触率.
L :平均传染期.
SARS
4.3 传播机理分析
针对早期模型的不足,需要在模型的合理性和实用性方面进行改进.考虑在经典传
染病模型 SIR 的基础上,通过机理分析,用实际因素来描述 SARS 的传播过程.
为了简化模型,这里不考虑人口的流动带来的影响,仅仅在一个封闭城市中研究
SARS 的传播机理.那么,整个社会人群可以分为 3 类:
S 类:称为易感类,该类成员没有染上传染病,但缺乏免疫能力,可以被染上传染
病.
I 类:称为传染类,该类成员已经染上传染病,而且可以传染给 S 类成员.
R 类:称为排除类或恢复类,R 类成员或者是 I 类成员被严格隔离、治愈,或者死
亡等.I 类成员转化为 R 类后,立刻失去传染能力.
S(t)、I(t)、R(t)分别表示 t 时刻上述 3 类成员占城市人口总数的比例.
对于传播过程有 3 条基本假设:
1A :人口总数为常数 N,N 足够大,可以把变量 S(t)、I(t)、R(t)视为连续变量,
还可进一步假定为连续可微变量.
2A :人群中 3 类成员均匀分布,传播方式为接触性传播.单位时间内一个传染者与
)(tS ,因此,
他人的接触率为 ,则一个传播者在单位时间内与 S 类成员的接触率为
单位时间内 I 类成员与 S 类成员的接触总数为
tSN
)(
tI
)(
,这就是单位时间内 I 类
成员增加的数量,称为发病率,它是 S(t)和 I(t)的双线性函数.
3A :传播者的被控制数正比于传染者的数量
)(tNI ,比例系数为 v , v 称为被控
制率,则平均传染期
为
L
1
/
.v
v/
为一个传染者在其传播期内与其他成员的接
触总数,称为接触数.
那么 SARS 的传播流程如图 3:
易感类
tNS
)(
NSI
传染
传染类
tNI
)(
vNS
控制
排除类
tNR
)(
在这个模型中,排除类
)(tNR 就是已确诊 SARS 患者累计数,而
N
1[
tS
(
)]
是全
图 3 SARS 传播流程图
社会累计 SARS 患者数,包括已确诊的和未被发现的两部分.
4.4 模型的建立
有了以上的机理分析,建立起针对 SARS 的改进 SIR 模型:
dS
dt
dI
dt
dR
dt
I
S
R
0
0
SI
(1)
SI
vI
(2)
vI
R
,0
0
S
I
0
1
0
该模型中参数 和 v 在疫情发展的各个阶段受实际因素影响,会有比较明显的变
化,现分析如下:
1 参数 表示单位时间内一个传染者与他人的接触率,其与全社会的警觉程度和政
府、公众采取的各种措施有关,例如,佩戴口罩,减少停留在公共场所的时间,喷洒消
毒药剂,提高隔离强度等都能有效地降低接触率 的值.
一般认为,的数值随着 SARS 发展的 4 个阶段不断变化.在 SARS 初期,由于潜伏
期的存在和社会对 SARS 病毒传播的速度认识不足,政府和公众并未引起重视,故
维持在一个较高的数值;进入爆发期后,公众发现感染者不断增加,恐慌情绪增加,随
即采取多种措施,使 得到一定的控制,但效果不明显,此处假设 呈线性形式缓慢
衰减;在高峰期,当高强度的控制措施实施后,病毒传播的有效接触率明显减少,可以
认为 按天数呈指数形式衰减;此后进入衰减期,就维持在一个较低值附近.
2 参数 表示传播者的被控制率.
v
L
/1 称为平均传染期,表示一个传播者在被隔
v
离或者死亡之前具有传播能力的平均时间.一般认为,SARS 患者经过传染期 L过后,将
隔离治疗或者死亡,从 I 类成员变为 R 类,失去传播能力.
L与政府采取的措施密切相关,例如,尽量早地发现病患,对疑似病例提前进行隔
离,“早发现,早隔离” ;提供更广范围的医疗手段,使更多的人接受有效的治疗等,
都可以有效地降低平均传染期 L的长度.因此这里将 L直接抽象为每一时期 SARS 患者的
就诊率 )(t 的函数.
平均传染期 L应随 )(t 的变化而变化.但是在初期,由于政府对 SARS 的认识不足,
并没有采取有效控制措施, L的变化很小可以近似看作定值,这里我们取 SARS 病毒最
长潜伏期(约 19 天)为这个定值;在爆发期,有效控制措施的逐步加强,使 SARS 患者
的就诊率 )(t 逐渐增加,而平均传染期 L会逐渐减小并趋于一个定值,这里我们将 SARS
病毒平均潜伏期(约 7 天)定为 L的最小值;在此后的高峰期以及衰减期,由于控制措
施都保持在一定水平,L的值会维持在 7 天左右.
4.5 针对北京疫情求解模型
首先采用数学推导的方法,确定参数 和 v ,并证明模型有唯一解.
1 确定 和 v 的关系. 令
v
,方程组中
)2( 得:
)1(
dI
dS
1
1
S
dI
dS
1
1
S
0
,由于 )(tS 是单调减少的,且 )(tI 最终趋近于 0,则
1当 S 时, )(tI 先单调增加达到最大值,然
1S,当 时,才满足 SARS 的传播规律,所以 数参
在病情刚开始时,
1S 时
当
)(t, I 单调减少趋近于 0;
后单调减少趋近于 0. 容易知道
和 v 的取值必须满足这个条件.
2 证明模型有唯一解
在初值条件下解微分方程组:
dI
dS
I
0
1
S
0
1
S
R
0
1
得到关系式:
t
令
,由 1 得
0S
因为
,所以令
tI
1)(
R
0
S
1
ln(
S
S
0
)
10
R
0
S
1
ln(
S
S
0
)
xf
1)(
R
0
x
1
ln(
x
S
0
)
lim
0
则
x
xf
)(
Sf
(
0
1)
R
0
S
0
I
0
0
,
0 S
0 S
1
1
当
当
时,由于
xf
)(
0
,0( S 范围内有根,因而在
)0
在
)1,0(
内有根.
时,因为
f
x
)('
1
x
x
1
当
x
f
x
)('
0
时,
,所以
f
)1(
Sf
(
0
)
I
0
0
,因而
xf
)(
0
在
)1,0(
内也有根.
0
注意到当
x
1
)1,0(
时,
f
x
)('
0
,故
xf
)(
0
在
)1,0(
内有唯一根.
所以, 在S
内有唯一解.
3 划分 SARS 传播的 4 个阶段
由于 SARS 的传播经历了 4 个阶段,所以,要以具体的指标划分这 4 个阶段.因为在
4 个阶段中,日发病率
t
)(
tSN
)(
I
)t(
是一个区分每个阶段特点的关键特征,所
以以日发病率作为划分的指标.从第一个患者出现日开始:
征兆期:日发病率在 10(人/天)以下.北京疫情期的前 40 天.