以广州市2014年登革热疫情早期11周内679个登革热病例数据为例,提出了一种基于扩展Knox检验的疾病时空传播网络模型,研究登革热疫情早期时空传播特征。首先,应用扩展Knox检验方法发现2周1 km内、1周5~7 km两个时空标度下,病例之间具有显著的时空交互特征;其次,提取两个时空标度下的病例点对,分别构造时空近邻传播(STAT)网络和日常移动传播(HDMT)网络;最后,对STAT和HDMT传播网络的同配性、空间特征、网络中心位置进行对比分析。结果显示,广州市登革热传播是空间近邻交叉传播和空间扩散传播的混合传播模式;利用STAT网络亲近中心度标识出的“爆发中心”与病例空间核密度中心基本重合,HDMT网络中介中心度标识出的“扩散中枢”多位于城市快速交通干线附近。

This paper proposes a new method to model the spatial and temporal transmission network for infectious disease. Specifically, 679 cases from the early 11 weeks of the dengue fever outbreak in Guangzhou in 2014 are used to analyze the disease transmission characteristics. Three methods are adopted for the analysis. (1) We use extended Knox test to derive the main time and space interaction sectors at a distance of 1 km in two weeks and that of 5-7 km in one week. (2) We pair the cases from different areas to construct the space-time affinity transmission (STAT) network and the human daily movement transmission (HDMT) network. (3) We compare the assortativity, spatial characteristics, and the central network location between STAT and HDMT network by using complex network theories. The result shows that the percentages of overall cases included in the STAT and HDMT networks are 92.93% and 97.05%, respectively. This means that both STAT and HDMT network models imply the overall transmission of the dengue fever outbreak. STAT network is assortative, and presents the cross infection in neighboring areas. On the contrary, HDMT network is disassortative, and it displays the diffusion infection character of the dengue fever outbreak. We earmark the location of outbreak center as well as the diffusion center with the degree of closeness centrality in STAT network and the degree of betweenness centrality in HDMT network. This shows that the outbreak center approximately overlaps the spatial kernel density center of all cases, while the diffusion centers are located along the urban rapid transit routes.

Keywords:extended Knox test;spatial-temporal transmission network;mixing pattern;dengue fever;Guangzhou

1 引言

登革热(dengue fever, DF)是热带、亚热带流行的一种虫媒传染病,多发生在城市地区,全世界有128个国家约39.7亿人面临登革热病毒的感染风险[1],每年约有3.9亿例登革热感染者,其中9600万出现不同程度的临床症状[2]。随着各国城市化进程加快,现代大都市巨量的人口、高效而密集的交通网络、复杂的居住分异模式、多样的自然地理环境,使得城市中登革热爆发的频度和强度越来越高,并呈现出不同以往的传播特征。
由于目前尚无特效的治疗药物和疫苗,避免人—蚊直接接触[3]、控制传染源、切断传播途径是登革热防控的主要策略。随着地理学在公共健康领域研究的发展,其以独特的地理学视角,揭示了登革热的传播受地理环境[4-6]、气象条件[7-10]和城市化[11-16]影响,其时空分布具有显著的区域特征。Morrison等[17]通过对Florida的Puerto Rico 1991-1992年病例数据的时空分析,发现短时间内(3天内)呈现显著的家庭式集聚;Trans等[18]对法属圭亚那2001年确诊病例的研究发现,登革热病例主要聚集在100 m范围。这些研究充分说明了控制局部传播的必要性和有效性。Rotela等[19]对阿根廷北部塔塔卡尔市2004年487例登革热数据的分析发现除了100 m内1天之内的集聚,在500~2800 m空间尺度上1~3天和12~15天内还存在两个显著的时空集聚;Estallo等[20]对阿根廷第二大城市科尔多瓦2009年病例时空分布的研究,也发现了在4~24天时间尺度上和2.4~12 km空间尺度上存在多个集聚;Kan等[21]研究发现高雄市2001-2003年登革热,早期的传播主要是连续传播,由初始的集聚中心向邻域的连续扩散传播;数周后出现扩散传播,即由集聚中心向相距一定距离的其他区域跳跃式传播。由于蚊子的飞行距离有限[22],在城市内引发大面积爆发的原因除了局部环境因素外,人们日常移动是登革热在城市内大范围扩散传播的重要因素之一[4, 23-24]

2 研究区域与数据来源

2.1 研究区域

-->Fig. 1Study area: Guangzhou, China

2.2 登革热病例数据

-->Fig. 2Temporal progression of Dengue Fevercases of the outbreak in 2014


3 研究方法


3.1 扩展Knox检测

Knox检测[31-32]是传染病时空交互研究中最常用的一种统计方法,用来判定空间距离相邻的两个病例其发生时间也接近,反之亦然。该方法常用于探测传染病病例之间时空距离分布,对原因不明和机理复杂的疾病可以“诊断”具有传播特征的时空距离,因此对传染病早期预警有一定作用。假如有n个病例,Knox方法需要构建两个n×n的两两病例的邻近矩阵。第一个矩阵定义为空间邻近矩阵:如果i病例与j病例之间的空间距离在一定的阈值范围内,则矩阵元素SDij =1,否则为0;第二个矩阵定义为时间邻近矩阵:如果病例i与病例j之间的发病时间距离在一定的阈值范围内,则矩阵元素TDij =1,否则为0。当i=j时,则矩阵元素为0,那么Knox指数表示为:
Knox检验的时间和空间阈值较难设定,因此在实际应用中,Knox扩展了Knox检 验方法[33],在时间维上把研究时段划分为:0~1t, 1t~2t, …, (n-1)t~nt;空间维上把空间距离划分为:0~1d, 1d~2d, …, (m-1)d~md,构成n×m的列联表,利用蒙特卡罗模拟方法[34]探测不同时空单元上是否存在显著地时空交互现象。如果在某个时间和空间标度下存在显著的时空交互,则说明疾病在该时空标度下的扩散传播概率远远大于其他非交互标度。

3.2 时空传播网络建模

式中: (vi,vj)表示由一对病例构成网络的边; dsdt分别表示病例之间空间距离和时间间隔度量函数; ts,te,ds,de表示发生时空交互的区间。
如此构造的时空传播网络可能仅反应特定时段部分病例传播的局部特征。因此,本文定义覆盖系数 ct表示时空传播网络表达疾病传播时空全局特征的能力:
式中: V(Gtransmission)表示时空传播网络的顶点数量; n表示研究病例总数量。显然,覆盖系数越高,构建的时空传播网络越能反映整体的传播行为。

3.3 传播重点区域识别

式中: ejk表示在网络所有边中度值为jk的边所占的比例; qjqk分别为有一端节点度值为jk的边所占的比例; σq2qk分布的方差。同配系数r在[-1, 1]之间, r>0表示同配网络,即度大的节点倾向于与度大的节点连接; r<0表示异配网络,即度大的节点倾向于与度小的节点连接。葛新等[36]对计算机病毒在复杂网络中的传播研究也发现:同配网络稳定,病毒更容易传播且不易清除;异配网络病毒传播慢,但遇到度高的节点则扩散,通过清除一些度高的关键节点,可以阻断病毒的传播。
针对不同的网络类型,本文对同配网络采用亲近中心度(closeness centrality)标定疾病的爆发中心;对异配网络采用中介中心度(betweenness centrality)标定疾病传播途径中关键节点。
式中: n表示图中网络节点数; du,v表示 uv两个节点之间最短距离。
式中: V是节点集合; σs,t表示顶点 st之间最短路径数量; σs,t|v则是通过节点 v的路径数量。

4 结果分析

4.1 登革热时空交互识别

在时间尺度上以天为单位,空间尺度上以100 m为单位,对时空单元内病例点对数进行统计(图3)。可见很多的病例点对集聚在1 km、2周以及5~7 km、1周的时空标度下。
-->Fig. 3Patterns of pairwise space-time distance

表1中列出了时间距离0~5周,空间距离0~9 km的Knox指数联列表,其中,时间间隔为1周,空间间隔为1 km。
Tab. 1
Tab. 1Contingency table of Knox index
[0, 1)[1, 2)[2, 3)[3, 4)[4, 5)
[0, 1)9649*6779*42292707*2180*
[1, 2)9322606336202244*1440
[2, 3)80375118308316921319
[3, 4)83115321314117251294
[4, 5)84215583347616531184
[5, 6)9132*5720324614671173
[6, 7)8942*55103070*14021197
[7, 8)6502382525231019791
[8, 9)478929832088727618

注:*:p < 0.001
表1中共有8个单元具有显著的时空交互现象,其中[[0, 2), [0, 1)]以及[[0, 1), [5, 7)]两个区域不仅具有显著的时空交互而且具有大量的病例点对。本研究将2周内、1 km内的病例点对之间的扩散传播称为时空邻近传播(Spatial-Temporal affinity Transmission, STAT);1周内,5~7 km的病例点对之间的扩散传播称为日常移动传播(Human Daily Movement Transmission, HDMT)。虽然登革热不会在人与人之间直接传播,但是,白蚊或者伊蚊叮咬登革热病人或隐性感染者后,病毒在蚊子体内大量复制,它再叮咬其他健康人时,就会将病毒传播给他人,从而导致登革热的时空邻近传播。病例点对空间距离在5~7 km之间出现显著地时空交互现象,这一距离已远远超出了蚊子的飞行距离,揭示了感染者日常移动在病毒扩散中的作用。这两个时空交互区域的发现,说明广州登革热的时空传播属于混合模式,防控重点不仅是新发病例周边的时空邻近传播,还有日常移动传播。

4.2 登革热时空传播网络特征

2014年登革热爆发早期11周内共有679个病例数据,以时空邻近传播病例点对构成的STAT网络共包含631个病例点,覆盖系数为92.93%(图4a);以日常移动传播病例点对构成的HDMT网络共包含659个病例节点,覆盖系数为97.05%(图4b)。覆盖系数均大于90%,即每个新发病例在它周边1 km内2周内或5~7 km 1周内有90%以上概率找到相邻病例,说明由此构建的传播网络可以展现登革热传播的时空传播总体特征。
-->Fig. 4Networks of DF space-time transmission

进一步计算其同配系数,STAT的同配系数为0.7,属于同质网络;HDMT的同配系数为-0.4,属于异质网络。STAT网络同配,说明一旦一个区域发生伊蚊传播,短期内就会发生向邻域的快速传播,导致每个病例周边都有很多病例出现。HDMT网络异配,说明日常移动传播是异质的,仅部分有特定条件的点成为新的扩散中枢。在爆发早期,这些节点度很高,在它周围5~7 km有许多度较低的节点,形成向外扩散的趋势。
-->Fig. 5Line density of transmission networks

4.3 爆发中心与扩散中枢的位置识别

-->Fig. 6Spatial distribution of nods with top 20% closeness centrality

-->Fig. 7Spatial distribution of betweenness hub in HDMT transmission network

中介中心度越高的节点表示通过该节点的最短路径越多,是疾病传播网络中越重要的扩散中枢。在异配网络中,消除这些节点就可以切断子网络之间的传播,对疾病控制意义重大。将中介中心度在前20%的节点定义为扩散中枢,共计132个。以爆发中心的质心为圆心分别作1 km、5 km、7 km的缓冲区(图7a),扩散中枢节点在5~7 km圈层中有60个,占总数的45.45%。当把扩散中枢节点图与广州市地铁线图叠置后(图7b),有101个扩散中枢在地铁沿线的1 km缓冲区内,占总数的76.52%。
沿地铁交通线按0.5 km、1.0 km、1.5 km、2.0 km、2.5 km、3.0 km、3.5 km、4.0 km做缓冲区,对应扩散中枢数量分别为65、36、21、4、2、1、2、1,呈现显著的随距离增大而减小的特征。将圈层中心1 km及5~7 km圈层划分为重点区域,距离重点区域1 km的为次要区域,其他为普通区域,区域编码分别为1、2、3,对应扩散中枢数量分别为76、39、21。将地铁缓冲区与圈层做交集,得到中枢数量、地铁缓冲区、区域编码表,应用地理探测器[39-40],检验地铁以及圈层对扩散中枢的影响。结果显示两个因子 q(x_Metro)=0.27q(x_Ring)=0.18说明了地铁对扩散中枢的影响要比圈层的影响大,且满足 qx_Metro?x_Ring>qx_Metro+q(x_Ring),为强非线性交互作用,即扩散中枢主要分布在地铁沿线且在圈层的重点区域,说明了日常移动对登革热疾病传播的影响。

5 结论与讨论

本文以广州市2014登革热早期679个病例数据为研究案例,使用扩展Knox时空交互检验方法,发现病例之间在2周内1 km、1周内5~7 km两个时空标度下具有显著的交互现象,说明了登革热传播不仅具有时空邻近传播的特征,同时还具有日常移动传播的特征。并由此分别构建STAT和HDMT两个特征网络,通过传播网络线密度图和网络特征分析,发现在农林街道和东湖街道形成集聚中心,并以此集聚中心向外扩散传播的特征。由网络亲近中心度确定的“爆发中心”与核密度中心基本一致,中介中心度确定的“扩散中枢”与城市快速交通存在关联。本文提出的基于扩展Knox检验疾病时空传播网络模型,可用于城市虫媒传染病的扩散传播研究,并得到如下结论:
登革热的扩散传播机制非常复杂,研究中发现登革热传播方向并不是均匀的,需要进一步结合伊蚊的生境及其密度,人口密度以及地表等数据,研究其对登革热传播的影响;同时随着信息和通讯技术的发展,城市中大量的传感器,例如全球定位系统GPS、移动通讯GSM、智能卡收费系统数据(Smart Card Data, SCD)等,可以获取大规模的、高质量的个体时空数据,有助于更有效地干预登革热的传播。
The authors have declared that no competing interests exist.

