清华大学 工程物理系, 公共安全研究院, 北京 100084
收稿日期: 2015-12-27
基金项目: 国家自然科学基金资助项目(71203118)
作者简介: 马勋 (1991-), 男, 博士研究生。
通讯作者: 倪顺江, 讲师, E-mail: sjni@tsinghua.edu.cn
摘要:为了研究高校师生群体之间的接触特性, 该文通过视频监控的手段收集了相关接触数据, 构建了该高校某研究所师生群体间的人员接触网络, 并分析了该网络的度分布、聚类系数、层次性及社团结构等特性。统计结果显示, 该研究所人员接触网络所表现出的特征兼有ER(Erdos-Renyi) 随机网络和WS(Watts-Strogatz) 小世界网络的部分特征, 同时又呈现出丰富的层次结构和模块化特性, 这些特征使得该网络明显区别于现有的ER随机网络和WS小世界网络。师生关系对于该人员接触网络的拓扑结构影响明显。该研究成果可为构建一般工作场所的人群接触网络模型提供实证研究基础, 对研究工作场所中传染病、信息等的传播动力学模型具有重要意义。
关键词: 人员接触网络 度分布 群组结构
Student-teacher networks in university research institutes
MA Xun, SHEN Shifei, NI Shunjiang, YONG Nuo
Institute of Public Safety Research, Department of Engineering Physics, Tsinghua University, Beijing 100084, China
Abstract:Student-teacher relationships in a university were analyzed using contact data from surveillance videos to calculate distributions, clustering coefficients, k-cores and community structures. The results show that the contact networks have some characteristics of ER random networks and WS small world networks, but with many more k-cores and communities. The relationships between the teachers and students play an important role in the network structure. The results provide empirical data for building contact network models in workplaces and for the study of information and epidemic spreading in workplaces.
Key words: contact networksdegree distributiongroup structures
复杂网络理论在过去的几十年里一直是****研究的重要领域,并取得了丰硕成果。Erd?s等[1]首先提出了随机图理论,此后不断有****对复杂网络理论模型及其拓扑结构进行探索,包括科学家合作网络[2-3]、演员合作网络[4]、神经网络[5]、新陈代谢网络[6]以及万维网[7]等,并陆续发现了一些重要性质。1998年Watts和Strogatz[8]在“六度分离”[9]的基础上提出了WS“小世界”网络模型;1999年Barabasi和Albert[10]发现现实世界中许多网络的节点度分布服从无标度的幂律分布特性,并构造出BA(Barabasi-Albert)无标度网络模型。这2个发现极大地推动了复杂网络领域的发展,开启了复杂网络研究的新纪元。
目前对于社会网络拓扑结构及其传播特性的研究成为热点。Seidman[11]提出了k-核心网络的概念,根据节点在网络中所处的深度(边缘或核心),对网络进行分层;Newman[12]发现了社会网络中的社团结构。复杂网络的拓扑结构对其传播特性及自身鲁棒性具有重要影响。Pastor-Satorras等[13]利用平均场理论发现小世界网络与规则网络和随机网络上的传播行为类似,传染率必须大于某个临界值才能使传播持续存在;之后Claudio等[14]通过研究SIS (susceptible-infectious-susceptible)及SIR (susceptible-infectious-removed)模型在无标度网络中的传播,证明了对于规模无穷大的无标度网络,这个传播的临界值接近于0;Granoveter和Watts等[15-16]得出了相对于缺少长程连接的规则网络,随机网络和小世界网络中信息和传染病传播速率更快的结论;Albert等[17]则发现异质性网络,如无标度网络,对于随机扰动的鲁棒性远远高于同质性网络,如ER随机网络和WS小世界网络,而对于蓄意攻击的鲁棒性却低于同质性网络。
从上面可以看出相关研究大多是从已知模型(如WS小世界网络、BA无标度网络)出发,通过计算机生成所需网络模型,进而发掘其对网络传播特性的影响。然而,现实中的社会网络拓扑结构比以上的理想网络模型复杂得多,且对于不同群体而言其网络结构特征也多种多样,而现有网络模型只能够刻画其某一或某几个方面的特性,不够全面和准确。基于此,已有****通过尝试对现实中特定群体间人员接触网络进行观察记录,构建了人员接触网络模型并分析了其拓扑结构和传播特性。Hueta-Quintaniua[18]通过射频识别装置来统计小学生之间接触的次数和接触时间,从而构建了小学生的接触网络,进而研究群体行为规律并分析了传染病和信息在这种网络中的传播过程;Stehlé等[19]通过对小学生之间敌友关系的调查,发现小学生友谊网络和敌意网络度分布分别产生了近似Poisson分布和Power low分布的特征,并分别构建了网络模型对其进行重现。人员接触网络是社会网络的一种重要形式,人员接触主要包括线上接触和线下接触,线上接触主要是指人员通过网络、电话等进行联系,线下接触主要是指面对面的人员接触,它是传染病及口头信息传播的重要途径,研究其拓扑结构有助于掌握它们在其中的传播规律。对成年人来说,工作场所是面对面接触发生最频繁的地方之一,而目前对工作场所人员接触网络拓扑结构的研究还未见相关文献报道,因此有必要对其进行探索。
本文以某高校研究所师生群体为研究对象,通过提取视频监控中的人员面对面接触的数据,构建了该研究所师生群体间的人员接触网络。在此基础上分析其拓扑结构,包括度分布及群组特征,并与传统网络模型ER随机网络和WS小世界网络进行对比,发现该网络拓扑结构与WS小世界网络模型在聚类系数和社团结构方面较为接近,但其具有明显更多的k-核心网络。该发现能够为探究一般工作场所人员接触网络拓扑结构提供实证研究基础,可以识别出特定工作场所中人员接触网络的关键节点,对研究信息及传染病在其中的传播具有重要意义。
1 人员接触数据收集1.1 数据收集本文的研究对象是某高校研究所的所有人员,主要包括研究生及其导师,以及一些工作人员,同时还有若干外来人员(访客),该研究所的布局如图1所示。从房间R3到R13均为研究生导师的办公室,其中办公室R8至R13里面都只有1名导师,其他的办公室导师个数为2~3个不等,R17和R18为研究生房间,R1和R2为工作人员办公室,R19和R20是2个会议室,以便学生和老师进行学术讨论。教师和学生在工作日基本都会出勤,工作日常常会有外来人员进入研究所进行访问交流。
图 1 研究所布局平面图 |
图选项 |
为了采集人员接触数据,安装了4个摄像头,布设情况如图1所示。
1.2 人员接触记录提取为了避免单个工作日人员接触的随机性,提取了3个连续工作日的视频数据进行分析。由于视频中出现的人员较多,为了方便记录,对其进行编号,内部人员编号的形式为房间号+英文字母大写,英文字母的先后顺序代表同一房间中的人员首次出现在视频中的先后次序,即最先出现者为A,依次为B、C等;外来人员(访客)用数字+X的形式表示,数字的大小表示其在视频中首次出现的先后次序。
视频中观察到的人员面对面接触类型大致分为两大类:1) 走廊接触。通过观察视频录像可以直接得到人员在走廊中的接触情况,而人员之间仅仅打个招呼或者擦肩而过不能视为有效接触(只要人员相遇基本都会发生),文中认为走廊中人员之间超过30 s的持续接触才算作有效接触。2) 房间接触。房间接触的情况比较复杂,由于房间R1和R2是行政办公室,主要管理研究所行政方面的事务,服务教师和学生是常开的,可以通过2、3号摄像头直接观察到人员接触情况。其余房间内的接触则根据以下原则对接触的双方进行判断:
1) 对于办公室中只有一名教师的情况,当教师在房间内时,进入其房间的人员都视为与该教师接触。
2) 对于办公室中不止一名教师的情况,其余教师或者学生进入时,推测同一课题或者项目组的教师之间发生了接触,或者进入房间的学生与其导师发生了接触。而当该办公室内的若干教师同时出现在该办公室时,认为他们之间均发生了接触。
3) 办公室R17和R18为学生工作室,当有老师进入时,认为该教师与其学生发生了接触;同时当学生一起外出吃饭时,认为其相互之间都存在接触。
4) 对于会议室R19和R20,认为只要同一时间在同一会议室开会的人,互相之间都存在接触。
在基于以上原则推测的基础上,又对该研究所的教师和学生们进行及时回访,以保证接触记录的真实性和准确性。
2 网络拓扑结构分析视频中共观测到了55名人员,包括46名研究所内部人员和9名访客,由于仅仅研究内部人员的接触关系,因此不考虑访客的影响。内部人员的接触网络拓扑结构如图2所示,其中节点代表人员,边代表人员之间存在的接触关系。节点直径的大小与其度的高低成正比,节点灰度的不同表示其在网络中处于不同的社团。
图 2 研究所人员接触网络拓扑结构示意 |
图选项 |
从图2可以看出,该人员接触网络(以下简称HC网络)节点度的大小差异比较显著,同时节点“抱团”的现象比较明显,团体内部人员的接触明显多于团体之间的接触,且存在若干内部节点完全互连的集团,构成了稳固紧密的结构。
2.1 度分布网络中与某节点连接的其他节点的数目称为该节点的度,平均度是指网络中所有节点度的平均值。该网络的度分布情况如图3所示,其平均度为5.13。为了便于将该人员接触网络和经典的网络模型进行对比,分别生成了与该网络节点数目和平均度相当的ER随机网络和WS小世界网络(其中WS小世界网络的随机重连概率p=0.1),统计了其度分布情况,在图3中分别用方形和三角形的散点表示。
图 3 三种网络度分布对比 |
图选项 |
可以看到,HC网络的度分布与ER随机网络更为接近,呈现Piosson分布特征,而WS小世界网络度分布的峰值更为陡峭,接近于规则网络;此外,HC网络中度值为2和7的节点数较多,明显偏离Poisson分布,这可能是由于所观察到的数据量较少而导致的度分布随机性较大。进一步比较三者的拓扑结构,ER随机网络和WS小世界网络的结构分别如图4和5所示。
图 4 ER随机网络拓扑结构示意 |
图选项 |
图 5 WS小世界网络拓扑结构示意 |
图选项 |
由图4和5可以看出,相对于HC网络来说,ER随机网络与WS小世界网络中节点度的差异明显较小,尤其是WS小世界网络。且ER随机网络中节点基本没有“抱团”现象,不存在小集团和明显互连的结构,而WS小世界网络中虽然存在小集团,但是也没有明显互连的稳固紧密结构。
2.2 网络群组结构表1是3种网络各自的群组结构特性参数的情况,包括网络的聚类系数、k-核心网络及其社团结构3个方面。其中,HC代表人员接触网络。ER随机网络和WS小世界网络群组特性参数是分别进行200次独立生成和计算得到的平均值。
表 1 三种网络群组特性统计
网络群组 | CCV | k-核心网络 | 模块度 |
HC | 0.543 | isolated(4.35%),0(2.17%),1(21.44%),2(0)3(41.31%),4(13.04%),5(0),6(17.39%) | 0.573 |
ER | 0.128 | 0(6.52%),1(6.52%),2(10.87%),3(76.09%) | 0.341 |
WS | 0.499 | 3(2.17%),4(97.83%) | 0.517 |
表选项
聚类系数是反映网络中节点聚集程度的系数,节点聚类系数的计算公式如下[20]:
$C{C_v} = \frac{n}{{C_k^2}} = \frac{{2n}}{{k\left( {k - 1} \right)}}$ | (1) |
网络的k-核是反映网络层次性的参数。k-核是指在原始网络中反复去掉度值小于或者等于k的节点后,所剩下的子图。若一个节点存在于k-核,而在(k+1)-核中被除去,那么此节点的核数为k,节点的核数代表了节点在网络中的深度[21]。HC网络共有6个k-核,即6个层次;图6直观地展示了该网络的k-核分解结果[22]。其中核数最高的节点:6B,17B,17D,17H,18C,18D,18G和18I,仅占整体网络节点数目的17.39%,这些节点的k=6,它们是完全互连的,是网络结构的核心,处于最“深”的位置。从结构上来说这些节点最不容易被移去,是网络整体鲁棒性的体现。而ER随机网络虽有4层k-核,但k值均较小,k值最大为3的节点占了绝大部分,随机连接的特性造成其层次性不明显,且不存在结构上的核心节点;对于WS小世界网络,则只有2层k-核,且只有一个节点的k值为3,其他节点的k值均为4,节点连接性差别不大,也不存在核心节点。HC网络的层次明显多于另外2种网络,且核心节点核数较高,从结构上来说该网络具有更大的稳定性和对随机扰动的鲁棒性[23]。
图 6 人员接触网络的k-核分解示意 |
图选项 |
模块度是衡量社团结构强度的参数,由Newman[12]首先提出,该参数的意义是社团内部边的数量与社团之间边的数量的比值,其计算公式如下
$Q = \frac{1}{{2m}}\sum\limits_{i,j} {\left[ {{A_{ij}} - \frac{{{k_i}{k_j}}}{{2m}}} \right]} d\left( {{c_i},{c_j}} \right)$ | (2) |
3 讨论由以上分析可知,该人员接触网络的聚类系数略大于WS小世界网络而远大于ER随机网络,人员接触表现出局部聚集的特性,接触重合度较高;同时该网络的k-核数目最多,且存在k值显著高的节点,即核心节点,而ER随机网络的k-核数目偏少且k值偏低,WS小世界网络则仅有2层k-核,后两者均不存在核心节点。接触网络的模块化度量值也略大于小世界网络而远大于随机网络,说明其社团结构特征显著。
通过观察发现,该人员接触网络的核心节点基本都为学生,他们之间均存在互相接触的关系,关系稳定,不易被破坏,属于在研究所中较为积极的个体;而该网络中的社团结构代表了教师及在其指导下的学生们以及研究所中参与统一课题或项目的教师组成的小集体。研究所中师生之间的特定关系,决定了接触网络的拓扑结构。
4 结论本文通过视频监控的方法,提取了某高校研究所连续3天的人员接触数据,构建了相关的人员接触网络,进而对该网络的节点度、聚类系数、层次结构、社团结构进行了分析,并将该网络的特性与传统的ER随机网络和WS小世界网络进行对比研究。该研究所人员接触网络所表现出的特征兼有ER随机网络和WS小世界网络的部分特征,同时又呈现出丰富的层次结构和模块化特性,这些特征使得该网络明显区别于现有的ER随机网络和WS小世界网络,是一种新的网络形式。本文的工作对于研究人员接触网络本身的拓扑结构,识别其中关键节点和边,以及构建传染病、信息等在其中传播的动力学模型具有重要意义。
由于高校研究所人员结构的特殊性,师生关系是网络结构的主要影响因素,因此下一步需要研究其他类型工作场所的人员接触网络,探索工作场所人员接触网络的不同结构特征进行综合分析;同时,还需要进一步考虑访客的因素,即工作场所群体和群体之间人员的流动,明确其对网络拓扑结构的影响,从而构造更精确更具普适性的工作场所人员接触网络模型。
参考文献
[1] | Journal of Central South University(Science and Technology), 41(2):649-654.-->Erdös P, Rényi A. On the evolution of random graphs[J].Publication of the Mathematical Institute of the Hungarian Academy of Sciences,1960, 38(1): 17–61. |
[2] | Journal of Central South University(Science and Technology), 41(2):649-654.-->Barabasi A L, Jeong H, Néda Z, et al. Evolution of the social network of scientific collaborations[J].Physica A Statistical Mechanics & Its Applications,1977, 6(2): 66–70. |
[3] | Journal of Central South University(Science and Technology), 41(2):649-654.-->Newman M E. The structure of scientific collaboration networks[J].Working Papers,2000, 98(2): 404–409. |
[4] | Journal of Central South University(Science and Technology), 41(2):649-654.-->Fass C, Ginelli M, Turtle B. Six Degree of Kevin Bacon[M]. New York:Plume Books, 1996. |
[5] | Journal of Central South University(Science and Technology), 41(2):649-654.-->Achacoso T B, Yamamoto W S. AY's Neuroanatomy of C. Elegans for Computation[M]. Boca Raton, Florida:CRC Press, 1991. |
[6] | Journal of Central South University(Science and Technology), 41(2):649-654.-->Jeong H, Tombor B, Albert R, et al. The large-scale organization of metabolic networks[J].Nature,2000, 407(6804): 651–654. |
[7] | Journal of Central South University(Science and Technology), 41(2):649-654.-->Barabási A L, Albert R, Jeong H. Scale-free characteristic of random networks:The topology of the world-wide web[J].Physica A Statistical Mechanics & Its Applications,2000, 281(s1-4): 9–77. |
[8] | Journal of Central South University(Science and Technology), 41(2):649-654.-->Watts D J, Strogatz S H. Collective dynamics of "small-world" networks[J].Nature,1998, 393(6684): 440–442. |
[9] | Journal of Central South University(Science and Technology), 41(2):649-654.-->Guare J. Six Degrees of Separation:A Play[M]. New York, USA: Vintage, 1990. |
[10] | Journal of Central South University(Science and Technology), 41(2):649-654.-->Barabasi A L, Albert R. Emergence of scaling in random networks[J].Science,1999, 286(5439): 509–512. |
[11] | Journal of Central South University(Science and Technology), 41(2):649-654.-->Seidman S B. Network structure and minimum degree[J].Social Networks,1983, 5(3): 269–287. |
[12] | Journal of Central South University(Science and Technology), 41(2):649-654.--> Newman M E J. Modularity and community structure in networks[C]//2006 APS March Meeting. Baltimore, USA:American Physical Society, 2006:8577-8582. |
[13] | Journal of Central South University(Science and Technology), 41(2):649-654.-->Pastor-Satorras R, Vespignani A. Epidemic spreading in scale-free networks[J].Physical Review Letters,2000, 86(14): 3200–3203. |
[14] | Journal of Central South University(Science and Technology), 41(2):649-654.-->Claudio C, Romualdo P S. Thresholds for epidemic spreading in networks[J].Physical Review Letters,2010, 105(21): 3305–3305. |
[15] | Journal of Central South University(Science and Technology), 41(2):649-654.-->Granovetter M S. The strength of weak ties[J].Social Science Electronic Publishing,1973, 13(2): 1360–1380. |
[16] | Journal of Central South University(Science and Technology), 41(2):649-654.-->Watts D J, Bak P. Small worlds:The dynamics of networks between order and randomness[J].Sigmod Record,1999, 31(2): 74–75. |
[17] | Journal of Central South University(Science and Technology), 41(2):649-654.-->Albert R, Jeong H, Barabási A L. Error and attack tolerance of complex networks[J].Nature,2000, 406(6754): 378–382. |
[18] | Journal of Central South University(Science and Technology), 41(2):649-654.-->Hueta-Quintanilla R. Modelong social network topologies in elementary schools[J].Plos One,2013, 8(2):e55371. |
[19] | Journal of Central South University(Science and Technology), 41(2):649-654.-->Stehlé J, Voirin N, Barrat A, et al. High-resolution measurements of face-to-face contact patterns in a primary school[J].Plos One,2011, 6(8): 23176–231789. |
[20] | Journal of Central South University(Science and Technology), 41(2):649-654.-->Bollobás B, Riordan O M. Mathematical Results on Scale-free Random Graphs[M]. Weinheim:Wiley-VCH Verlag GmbH & Co. KGaA, 2003:1-37. |
[21] | Journal of Central South University(Science and Technology), 41(2):649-654.-->Mahadevan P, Krioukov D, Fomenkov M, et al. Lessons from three views of the internet topology[J].Bone & Joint Journal,2013, 95: 1450–1452. |
[22] | Journal of Central South University(Science and Technology), 41(2):649-654.-->Bae J, Kim S. Identifying and ranking influential spreaders in complex networks by neighborhood coreness[J].Physica A Statistical Mechanics and Its Applications,2014, 395: 549–559. |
[23] | Journal of Central South University(Science and Technology), 41(2):649-654.-->Adiga A, Vullikanti A K S. How Robust is the Core of a Network?[M]. Berlin Heidelberg:Springer, 2013:541-556. |