删除或更新信息,请邮件至freekaoyan#163.com(#换成@)

基于客流规律的地铁车站客流风险分析

本站小编 Free考研考试/2020-04-15

李子浩1, 田向亮1, 黎忠文2, 周炜2, 周志杰2, 钟茂华1
1. 清华大学 工程物理系, 公共安全研究院, 北京 100084;
2. 深圳市地铁集团有限公司, 深圳 518026

收稿日期:2019-04-18
基金项目:国家重点研发计划(2018YFC0809900);国家****科学基金项目(51425404);博士后创新人才支持计划(BX20180158)
作者简介:李子浩(1997-), 男, 硕士研究生
通信作者:钟茂华, 研究员, E-mail:mhzhong@tsinghua.edu.cn

摘要:地铁车站类型识别和客流风险识别对地铁安全运营管理有着重要的作用。基于深圳地铁AFC(automatic fare collection)系统数据,采用无关值和异常值清理、聚合、均值滤波、标准化、主成分分析等数据清洗步骤,提取不同时段客流比例、不同天数客流比例和换乘客流比例等特征。运用Gauss混合模型(GMM)对工作日和周末客流进行聚类,分析客流出行规律,辨识车站类型及其对应的客流风险时段,提出车站客流风险分析方法,通过大数据分析对车站类型和客流风险进行识别。分析结果对掌握车站大客流风险情况,避免大客流冲击造成的拥挤踩踏等群体性事件的发生,保障乘客安全具有指导意义。
关键词:地铁大数据聚类出行规律风险分析
Risk analysis of metro station passenger flow based on passenger flow patterns
LI Zihao1, TIAN Xiangliang1, LI Zhongwen2, ZHOU Wei2, ZHOU Zhijie2, ZHONG Maohua1
1.Institute of Public Safety Research, Department of Engineering Physics, Tsinghua University, Beijing 100084, China;
2.Shenzhen Metro Co., Ltd, Shenzhen 518026, China


Abstract: The safe operation and management of metro systems are related to the metro station design and the passenger flow rates into and out of stations and between stations. This study examines the passenger flow rates in and out of each station at various times on various days by filtering and standardizing the automatic fare collection (AFC) system data of the Shenzhen metro system. The data was analyzed using a principle component analysis (PCA) and a Gaussian mixture model (GMM) to cluster passenger movement data on weekdays and weekends to simplify analysis of the passenger flow patterns. The results were then used to identify time periods and types of metro stations having greater risks as a passenger flow risk analysis method for metro stations. This big data analysis can identify risk conditions for large passenger volumes to avoid mass incidents like stampedes so as to protect passenger safety.
Key words: metro stationsbig dataclusteringtravel patternsrisk analyses
随着城市轨道交通网络化发展,客流量与日俱增。北京、上海、广州和深圳等城市的线网运营客流千万已成为常态[1],地铁交通承担着巨大的客流压力。特别是异常情景下,车站大客流现象可能会造成严重的踩踏事故等,威胁地铁运营安全。因此基于乘客出行规律研究地铁车站分类和客流风险识别,对地铁安全运营有着重要的意义。
近年来,交通大数据分析一直是研究重点,交通数据主要包括交通智能卡记录、手机信令记录等。这些数据可以形成公民移动行为记录,用于分析城市活动的强度和时间分布[2]并研究城市地区的人口流动模式[3]。同时随着城市的发展,城市土地利用和空间结构正在迅速变化,城市正从原本单中心模型向中心模型发展[4],地铁站点周边的土地利用类别对居民地铁出行需求有着重要的影响[5]
传统的城市空间结构主要基于遥感数据[6]和问卷调查数据[7],但此类数据无法及时更新且无法满足研究者需求。因此现在利用智能交通卡数据来分析人类活动和城市空间结构变得普遍,利用地铁客流数据分析车站周围土地利用性质的研究已经有了一定成果。国外,Choi等[8]利用站点尺度的客流量为站点类型划分的依据,分析韩国地铁站的周围建成环境;Reades等[9]利用伦敦的交通卡数据对伦敦的多中心城市结构和复杂层次的地铁客流量进行了分析。国内,金磊等[10]以地铁车站的交通重要性及车站所处的城市区位来划分地铁车站类型的;尹芹等[11]选择进出站峰值、偏度、客流时段不均匀系数、高峰小时系数和极大值等10个特征对北京地铁站点进行类型识别;高勃等[12]从系统网络的角度,根据物理拓扑属性度、介数和客运量,利用K-means算法将北京地铁聚为10种类型;冷彪等[13]从地铁客流数据中提取出乘客出行模式和地铁车站客流模型,建立概率图模型,并基于隐Dirichlet分配模型实现区域出行特征聚类;余丽洁等[14]依据车站的客流、站点、公交接驳、土地利用和站点服务特征, 使用谱聚类将北京地铁分为5种类别。
已有研究利用智能交通卡数据对地铁车站类型的分类和乘客出行规律进行分析,但也有一些不足,如:建立模型没有考虑工作日和周末的客流差异,导致工作日中较大的通勤客流淹没非通勤客流的特征;聚类类别的选择较为定性等。因此本文引入主成分分析法和Gauss混合聚类模型,分别建立工作日和周末的聚类模型,并根据肘部法则选择地铁车站类型的最佳簇类。通过对乘客出行规律、车站特征及客流风险的分析识别,以期为地铁运营精细化管理提供技术支撑。
1 客流特征选取与数据处理1.1 数据处理与清洗选取2017年10月16日至2017年10月22日这1周深圳市地铁集团有限公司运营的地铁线网的进出站客流数据和换乘数据作为研究对象,此周不受节假日、天气和故障等干扰影响且客流变化符合全年的波动变化情况。
利用SQL Server查询处理语句清理非运营时间内客流数据,再将每个站点的进出站数据按每1h和站点聚合,并按时间排序。由于数据的波动性、噪声较大,因此对客流数据进行均值滤波处理,排除突发事件造成的影响。
在此基础上,为消除不同车站客流差异较大的影响,对客流数据进行Z-score标准化,解决数据可比性的问题[15]。Z-score标准化方法基于原始数据的均值和标准差进行处理,使得标准化后的数据均值为0,标准差为1。
1.2 特征选取综合考虑各小时客流、早晚高峰客流特征、工作日与周末客流差异、换乘客流等因素,假设车站i在一周内第j天的第k小时内的进站客流为Ei, j, k,出站客流为Oi, j, k,换乘客流为Ti, j, k,提取以下特征:
$\begin{array}{*{20}{c}}{F_{i,j}^{{\rm{in}}} = \frac{{\sum\limits_{K = 6}^{23} {{E_{i,j,K}}} }}{{\sum\limits_{J = 1}^7 {\sum\limits_{K = 6}^{23} {{E_{i,J,K}}} } }},}\\{i = 1,2, \cdots ,165,j = 1,2, \cdots ,7;}\end{array}$
$\begin{array}{*{20}{c}}{F_{i,j}^{{\rm{out}}} = \frac{{\sum\limits_{K = 6}^{23} {{O_{i,j,K}}} }}{{\sum\limits_{J = 1}^7 {\sum\limits_{K = 6}^{23} {{O_{i,J,K}}} } }},}\\{i = 1,2, \cdots ,165,j = 1,2, \cdots ,7.}\end{array}$
Fi, jinFouti, j分别表示车站i一周第j天进出站客流占该站一周进出站客流总量比例,代表每个车站一周内不同日期对地铁进出站客流变化的影响。
$\begin{array}{*{20}{c}}{F_{i,j,k}^{{\rm{in}}} = \frac{{{E_{i,j,k}}}}{{\sum\limits_{K = 6}^{23} {{E_{i,j,K}}} }},}\\{i = 1,2, \cdots ,165,j = 1,2, \cdots ,7,k = 6,7, \cdots ,23;}\end{array}$
$\begin{array}{*{20}{c}}{F_{i,j,k}^{{\rm{out}}} = \frac{{{O_{i,j,k}}}}{{\sum\limits_{K = 6}^{23} {{O_{i,j,K}}} }},}\\{i = 1,2, \cdots ,165,j = 1,2, \cdots ,7,k = 6,7, \cdots ,23.}\end{array}$
Fi, j, kinFi, j, kout分别表示的是车站i一周第j天第k小时进出站客流占该站该天进出站客流总量的比例,代表每个车站不同日期不同时段对地铁进出站客流的影响。
$\begin{array}{*{20}{c}}{\sum\limits_{K,i,j}^{{\rm{in}}} = \frac{{\sum\limits_{K = 6}^{23} {{E_{i,j,K}}} }}{{\sum\limits_{I = 1}^{165} {\sum\limits_{K = 6}^{23} {{E_{I,j,K}}} } }},}\\{i = 1,2, \cdots ,165,j = 1,2, \cdots ,7;}\end{array}$
$\begin{array}{*{20}{c}}{F_{s,i,j}^{{\rm{out }}} = \frac{{\sum\limits_{K = 6}^{23} {{O_{i,j,K}}} }}{{\sum\limits_{I = 1}^{165} {\sum\limits_{K = 6}^{23} {{O_{I,j,K}}} } }},}\\{i = 1,2, \cdots ,165,j = 1,2, \cdots ,7.}\end{array}$
Fs, i, jinFs, i, jout分别表示车站i一周第j天进出站客流占全网线所有车站该天进出站客流总量的比例,代表每个车站在全线网的客流占比情况,反映了车站的重要度。
$F_{{\rm{dift}},i}^{{\rm{in}}} = \frac{{2 \times \sum\limits_{j = 1}^5 {\sum\limits_{K = 6}^{23} {{E_{i,J,K}}} } }}{{5 \times \sum\limits_{J = 6}^7 {\sum\limits_{K = 6}^{23} {{E_{i,J,K}}} } }},\;\;\;\;i = 1,2, \cdots ,165;$
$F_{{\rm{diff,}}i}^{{\rm{out }}} = \frac{{2 \times \sum\limits_{J = 1}^5 {\sum\limits_{K = 6}^{23} {{O_{i,J,K}}} } }}{{5 \times \sum\limits_{J = 6}^7 {\sum\limits_{K = 6}^{23} {{O_{i,J,K}}} } }},\;\;\;\;i = 1,2, \cdots ,165.$
Fdiff, iinFdiff, iout分别表示车站i工作日进出站平均客流与周末进出站平均客流的比值,代表工作日和周末的客流差异。
$\begin{array}{*{20}{c}}{F_{{\rm{trans}},i,j}^{{\rm{in}}} = \frac{{\sum\limits_{K = 6}^{23} {{T_{i,j,K}}} }}{{\sum\limits_{K = 6}^{23} {{E_{i,j,K}}} }},}\\{i = 1,2, \cdots ,165,j = 1,2, \cdots ,7.}\end{array}$
$\begin{array}{*{20}{c}}{F_{{\rm{trans}},i,j}^{{\rm{out }}} = \frac{{\sum\limits_{K = 6}^{23} {{T_{i,j,K}}} }}{{\sum\limits_{K = 6}^{23} {{O_{i,j,K}}} }},}\\{i = 1,2, \cdots ,165,j = 1,2, \cdots ,7.}\end{array}$
Ftrans, i, jinFtrans, i, jout分别表示车站i一周第j天的换乘客流与该站进出站客流的比值,代表换乘客流对该站总客流的重要程度,非换乘车站该特征为0。
其他特征分别表示Ei, j, kOi, j, kTi, j, k的平均值、标准差、25分位数、中位数、75分位数和最大值,代表客流的波动情况。最终共提取特征428个,将特征按工作日和周末区分后,分别进行聚类分析。
1.3 特征降维由于提取特征量大于样本数,需要对特征降维以提高聚类的效果,本文采用主成分分析法,将可能存在相关性的特征进行正交变化,使特征转换为线性不相关,且最大限度地保留原有特征量的信息。主成分分析法的步骤如图 1所示。
图 1 主成分分析法算法流程
图选项





最终,本文以特征向量信息贡献度累计和大于或等于95%来设定重构阈值参数,确定了工作日和周末特征分别选取前10和前15个特征向量作为聚类模型的特征参数。
2 聚类模型概况2.1 Gauss混合模型使用Gauss分布作为参数模型,并用期望最大算法求解[16]。将地铁轨道交通车站分为H类,假设每个车站的进出站客流特征均由一个Gauss分布生成,但是车站客流特征属于哪个Gauss分布未知,因此本文假设车站客流特征由Gauss混合模型生成的概率密度为
$P(\mathit{\boldsymbol{x}}) = \sum\limits_{h = 1}^H p (h)p(\mathit{\boldsymbol{x}}|h) = \sum\limits_{h = 1}^H {{\pi _h}} \eta \left( {\mathit{\boldsymbol{x}}|{\mathit{\boldsymbol{\mu }}_h},{\mathit{\boldsymbol{ \boldsymbol{\varSigma} }}_h}} \right).$
其中:x是维度为m的向量;H为单Gauss模型的数量;πh为第h个单Gauss分布被选中的概率;μhΣh分别为第h个单Gauss分布的均值向量和协方差矩阵;η(x|μh, Σh)为第h个单Gauss分布的概率密度函数,可表示为
$\eta \left( {\mathit{\boldsymbol{x}}|{\mathit{\boldsymbol{\mu }}_h},{\mathit{\boldsymbol{ \boldsymbol{\varSigma} }}_h}} \right) = \frac{1}{{\sqrt {2\pi _h^m\left| {{\mathit{\boldsymbol{ \boldsymbol{\varSigma} }}_h}} \right|} }}{{\rm{e}}^{ - \frac{1}{2}{{\left( {\mathit{\boldsymbol{x}} - {\mathit{\boldsymbol{\mu }}_h}} \right)}^{\rm{T}}}\mathit{\boldsymbol{ \boldsymbol{\varSigma} }}_h^{ - 1}\left( {x - {\mathit{\boldsymbol{\mu }}_h}} \right)}}.$
利用Gauss混合模型进行聚类的一般步骤如下:
步骤1 估计数据由每个单Gauss分布生成的概率,对于每个数据集来说,它由第h个单Gauss分布生成的概率为
$\gamma (i,h) = \frac{{{\pi _h}\eta \left( {{\mathit{\boldsymbol{x}}_i}|{\mathit{\boldsymbol{\mu }}_h},{\mathit{\boldsymbol{ \boldsymbol{\varSigma} }}_h}} \right)}}{{\sum\limits_{j = 1}^H {{\pi _j}} \eta \left( {{\mathit{\boldsymbol{x}}_i}|{\mathit{\boldsymbol{\mu }}_j},{\mathit{\boldsymbol{ \boldsymbol{\varSigma} }}_j}} \right)}}.$
步骤2 极大似然估计求出每个单Gauss分布的参数:
${\mathit{\boldsymbol{\mu }}_h} = \frac{{\sum\limits_{i = 1}^m \gamma (i,h){\mathit{\boldsymbol{x}}_i}}}{{\sum\limits_{i = 1}^m \gamma (i,h)}},$
${\mathit{\boldsymbol{ \boldsymbol{\varSigma} }}_h} = \frac{{\sum\limits_{i = 1}^m \gamma (i,h)\left( {{\mathit{\boldsymbol{x}}_i} - {\mathit{\boldsymbol{\mu }}_h}} \right){{\left( {{\mathit{\boldsymbol{x}}_i} - {\mathit{\boldsymbol{\mu }}_h}} \right)}^{\rm{T}}}}}{{\sum\limits_{i = 1}^m \gamma (i,h)}}.$
其中:${\mathit{\pi }_h} = \frac{1}{m}\sum\limits_{i = 1}^m {\mathit{\gamma }{\rm{(}}i, h)} $
似然函数的值收敛则停止,不收敛则转步骤 1。
Gauss混合模型是对样本的概率密度分布进行估计,对样本分别在H个Gauss模型上投影,得到在各类的概率,选取概率最大的类作为结果,这样软分类的模型比硬分类更加客观,因此选取该模型。
2.2 确定聚类簇样本点与簇内样本点的平方距离误差和称为畸变程度,对于每个簇,它的畸变程度越低,代表簇内越紧密;反之则代表簇内越松散。本文利用畸变程度的“肘部法则”选择最佳簇个数,结合实际情况选择簇类数量,对工作日车站簇类选择为3类,对周末车站簇类选择为5类。
2.3 模型评估本文采用轮廓系数[16]来评价“类”的密集和分散程度,公式表达如下:
$s = \frac{{b - a}}{{\max (a,b)}}.$
其中:a代表同簇样本彼此间距离的均值;b代表样本到除自身所在的簇外,最近簇的样本距离均值。s取值在[-1, 1],如果s接近于1,代表样本所在簇合理,反之则代表s应分到其他的簇。
工作日客流特征聚类和周末客流特征聚类的轮廓系数分别为0.269和0.192,聚类模型效果较好。
3 地铁站点聚类分析3.1 工作日聚类结果本文利采用客流占比来衡量客流变化和车站运营情况,当客流占比大于运营时间的倒数时,表明客流相对集中。深圳地铁运营时间约为18 h,所以本文取0.056。计算公式如下:
${P_k} = \frac{{{Q_k}}}{{\sum\limits_{K = 6}^{23} {{Q_K}} }},\;\;\;\;\;k = 6,7, \cdots ,23.$
其中:Pk为小时客流占比,当k为高峰时,Pk=PmaxQk为全日第k小时的客运量(人次)。
由于工作日客流具有规律性,因此将工作日内每个车站每日客流取均值后绘制折线图。第一类车站进站客流小时曲线具有明显进站早高峰,见图 2。早高峰的峰值在8:00左右,在18:00至19:00期间出现进站客流增加的现象,进站早晚高峰的小时客流占比分别约为0.247和0.07。出站客流小时曲线呈现为双峰形且晚高峰峰值较高,出站早晚高峰的客流占比分别约为0.09和0.149。
图 2 (网络版彩图)工作日类型1的进出站客流折线图
图选项





类型2车站进出站客流小时曲线为单峰型见图 3,进站晚高峰和出站早高峰突出,其进站晚高峰峰值时间受车站周围公司性质的影响,比如,以互联网为主的高新园和深大站,其进站客流高峰时间会比以金融为主的会展中心站晚。此类车站的进站晚高峰的小时客流占比约为0.157,出站早高峰小时客流占比约为0.231,出站早高峰客流集中且客流量大。
图 3 (网络版彩图)工作日类型2的进出站客流折线图
图选项





类型3车站的进出站客流小时曲线均为双峰型,见图 4,进站早晚高峰峰值接近,其小时客流占比分别约为0.110和0.133,出站早高峰比出站晚高峰的峰值高,小时客流占比分别为0.218和0.09。
图 4 (网络版彩图)工作日类型3的进出站客流折线图
图选项





根据工作日出行规律可判断车站类型,结果见表 1。通过工作日客流特征发现,工作日早高峰相对集中,在8:00左右。晚高峰较分散,主要在18:00至19:00之间。
表 1 工作日车站类型
聚类类型 车站类型
类型1 职住交错偏居住
类型2 办公区域
类型3 职住交错偏办公


表选项






3.2 周末聚类结果类型1和类型5客流出行规律相似,因此归为一类。此类车站的客流小时曲线如图 5所示,周六存在进站早高峰和出站晚高峰,其小时客流占比分别为0.107和0.115,平峰时客流量大于工作日同时段客流量。周日进站客流不存在明显的峰值,8:00的客流占比为0.07,进站客流在8:00至18:00保持稳定,客流呈现“梯形”状。周六日的出站客流变化趋势和客流量基本一致,但周日的进站早高峰峰值降低。
图 5 (网络版彩图)周末类型1和类型5的进出站客流折线图
图选项





类型2和类型3客流出行规律相似,因此归为一类。此类车站的客流小时曲线如图 6所示,可知此类车站周六和周日的客流趋势变化相似,且存在明显的进站晚高峰时段,集中在18:00至21:00。周六和周日进站晚高峰的小时客流占比分别为0.09和0.08。出站客流呈“梯形”状,其客流值较高时段为8:00至18:00,持续时间长。
图 6 (网络版彩图)周末类型2和类型3的进出站客流折线图
图选项





类型4的进出站客流小时折线图如图 7所示,周六具有明显的进站晚高峰和出站早高峰,周六和周日的客流变化基本一致,但周日客流峰值降低且变化趋势减缓,周六和周日的进站晚高峰都集中在18:00左右,且小时客流占比分别为0.124和0.109,出站早高峰的到达时间集中在8:00,小时客流占比分别为0.124和0.082。
图 7 (网络版彩图)周末类型4的进出站客流折线图
图选项





根据出行规律,可得周末车站类型,见表 2。可知,周末仍存在早晚高峰现象,但小时客流占比较工作日降低。周六客流量比周日客流量多且波动大。周日居住区的进站客流和周六日商业中心和交通枢纽的出站客流存在“梯形客流”。居住区与商业中心和交通枢纽类型车站的进出站客流相对应,说明客流主要集中在这2类区域之间。
表 2 周末车站类型
聚类类型 车站类型
类型1 居住区域(客流量较大)
类型2 商业中心与交通枢纽
(客流量较大)
类型3 商业中心与交通枢纽
(客流量较小)
类型4 办公区域
类型5 居住区域(客流量较小)


表选项






3.3 客流风险识别根据客流出行规律可知,车站存在客流陡增现象,将客流陡增时段视为客流风险时段。在进站客流风险时段中,需要在车站入口处控制客流进入车站,在出站客流风险时段中,需要在站台层楼扶梯口处加强客流疏导。工作日和周末的客流风险时段分布分别见表 3表 4
表 3 工作日不同类型车站的客流风险时段
车站类型 客流风险时段
职住交错偏居住 8:00—9:00进站客流
18:00—19:00出站客流
办公区域 18:00—19:00进站客流
8:00—9:00出站客流
职住交错偏办公 8:00—9:00出站客流


表选项






表 4 周末不同类型车站的客流风险时段
车站类型 客流风险时段
居住区域 周六8:00—9:00进站客流
周六和周日17:00—21:00出站客流
商业中心和交通枢纽 周六和周日16:00—18:00进站客流
周六和周日8:00—18:00出站客流
办公区域 周六17:00—19:00进站客流
周六8:00—9:00出站客流


表选项






4 结论本文利用深圳地铁2017年某一周的进出站客流数据和换乘数据进行无关值与异常值清理、聚合、滤波、归一化后,提出新的特征提取方法,共得到428个客流特征并将客流特征分为工作日和周末两个时段。采用主成分分析法对客流特征降维,提取信息贡献度累计和大于等于95%的主成分作为聚类模型的特征。利用Gauss混合模型对工作日和周末客流特征分别建立聚类模型,分析客流出行规律,能更准确地识别不同类型车站及其客流风险时段。对制定精细化车站应急运营管理方案,提高地铁运营管理水平有指导意义,主要结论如下:
1) 地铁车站在工作日时被分为职住交错偏居住型、办公区域、职住交错偏办公型3类;在周末时被分为居住区域、商业中心和交通枢纽型、办公区域3类。
2) 工作日每日的客流差异较小,客流风险时段主要集中在早晚高峰。
3) 周末客流风险时段存在周六日的差异,周日客流风险低于周六。与工作日相比,周末小时客流占比降低但存在梯形客流,客流风险时段持续时间较长。

参考文献
[1] 顾保南, 杨照, 徐雷, 等. 1997-2017年中国城市轨道交通发展统计分析[J]. 城市轨道交通研究, 2018, 21(5): 85-89.
GU B N, YANG Z, XU L, et al. Statistical analysis of urban rail transit lines in China from 1997 to 2017[J]. Urban Mass Transit, 2018, 21(5): 85-89. (in Chinese)
[2] RATTI C, PULSELLI R M, WILLIAMS S, et al. Mobile landscapes:Using location data from cell phones for urban analysis[J]. Environment & Planning B-Planning & Design, 2006, 33(5): 727-748.
[3] GONZALEZ M C, HIDALGO C A, BARABASI A L. Understanding individual human mobility patterns[J]. Nature, 2008, 453: 779-782. DOI:10.1038/nature06958
[4] ANAS A, ARNOTT R, SMALL K A. Urban Spatial Structure[J]. Journal of Economic Literature, 1998, 36(3): 1426-1464.
[5] 曹瑞, 涂伟, 巢佰崇, 等. 基于智能卡数据的地铁周边职住用地识别与分析[J]. 测绘地理信息, 2016, 41(3): 74-78.
CAO R, TU W, CHAO B C, et al. Identification and analysis of home and work regions in the vicinity of metro stations using smart card data[J]. Journal of Geomatics, 2016, 41(3): 74-78. (in Chinese)
[6] XIAO J Y, SHEN Y J, GE J F, et al. Evaluating urban expansion and land use change in Shijiazhuang, China, by using GIS and remote sensing[J]. Landscape & Urban Planning, 2006, 75(1): 69-80.
[7] ZHOU S H, DENG L F, HUANG M Y. Spatial analysis of commuting mode choice in Guangzhou, China[J]. Chinese Geographical Science, 2013, 23(3): 353-364. DOI:10.1007/s11769-012-0569-2
[8] CHOI J, LEE Y J, KIM T, et al. An analysis of metro ridership at the station-to-station level in Seoul[J]. Transportation, 2012, 39(3): 705-722. DOI:10.1007/s11116-011-9368-3
[9] READES J, ZHONG C, MANLEY E, et al. Finding pearls in London's oysters[J]. Built Environment, 2016, 42(3): 365-381. DOI:10.2148/benv.42.3.365
[10] 金磊, 彭建, 柳昆, 等. 城市地铁车站分类理论及方法研究[J]. 地下空间与工程学报, 2010, 6(S1): 1339-1342+1375.
JIN L, PENG J, LIU K, et al. Sorting theory and investigation of urban metro station[J]. Chinese Journal of Underground Space and Engineering, 2010, 6(S1): 1339-1342, 1375. (in Chinese)
[11] 尹芹, 孟斌, 张丽英. 基于客流特征的北京地铁站点类型识别[J]. 地理科学进展, 2016, 35(1): 126-134.
YIN Q, MENG B, ZHANG L Y. Classification of subway stations in Beijing based on passenger flow characteristics[J]. Progress in Geography, 2016, 35(1): 126-134. (in Chinese)
[12] 高勃, 秦勇, 肖雪梅, 等. 基于K-means的北京地铁路网重要度聚类分析[J]. 交通运输系统工程与信息, 2014, 14(3): 207-213.
GAO B, QIN Y, XIAO X M, et al. K-means clustering analysis of key nodes and edges in Beijing subway network[J]. Journal of Transportation Systems Engineering and Information Technology, 2014, 14(3): 207-213. DOI:10.3969/j.issn.1009-6744.2014.03.032 (in Chinese)
[13] 冷彪, 赵文远. 基于客流数据的区域出行特征聚类[J]. 计算机研究与发展, 2014, 51(12): 2653-2662.
LENG B, ZHAO W Y. Region ridership characteristic clustering using passenger flow data[J]. Journal of Computer Research and Development, 2014, 51(12): 2653-2662. DOI:10.7544/issn1000-1239.2014.20131124 (in Chinese)
[14] 余丽洁, 李岩, 陈宽民. 基于谱聚类的城市轨道站点分类方法[J]. 交通信息与安全, 2014, 32(1): 122-125, 129.
YU L J, LI Y, CHEN K M. Using spectral clustering for urban rail station classification[J]. Journal of Transport Information and Safety, 2014, 32(1): 122-125, 129. DOI:10.3963/j.issn.1674-4861.2014.01.025 (in Chinese)
[15] KUSAKABE T, ASAKURA Y. Behavioural data mining of transit smart card data:A data fusion approach[J]. Transportation Research Part C:Emerging Technologies, 2014, 46: 179-191. DOI:10.1016/j.trc.2014.05.012
[16] 周志华. 机器学习[M]. 北京: 清华大学出版社, 2016.
ZHOU Z H. Machine learning[M]. Beijing: Tsinghua University Press, 2016. (in Chinese)

相关话题/数据 客流

  • 领限时大额优惠券,享本站正版考研考试资料!
    大额优惠券
    优惠券领取后72小时内有效,10万种最新考研考试考证类电子打印资料任你选。涵盖全国500余所院校考研专业课、200多种职业资格考试、1100多种经典教材,产品类型包含电子书、题库、全套资料以及视频,无论您是考研复习、考证刷题,还是考前冲刺等,不同类型的产品可满足您学习上的不同需求。 ...
    本站小编 Free壹佰分学习网 2022-09-19
  • 基于数据分布的标签噪声过滤
    陈庆强1,王文剑2,姜高霞11.山西大学计算机与信息技术学院,太原030006;2.山西大学计算智能与中文信息处理教育部重点实验室,太原030006收稿日期:2018-09-10基金项目:国家自然科学基金资助项目(61673249);山西省回国留学人员科研基金资助项目(2016-004);赛尔网络下 ...
    本站小编 Free考研考试 2020-04-15
  • 基于中国人体CT数据的股骨和胫骨参数化模型的开发
    杜雯菁1,罗逍2,黄晗1,许述财1,张金换11.清华大学汽车安全与节能国家重点实验室,北京100084;2.一汽集团智能网联开发院,长春130011收稿日期:2018-07-15基金项目:国家自然科学基金资助项目(51305223)作者简介:杜雯菁(1990-),男,博士研究生通信作者:张金换,研究 ...
    本站小编 Free考研考试 2020-04-15
  • 异方差加噪下差分隐私流数据发布一致性优化算法
    孙岚,康健,吴英杰,张立群福州大学数学与计算机科学学院,福州350116收稿日期:2018-07-06基金项目:国家自然科学基金资助项目(61300026);福建省自然科学基金资助项目(2017J01754,2018J01797)作者简介:孙岚(1978-),女,讲师通信作者:吴英杰,教授,E-ma ...
    本站小编 Free考研考试 2020-04-15
  • 面向社区风险防范的大数据平台理论架构设计
    贾楠1,郭旦怀2,陈永强3,刘奕11.清华大学工程物理系,公共安全研究院,北京100084;2.中国科学院计算机网络信息中心,北京100019;3.北京大学工学院,力学与工程科学系,北京100871收稿日期:2018-06-11基金项目:国家重点研发计划项目(2017YFC0803300);国家自然 ...
    本站小编 Free考研考试 2020-04-15
  • 软件定义网络中低成本流量数据采集算法
    赵俊1,包丛笑2,李星11.清华大学电子工程系,北京100084;2.清华大学信息化技术中心,北京100084收稿日期:2018-05-11作者简介:赵俊(1989-),男,博士研究生通信作者:李星,教授,E-mail:xing@cernet.edu.cn摘要:因为网络测量在软件定义网络中扮演着非常 ...
    本站小编 Free考研考试 2020-04-15
  • 满足本地差分隐私的位置数据采集方案
    高志强,崔翛龙,杜波,周沙,袁琛,李爱武警工程大学乌鲁木齐校区,乌鲁木齐830049收稿日期:2018-10-15基金项目:国家自然科学基金项目(U1603261);新疆维吾尔自治区自然科学基金项目(2016D01A080)作者简介:高志强(1989-),男,博士研究生通信作者:崔翛龙,教授,E-m ...
    本站小编 Free考研考试 2020-04-15
  • 结构化数据清洗技术综述
    郝爽1,2,李国良2,冯建华2,王宁11.北京交通大学计算机与信息技术学院,北京100044;2.清华大学计算机科学与技术系,数据库组,北京100084收稿日期:2018-07-31基金项目:国家重点研发计划项目(2018YFC0809800);国家自然科学基金项目(61373024,6163201 ...
    本站小编 Free考研考试 2020-04-15
  • 基于Gauss烟团模型的大气扩散数据同化方法
    黎岢,梁漫春,苏国锋清华大学工程物理系,公共安全研究院,北京100084收稿日期:2018-05-23基金项目:国家重点研发计划(2016YFF0103901)作者简介:黎岢(1989-),男,博士研究生通信作者:梁漫春,副研究员,E-mail:lmc@tsinghua.edu.cn摘要:发生核事故 ...
    本站小编 Free考研考试 2020-04-15
  • 范式路由器:规范路由器数据层的动态行为
    徐磊,徐恪清华大学计算机科学与技术系,信息科学与技术国家实验室,北京100084收稿日期:2018-03-10作者简介:徐磊(1983-),男,博士研究生通信作者:徐恪,教授,E-mail:xuke@tsinghua.edu.cn摘要:随着模块化可编程路由器越来越普遍,路由器面临的安全问题也越来越严 ...
    本站小编 Free考研考试 2020-04-15
  • 不确定性数据上聚合查询的近似算法
    陈东辉1,陈岭1,王俊凯1,吴勇2,王敬昌21.浙江大学计算机科学与技术学院,杭州310027;2.浙江鸿程计算机系统有限公司,杭州310009收稿日期:2017-10-09基金项目:中国工程科技知识中心资助项目(CKCEST-2014-1-5);国家自然科学基金资助项目(61332017);浙江省 ...
    本站小编 Free考研考试 2020-04-15