Urban polycentric recognition and spatial interaction analysis based on word vector data field trajectory gravity
LI Xin,College of Resource and Environment, Collaborative Innovation Center of Urban-Rural Coordinated Development in Henan, Henan University of Economics and Law, Zhengzhou 450046, China收稿日期:2019-09-30接受日期:2020-04-21网络出版日期:2021-01-10
基金资助: |
Received:2019-09-30Accepted:2020-04-21Online:2021-01-10
作者简介 About authors
李欣(1981-),男,河南郑州市人,博士,讲师,主要研究方向为城市空间大数据挖掘与分析。E-mail:
摘要
关键词:
Abstract
Keywords:
PDF (12589KB)元数据多维度评价相关文章导出EndNote|Ris|Bibtex收藏本文
本文引用格式
李欣. 基于词向量数据场轨迹引力的多中心识别和空间交互分析. 地理研究[J], 2021, 40(1): 230-246 doi:10.11821/dlyj020190849
LI Xin.
1 引言
随着城市化进程的不断加速,城市的空间结构和作用范围也在不断产生变化,在一些以“摊大饼”模式发展的单中心城市中,人口和各类要素聚集的中心城区渐渐产生了交通拥堵、环境污染和职住失衡等“大城市病”问题,要素过度集聚的空间形态造成城市边际成本超出了边际经济效益的增加量,城市的总体空间绩效会随着城市规模的扩大而下降。经过国内外****的多年探索,推进城市结构的“多中心化”已成为应对此类问题的重要方法之一,北上广深等一线特大城市已在规划方案中将多中心确立为重要的战略方向,努力构造能够疏解分散人口和城市要素,并提高城市空间绩效的城市多中心结构。因此,对城市多中心空间结构的识别,对网络交互关系的挖掘,以及对交通、经济和生态绩效的检验等相关研究,已成为****关注的热点问题。目前,对于城市多中心结构的研究包括空间形态识别、演化机制分析和空间绩效检验等多个方向。
识别城市中心热点区域空间形态有助于分析城市交通和区域规划的合理性[1,2],研究成果如:桂智明等[3]利用时段分块和带噪声的并行密度聚类方法实现了热点区域识别的高效运算;Liu Yu等[4]利用轨迹和土地利用类型数据对城市功能中心进行了划分;Scholz等[5]利用旧金山出租车出行的动态时空轨迹,设计了基于周期动态模式的热点中心预测方法;Jahnke等[6]设计了轨迹OD点DBSCAN聚类方法,并进行了可视化分析;Zhang Pengdong等[7]使用核密度估计算法对浮动车数据进行时空聚类,并利用滤波方法监测时空热点;周勍[8]等借鉴了数据场理论中的势值算法,并利用单一和多级阈值进行了武汉市的热点区域提取。
探测多中心间的空间交互强度,分析空间结构的流通绩效,可以挖掘人车物的流动规律和趋势,验证多中心结构的高效性和合理性[9],研究成果如:韩昊英[10]和龙瀛[11]均利用公交刷卡数据对城市职住通勤关系和功能区进行了识别分析;王波[12]利用签到位置数据挖掘了城市活动的时空变化规律,并对城市功能结构进行了分析;程静[13]和陈世莉[14]均针对浮动车轨迹和POI数据设计了聚类方法,对城市功能中心出行量进行分析;周博[15]和陈泽东[16]基于轨迹聚类特征或热点区域提取分析了城市功能区间的空间交互关系;赵鹏祥[17]和Zhong Chen[18]利用复杂网络理论中的节点强度和边权值对城市多中心的重要程度进行了分析。
以上成果所使用的研究数据,已由产业分布、土地利用和人口密度等静态的、宏观的传统数据,向手机信令、社交签到、公交刷卡和浮动车轨迹等动态的、面向个体的新型大数据转变,数据的现势性和准确性都大大提升,但所使用的分析方法大多为空间统计或密度聚类,其分析结果虽然反映了要素的聚集形态,但分析过程并未将数据中隐含出行偏好等行为特征充分体现,因此也难以利用该行为特征信息,准确表达城市不同区域对人车物的吸引能力。
因此,为了更加完整的表达居民行为特征信息,得到更加准确的城市多中心分析结果,拟针对出租车和电动车轨迹大数据,设计一种城市多中心结构识别和空间交互关系分析方法,利用词向量[19]技术完整的描述轨迹长度、方向、分段结构和上下游关系等空间和属性特征,借鉴数据场理论[20]中的质点吸引模型来量化不同区域对移动目标的吸引强度,参考复杂网络理论[21,22]中的节点出入强度、净流量比和网络边权值实现空间交互规律的探索和挖掘,从流动角度对城市多中心结构进行识别,并分析其空间形态和形成机理,为改善居民生活体验,优化城市规划和管理提供理论和方法支撑。
2 研究区域与数据源
2.1 研究区域
郑州市是国家中心城市,也是中原城市群的核心,凭借地理中心位置优势,已建成米字型高铁网络和航空港经济试验区,对周边的吸引聚集能力不断增强,2018年底常住人口超过一千万,并实现了GDP总值一千万亿元的经济发展目标。但随着城市空间的扩张,城市内部结构和空间形态也在产生变化,人口密集和交通拥堵等城市病问题日趋严重,因此2018年5月郑州市规划局公示了《郑州市中心城区总体城市设计》,力图通过多中心发展模式,优化城市空间布局,提高城市整体空间绩效,规划的核心是“两主、五副、八区、四特”,基于这17个城市中心构建“一脉贯通、双心凝核、三轴为枢、四环聚城”的城市空间结构体系。规划多中心设计如图1。图1
新窗口打开|下载原图ZIP|生成PPT图1郑州市城市多中心规划结构
注:城市多中心与组团位置根据2018年5月《郑州市中心城区总体城市设计》绘制,其中从行政归属上划分,郑东新区属于金水区,经济技术开发区属于管城回族区,高新技术开发区属于中原区,因此在图中将其合并至对应行政区划。A. 二七广场主中心 B. 郑东新区主中心 C. 花园路副中心 D. 福塔副中心 E. 东站副中心 F. 碧沙岗副中心 G. 龙湖副中心 H. 紫荆山路区级中心 I. 北站区级中心 J. 城北区级中心 K.高新区组团中心 L. 二七新城组团中心 M. 经开区区级中心 N. 经开新区组团中心 O. 古荥组团中心 P. 大学城教育特殊功能区 Q. 省级市民文化特殊功能区 R. 市级市民文化特殊功能区 S. 惠济会展特殊功能区。
Fig. 1Urban polycentric planning structure of Zhengzhou city
2.2 数据来源
使用的数据包括静态道路数据和动态轨迹点数据两类:静态道路数据。由于定位设备存在各种误差,轨迹点容易出现偏离道路的情况,需要将其与道路位置进行空间匹配,才能构造分段轨迹,并使用词向量模型进行语料库训练。
动态轨迹数据。包括出租车(约6000辆)和电动车(约12万辆)两类,采集时间均为2019年6月1日至30日,二者均为居民常用出行方式,但由于移动距离和时间存在不同,因此可以从不同角度反映人们的移动规律。出租车定位点采样间隔为1 min,数据内容包括车牌、坐标、定位时刻和载客状态等信息,状态由空载变为载客的定位点可标识为轨迹起点,反之标识为轨迹终点,位于起点和终点时段间的定位点按时序连接即可生成出租车轨迹。电动车定位数据通过电动自行车管理服务系统采集,2018年10月至2019年3月郑州市为约300万辆市民电动车免费上牌并安装防盗定位设备,以期实现防盗追踪、智能纠章和交通大数据分析功能,其定位点数据所包含的时空和属性信息与出租车类似,但无载客状态信息,生成轨迹数据时,需要首先排除长时间空间位置不变的点,然后将其余点按时序生成移动轨迹。
处理两类定位数据时,首先利用孤立点检测算法[23]进行数据清洗,然后将定位点与路网数据进行匹配,并按时序构造轨迹。郑州市轨迹点和路网分布如图2。
图2
新窗口打开|下载原图ZIP|生成PPT图2郑州市轨迹点和路网分布
Fig. 2Distribution of trajectory points and road network in Zhengzhou city
3 研究方法
研究方法分为数据处理、热点区域识别和空间交互分析三部分,技术路线如图3。图3
新窗口打开|下载原图ZIP|生成PPT图3多中心热点识别与空间交互研究技术路线
Fig. 3Polycentric hotspot recognition and spatial interaction research technological route
3.1 基于词向量的轨迹起讫点相关性度量
词向量是一种利用向量空间表达自然语言中单词相关关系的数据挖掘技术,其中的CBOW和Skip-gram架构均可通过训练语料库,完成对“词”和“句”的向量表达和计算,进而实现计算机对语义信息的理解[24]。而利用轨迹数据进行城市多中心识别时,一些****认为轨迹所包含的分段结构和上下游关系[25],可以类比为自然语言中的词句和上下文关系,进而利用词向量模型进行表达,相关研究成果如,基于链路词向量实现的路网相关性分析[26],基于时空切分和轨迹词向量实现的伴随模式挖掘[27]等。借鉴词向量模型的原理,对具有分段结构和上下游关系的轨迹进行分段,每一条子轨迹段类比为“词”,整条轨迹类比为“句”,经过向量空间语料库训练,即可实现任意轨迹段的词向量表达。此方法的优势在于,该向量不仅包含了轨迹段的长度和方向等空间特征,而且通过向量的求和、余弦相似度或范数计算,可以定量的表达向量的相似性或上下文相关关系,即分段轨迹的上下游相关关系,实现了轨迹空间信息的完整表达。利用词向量计算轨迹OD点相关度,可以充分体现整条轨迹中的各个子轨迹段反映的出行偏好,更加准确的反映OD点间的相关关系,其计算流程如图4。
图4
新窗口打开|下载原图ZIP|生成PPT图4轨迹OD点词向量相关度计算流程
Fig. 4Word vector correlation degree calculating process of trajectory OD point
(1)筛除出租车空载轨迹点和电动车长时间未移动的点后,将轨迹点匹配至路段,按照定位时序生成动态目标轨迹,并按路网拓扑结构将其分解为上下游子轨迹段集合。
(2)使用Python第三方工具“gensim”,从类比为“词”的海量子轨迹段中训练词向量语料库,其中包含轨迹段标识及其对应的实数向量。
(3)设轨迹
(4)“句”向量已较为完整的反映了整条轨迹的方向、长度、分段和上下游特征,计算向量范数(数学意义上的向量长度)即可表达轨迹OD点间的相关度,该计算结果也可作为参数,用于城市多中心空间吸引强度的计算。
3.2 基于数据场的轨迹势值计算
数据场理论是一种将物理学概念引用至数域空间的数据挖掘理论,其中的质点吸引模型认为所有的数据对象均为质点,其间的相互作用关系随空间和时间变化产生衰减效应,相互作用的强度可以用势函数表达[28]。以往的一些城市多中心识别研究成果,在利用数据场表达轨迹OD点作用关系时,对质点吸引模型进行了时空扩展,计算数据场势值时使用了OD点欧式距离作为空间距离参数,时差系数作为时间参数。设时空数据场中存在两质点O和D,则D对O的数据场势值计算公式如下[29]:
式中:
以上公式所计算的两质点间势值与物理学中两物体间引力计算方法类似,均与二者距离平方呈反比,因此势值是反映数据场中两质点空间吸引作用的参考指标。但公式中原本的参数d为仅和OD点空间位置相关的欧式距离,并未反映目标在移动过程中的移动方向、分段结构和上下游关系等体现居民出行习惯和偏好的信息,对于居民出行规律的表达仍然不够完整,因此势值所反映的质点间吸引强度也不够准确。前文利用词向量表达轨迹段,已将轨迹长度、方向和分段属性信息包含在内,而且通过余弦相似度和向量范数计算,即可表达各个轨迹段的上下游相关关系[27],因此将公式(1)中的d改进为更能充分体现居民出行规律的词向量相关度。
3.3 基于格网势值的多中心热点区域识别
基于数据场的轨迹势值度量了OD质点间的吸引强度,而在城市空间中,海量轨迹的势值则能够反映城市各个区域对移动目标的吸引能力。某个城市区域轨迹点的聚集程度越高,则该区域的势值总和越大,其流动吸引力也就越强。对城市进行区域划分、势值计算、等级分类和可视化后,即可实现基于格网势值的多中心热点区域识别,流程如图5。图5
新窗口打开|下载原图ZIP|生成PPT图5基于格网势值的多中心热点识别流程
Fig. 5Polycentric hotspot recognition process based on potential value in grids
(1)单个质点的势值只能反映单条轨迹OD点间的吸引关系,进行热点区域的识别则需对研究空间进行区域划分,统计各个单位区域中的海量轨迹势值,以反映该区域的吸引能力,因此首先以0.5 km为边长,对郑州市进行规则格网划分。
(2)使用空间连接工具统计各个格网单元包含的D质点数量,然后基于词向量方法计算某格网单元内所有D质点的与其对应的O质点的轨迹词向量相关度。
(3)将轨迹词向量相关度作为距离参数代入公式(1),可得单个D质点的数据场势值,格网单元内所有D质点势值求和,可得反映区域吸引能力的格网单元总势值,势值越高引力越强。
(4)根据格网单元势值频数直方图进行自然间断点分级,并在图中进行多级热点区域可视化,最终结合城市实地特征和势值等级进行多中心热点区域识别。
3.4 基于复杂网络的多中心空间交互分析
复杂网络是一种研究复杂系统中个体交互网络的拓扑和统计特征的理论,是研究复杂系统性质和功能的重要方法。在复杂网络中,节点的连接数目、邻近程度和影响范围,节点间的连接强度,都是反映网络中交互关系的重要指标。以基于词向量数据场轨迹引力方法识别的多中心位置为节点,以人车物在节点间的流动为网络连接,即可构建带有边权值的有向加权空间交互网络。在网络中,轨迹起点和终点分别代表了移动目标的流出和流入位置,因此对多中心邻域内的OD点进行空间统计,可得多中心节点间的边权值,继而完成节点出入强度和净流量比计算[15]。
设
基于边权值的节点出入强度计算公式为:
式中:
净流量比是反映节点吸引聚集能力或辐射分散能力的重要指标,在多中心空间交互研究中,可以反映某区域的热度增减情况。其计算公式为:
式中:
通过计算边权值、出入强度和净流量比,并将结果分级可视化,即可挖掘城市多中心网络中的人车物流动规律,分析其空间交互关系。
4 实验与分析
4.1 多中心热点区域识别方法对比实验
为了验证词向量数据场多中心热点识别方法的有效性,选用了局域Getis-Ord Gi*指数法与其进行对比实验。局域Getis-Ord Gi*指数法是一种利用空间统计对要素聚集热点区域进行特征分析的方法,通过计算指定区域内要素数与总量之比,识别具有统计显著性的热点或冷点区域。分析步骤为:① 以0.5 km为边长对郑州市进行格网划分,利用空间连接统计各个格网单元中的定位点数;② 计算要素Moran’s I空间自相关性;③ 利用ArcGIS中的热点分析工具计算所有格网单元的Z得分和P值,Z≥1.96且P≤0.05时,即可将其作为具有统计显著性的要素聚集热点单元;④ 设定Z得分的多级阈值,进行空间可视化,即可显示轨迹点要素的空间聚集形态。
使用两种方法分别对出租车和电动车轨迹进行分析的结果如图6。
图6
新窗口打开|下载原图ZIP|生成PPT图6两种热点分析结果对比
Fig. 6Comparison of two hotspot analysis results
图6a是使用局域Getis-Ord Gi*指数法对出租车轨迹点进行分析的结果,聚集热点主要分布在金水区西南、管城回族区西北、二七区东北和中原区东南部的城市核心区域,热点单元格面积约占总面积的8.74%,经过空间统计,其中包含了约71.79%的轨迹点,较小的空间范围内,要素数量占比较高,聚集效应显著,总体上呈现内密外疏、沿线蔓延的圈层空间分布形态。图6c是使用局域Getis-Ord Gi*指数法对电动车轨迹点进行分析的结果,其热点格网单元面积占9.49%,包含轨迹点数量占64.11%,同样具备较为显著的聚集效应,但从图中可以看出,虽然红色热点区域的空间分布位置和面积与出租车分析结果相比差异不大,但周围黄色区域明显增加,统计数据表明电动车和出租车相比,更大的热点格网面积所包含的轨迹点数所占比例反而更少,其原因在于,电动车基数更大,其轨迹点在空间上的分布与出租车相比也更加分散,而且由于出行成本更低,短途出行更加便捷,居民也更倾向使用此方式出行。
图6b和图6d分别是使用词向量数据场轨迹引力方法对出租车和电动车轨迹进行分析的结果,和局域Getis-Ord Gi*指数法相比可以发现,二者热点区域的空间位置和形态基本一致,主要差别在于局域Getis-Ord Gi*指数法分析结果中热点单元连片面积更大,而词向量数据场方法热点区域的空间区分度更高,更加清楚的体现了大片热点区域的内部结构,同时还识别出一些外围区域的离散次级热点格网单元。从两种方法的原理上分析,局域Getis-Ord Gi*指数法的核心是空间统计,在分析空间自相关性的基础上进行了邻域统计,而轨迹段数据中包含的方向、长度、上下游分段结构和移动时段等时空信息,并未在分析过程中充分体现,此方法仅反映了轨迹点在空间位置上的聚集特征。而词向量数据场的方法,运用词向量记录了轨迹的方向和长度,使用向量运算体现分段结构、上下游关系和轨迹OD点相关度,通过时差系数反映时间特征,最终利用轨迹和区域势值描述空间吸引强度,此方法对于居民出行习惯和偏好的表达更加充分,热点聚集区域的内部结构呈现的更细致,并可识别更多的外围分散次级热点,因此是更加适合轨迹数据的一种多中心热点区域识别方法。
4.2 多中心热点区域时空形态分析
数据场势值计算公式中的归一化时差系数实现了轨迹时间属性的标准化,同时也完成了多中心引力势值计算的时空扩展。由于居民在不同时段的出行需求不同,因此在不同时段城市各个区域的吸引强度也存在差异,从实验数据中筛选7:00~9:00、11:00~13:00和17:00~19:00三个时段的出租车和电动车轨迹数据进行分析,可得图7。图7
新窗口打开|下载原图ZIP|生成PPT图7热点区域分时段空间形态对比
Fig. 7Comparison of spatial patterns of hotspot in different periods
从总体分布形态上分析,图7a、图7b和图7c为三个时段出租车轨迹的轨迹引力热点分析结果,其中早高峰时段的图7a和晚高峰时段的图7c中热点区域面积和空间形态差异较小,各个区域在早晚高峰时段对人车物的吸引强度相当,说明郑州市各个区域职住比例相对均衡,就业相关地理要素和生活居住地理要素在一定空间范围内所占比例相当,而平峰时段图7b中的热点区域面积明显小于早晚高峰时段,随着工作和上学等出行行为的结束,交通流量也随之下降,因此各个格网单元呈现的数据场势值吸引强度也逐渐降低,热点区域面积相对较小。图7d、图7e和图7f为电动车轨迹分析结果,同样出现了早晚高峰热点区域面积大于平峰时段的规律,与出租车分析结果不同的是,热点区域面积更大,且外围离散分布的次级热点区域更多,前文进行局域Getis-Ord Gi*指数法与词向量数据场方法对比时,已对形成此空间形态的原因进行了分析。
从局部流动规律分析,图7中出租车和电动车在高峰和平峰时段均处于热点高值的区域包括如二七广场、花园路农业路、南阳路黄河路、大学路陇海路和桐柏路中原路等,这些位置均处于人口密集的核心城区,也是城市主干道交汇位置,其中二七广场、花园路农业路和桐柏路中原路是较为集中的商业中心,另外两个则是教育和居住中心,根据分析结果可以认为这些位置为持续型热点区域。高峰和平峰时段热点等级差异较大的区域,包括如郑东新区CBD、瑞达路科学大道、花园路三全路和中原福塔等,此类位置均位于核心城区的边缘,为相对集中的商务或就业中心,其中瑞达路科学大道和中原福塔在高峰时段的引力高于平峰时段,这是由于其周边各类商业企业较多,流量规律与上下班规律一致,而郑东新区CBD和花园路三全路在平峰时段的引力高于高峰时段,这是由于CDB周边的金融服务行业和花园路三全路附近的汽车销售维修服务行业与其他企业的工作时段有差异,因而形成图中显示的时段变化规律,以上几处可认为是变化型热点区域。
4.3 多中心热点区域识别分析
将郑州市规划多中心与词向量数据场轨迹引力热点区域分析结果叠加,如图8,统计其与热点区域的重合情况,可得表1。图8
新窗口打开|下载原图ZIP|生成PPT图8轨迹引力热点区域与规划多中心
Fig. 8Trajectory gravity hotspot area and planning polycentric nodes
Tab. 1
表1
表1叠加分析统计结果
Tab. 1
出租车 | 电动车 | ||||||||
---|---|---|---|---|---|---|---|---|---|
主中心 | 副中心 | 区级组团 | 特殊功能区 | 主中心 | 副中心 | 区级组团 | 特殊功能区 | ||
一级热点 | A | CF | I | - | A | CF | IJ | - | |
二级热点 | B | D | HJ | - | B | D | H | - | |
三级热点 | - | - | - | - | - | - | K | - | |
不显著 | - | E | KLM | - | - | E | LM | - | |
三级冷点 | - | - | O | - | - | - | NO | PS | |
二级冷点 | - | - | - | PS | - | - | - | Q | |
一级冷点 | - | G | N | QR | - | G | - | R |
新窗口打开|下载CSV
由图8和表1可以看出,规划双主中心A二七广场和B郑东新区均位于数据场势值的高值区域,均具备较强的吸引聚集能力,但二者的势值等级并不一致,这是由于郑东新区自2000年开始规划建设,发展时间和二七广场相比较短,由于受到政策支持,其发展速度较快,作为郑州金融商务中心,周边配套的写字楼、银行、商场、超市、路网和居民社区均已建设完善,但郑东新区为近10年来郑州市地价和房价最高的区域,居民生活成本、企业运营成本和其他区域通行至此的交通成本均较高,因此也影响了该区域的空间吸引能力。
副中心C花园路、D福塔和F碧沙岗落在热点区域,E东站位于不显著区域,G龙湖位于冷点区域。郑州东站是重要的城市对外窗口,其周边的土地性质大多为商业用地,虽然集中了一定数量的写字楼、公司和休闲娱乐设施,但由于距离核心城区较远,医疗、教育和住宅等与居民生活密切相关的城市要素所占比例较低,而且与郑东新区CBD一样存在地价和房价高企的现象,因此其作为城市副中心的吸引聚集能力仍然有限。龙湖副中心是继郑东新区CBD之后新规划的商务金融中心,其位置位于图中核心城区数据场势值高值区域东北方向的凹陷位置处,由于目前处于建设初期,还远未形成较强的空间吸引能力,但随着未来各类城市要素的不断建成,在空间上可以补齐空白区域,和郑东新区连为一体,形成更高的交通、经济和空间绩效。
区级组团和特殊功能区的分布较为分散,除了H紫荆山路、I北站、J城北三个区级中心和K高新区组团中心,其余全部位于不显著或冷点区域。例如在城市规划中N经开新区组团中心包含了新建的郑州使领馆区,而Q省级市民文化特殊功能区、R市级市民文化特殊功能区,S惠济会展特殊功能区为郑州市重点建设的文体会展功能区,这些区域虽然规划前景广阔,但其位置位于更加边缘的区域,交通便利程度大大降低,同时配套建设还不完善,因此其吸引能力仍然不足。若期望按照规划实现其城市副中心的疏解分散功能,还应加大政策支持和投资力度,以提高其聚集吸引能力。
图9为结合城市实地特征与词向量数据场轨迹引力热点区域识别出的21个城市多中心。 第一等级包含a、c、f、g和m,分布在势值等级最高的核心城区;第二等级包括b、d、e、h、i、j、k、l和n,主要分布在一级中心的东部和北部的数据场势值次高级区域;第三等级包括o、p、q、r、s、t和u,主要分布在位置更加偏远,但势值与周边相比仍然较高的区域。
图9
新窗口打开|下载原图ZIP|生成PPT图9城市多中心识别分析
注:a. 二七广场 b. 郑东新区 c.花园路农业路 d. 中原福塔 e. 东风南路商鼎路 f. 大学路陇海路 g. 桐柏路中原路 h. 紫荆山路航海路 i. 南阳路东风路 j. 花园路三全路 k. 瑞达路科学大道 l. 江山路三 全路 m. 南阳路黄河路 n. 文化路东风路 o. 西四环中原路 p. 龙子湖 q. 东四环陇海路 r. 西四环郑少高 速 s. 机场高速南四环 t. 文化北路英才街 u. 紫荆山南路宇通路。
Fig. 9Urban polycentric recognition analysis
通过识别得到的城市多中心与规划多中心位置一致或接近的有16个。其中位于核心城区的5个一级中心,所处区域势值等级最高,城市发展最成熟,因而吸引聚集能力也最强。二级和三级中心要么位于热点连片区域的边缘,要么与周边相比势值引力更高,如k瑞达路科学大道位于高新技术开发区核心位置,虽然未与主城区热点区域连片,但其周边仍然聚集有两所高校、数百家高新企业研发机构和配套社区,产业结构符合区域定位,已经呈现较强的周边吸引能力;另外p龙子湖区域为15所高等院校聚集的大学城教育特殊功能区,除了集中了各所学校共计20万以上的师生之外,在湖心岛还配有银行、酒店、商场和超市等辅助设施,也已成为郑州东部极具人气的城市中心之一。
4.4 多中心热点区域空间交互分析
基于识别出的21个城市多中心,可以以其为节点构建城市多中心空间交互网络。首先利用空间叠加方法,统计符合条件“起点在郑州市各个多中心出入强度和净流量比如图10。首先利用图10a和图10b分析多中心节点的出入强度。从空间位置和强度统计看,位于城市核心区域的5个中心a、c、f、g和m出入强度最高,而处于城市边缘的o、p、q、r、s、t和u强度最低,其余多中心出入强度居中,以此为依据划分出的三个等级,与前文图9中识别出的三级中心分析结论一致。然后利用图10b和图10c分析多中心节点的净流量比。可以看出,各个多中心虽然出入强度总量差异较大,但入强度和出强度值基本相当,由其计算而来的净流量比取值范围基本在-12%~12%之间,多中心节点出入强度较为均衡。其原因在于,从宏观角度分析郑州市的用地类型和设施分布,商业、工业、住宅和绿地以及相关的城市要素总体上分布较为均衡,未形成功能单一、高度聚集的就业或居住中心。从职住功能角度与北京的多中心结构对比,北京典型的商业中心包括国贸和西单,居住中心包括天通苑和望京,此类城市中心周边商业或居住属性的空间要素所占比例较高,因此居民出行规律也与此类中心的功能密切相关,形成波动较大的周期性的出入强度变化,例如就业中心早高峰时段的入强度高于出强度,晚高峰相反。而郑州市虽然也有相对集中的功能性中心,如商务中心郑东新区CBD,就业中心瑞达路科学大道、花园路三全路和中原福塔等,前文的分析中它们也属于变化型热点区域,但其变化规律主要体现在早晚高峰与平峰时段流量的差异,并非早高峰和晚高峰的流向差异,而且此类多中心周边就业或居住属性的城市要素比例和聚集程度,与北京相比仍然较低,郑州市多中心出入强度相对平衡,职住属性也相对均衡。
图10
新窗口打开|下载原图ZIP|生成PPT图10多中心热点交互强度统计
Fig. 10Statistics of polycentric hotspot interaction intensity
出入强度和净流量比体现了单个节点的空间交互信息,而边权重则可以利用网络连接表达节点间的联系紧密程度。对前文计算的出租车和电动车交互边权重分别进行分级可视化,即可对比居民使用不同出行方式而反映出的不同空间交互规律,如图11。
图11
新窗口打开|下载原图ZIP|生成PPT图11多中心网络空间交互关系
Fig. 11Polycentric network spatial interaction
图11a为出租车交互强度连线图。可以看出,5个一级中心以及与其邻近的5个二级中心间交互强度最高,其他外围中心之间的主要交互方向指向核心城区,三级热点间的交互强度较低,另外出租车轨迹数据中存在一定数量的远距离轨迹,但远距离中心间的交互由于出行成本较高,其交互强度明显较弱。结合郑州市各个区域的出入强度分析此交互形态可以发现,经过多年发展,郑州市轨迹吸引强度呈现核心强、外围弱、沿线蔓延的圈层多中心分布形态,但从形成机理看,此形态仍然为典型的平原外溢型多中心结构,郑州市地处平原,几乎不受山水阻隔等地形因素的影响,核心城区过度集中的人口和城市要素,造成了交通拥堵和环境污染等影响居民生活体验的城市问题,因此,各类城市要素的建设开始沿交通主线向外蔓延,进而引导人口和就业逐渐向外围分散,但出租车轨迹体现的居民出行仍然为“中心-外围”间的空间交互,而外围中心间的交互强度远低于核心城区方向,其对人口和交通的分散疏解作用还有待进一步提高。
图11b为电动车交互强度连线图。电动车出行基数大、成本低,也是城市居民出行的重要方式。可以看出,一级和二级空间距离较近的多中心间交互强度最高,三级中心间相对较低,此种“核心强、外围弱”的交互形态及其成因与出租车基本一致。而区别在于,由于轨迹基数大,交互总量大大高于出租车,交互强度高的中心数量更多,而且中短途交互强度高,长途交互强度低,在空间上的分布更加均衡,各个距离较近的三级中心间也存在中等强度的空间交互,这是由于受到公共交通便捷程度、道路实时交通状态和车辆续航新能等多种因素共同影响,居民更倾向使用成本更低、方便快捷的电动车方式进行中短途出行。
5 结论与讨论
针对轨迹数据,提出了一种基于词向量数据场轨迹引力的多中心识别和空间交互分析方法。为了准确描述轨迹的长度、方向、分段结构和上下游关系等空间属性和结构特征,表达居民出行过程中的偏好和规律,利用了词向量技术对轨迹进行表达,并运用向量运算反映轨迹起讫点之间的相关程度;然后对郑州市进行空间格网划分,并借鉴数据场理论中的质点吸引模型来度量格网单元对移动目标的吸引能力,按照计算得到的格网势值进行分级可视化后,实现了对郑州市多中心位置的空间识别;最后基于识别出的21个城市多中心,利用了复杂网络理论进行多中心空间交互规律的挖掘,其中出入强度和净流量比体现了单个节点的交互信息,而边权值反映了多个节点间的联系紧密程度。通过以上分析,可得以下结论:(1)郑州市的轨迹吸引强度呈核心强、外围弱、沿线蔓延的圈层分布形态。识别出的21个多中心,大多数与规划中心位置一致或接近,按照数据场势值和出入强度可分为三个等级,各级之间势值引力差异较大,核心城区的5个一级中心周边各类城市要素分布密集,对于轨迹的吸引能力也最强,而9个二级中心和7个三级中心,要么位于核心城区边缘的次级热点区域,要么其势值与周边相比相对较高,21个多中心总体上呈现内密外疏的外溢型多中心分布形态。另外,从出租车和电动车的数据场格网分布形态看,高值格网呈现出沿主干道的连片蔓延形态,如花园路、紫荆山路、金水路、中原路、陇海路和农业路等,核心城区过于密集的人车物已造成核心城区各类要素的饱和,随着城市扩张,新规划的城市功能区和相关设施会优先沿交通便利的主干道向外蔓延分散,从而呈现沿线蔓延的空间形态。
(2)次级中心聚集吸引能力不足,分散疏解功能还需加强。二级和三级中心的出入强度及交互频次远低于一级中心,而且人车物的流动方向也主要指向一级中心。郑州市地处平原,城市规划中几乎不受山水阻隔限制,虽然可以通过政策导向和规划指引促成多中心的空间结构,但在实际应用中还需较长时间来实现规划目标,例如郑东新区主中心自2000年规划建设至今约20年,已对人口、产业、交通和经济形成较强的聚集作用,龙子湖大学城教育特殊功能区建设约10年,十余所高校和湖心岛商业区也已形成了对周边的吸引能力,而规划的龙湖副中心、经开新区组团中心、省级市级市民文化特殊功能区和惠济会展特殊功能区,虽然规划前景广阔,但由于规划较晚、位置偏远、配套不足,其对周边的吸引作用,以及与其他多中心的交互强度仍然较低,远未起到应有的分散疏解作用,因此,还应加强政策持续支持力度,通过交通基础设施建设和产业统筹规划,增强外围多中心的吸引能力,带动其持续发展。
通过实验和分析证明,词向量模型对轨迹本身包含的空间信息,以及隐含的居民出行偏好和规律信息,描述更加完整;数据场方法所体现的出行引力强度,比通过空间统计和聚类分析得到的聚集程度,更加适合用于分析体现流动规律的轨迹数据,基于数据场势值可以实现流动角度的多中心结构识别;复杂网络分析得到的多中心节点强度和边权重,则反映了各个多中心节点的流动强度和联系紧密度,从流动角度呈现了多中心结构的演化机理,为多中心结构研究和规划实践提供了新思路。
不足之处和进一步研究方向包括:① 除了出租车和电动车之外的个人出行方式,还包括共享单车、私家车、公交车和地铁等,不同模式的出行规律及其反映的城市结构还存在差异,因此还应扩展数据种类,综合各种出行模式的分析结果,得到更准确的分析结论;② 传统的房屋土地价格、空间人口密度、区域GDP总量和兴趣点数据等反映静态特征的数据,也是多中心结构分析应考虑的重要因素,还应将动态和静态规律结合,从多种角度分析多中心结构的演化机理;③ 除了空间形态和交互规律的研究之外,多中心结构的交通绩效、经济绩效、生态绩效和空间绩效评价也是重要的研究方向,应对其深入研究,为城市长远规划和科学发展提供可靠依据。
致谢
真诚感谢二位匿名评审专家在论文评审中所付出的时间和精力,评审专家对本文轨迹热点时空形态方面分析的修改意见,使本文获益匪浅。参考文献 原文顺序
文献年度倒序
文中引用次数倒序
被引期刊影响因子
,
[本文引用: 1]
[本文引用: 1]
,
[本文引用: 1]
[本文引用: 1]
,
[本文引用: 1]
[本文引用: 1]
,
[本文引用: 1]
,
[本文引用: 1]
[本文引用: 1]
,
URL [本文引用: 1]
,
[本文引用: 1]
[本文引用: 1]
,
[本文引用: 1]
[本文引用: 1]
,
[本文引用: 1]
[本文引用: 1]
,
DOI:http://www.dlyj.ac.cn/article/2021/1000-0585/10.11821/xb201210005URL [本文引用: 1]
基于位置服务(Location Based Service, LBS) 技术为研究城市系统的时空动态规律提供了新的视角, 已往多基于移动通讯(GSM)、全球定位系统(GPS)、社会化网络(SNS) 和无线宽带热点(Wi-Fi) 数据开展研究, 但少有研究利用公交IC 卡刷卡数据进行城市系统分析。普遍存在的LBS数据虽然具有丰富的时间和空间信息, 但缺乏社会维度信息, 使其应用范围受到一定限制。本文基于2008 年北京市连续一周的公交IC 卡(Smart Card Data, SCD) 刷卡数据, 结合2005 年居民出行调查、地块级别的土地利用图, 识别公交持卡人的居住地、就业地和通勤出行, 并将识别结果在公交站点和交通分析小区(TAZ) 尺度上汇总:① 将识别的通勤出行分别从通勤时间和距离角度, 与居民出行调查数据和其他已有北京相关研究进行对比, 显示较好的吻合性;② 对来自3 大典型居住区和去往6 大典型办公区的通勤出行进行可视化并对比分析;③ 对全市基于公交的通勤出行进行可视化, 并识别主要交通流方向。本研究初步提出了从传统的居民出行调查和城市GIS 数据建立规则, 用于SCD数据挖掘的方法, 具有较好的可靠性。
[本文引用: 1]
,
URL [本文引用: 1]
借助新浪微博,引入位置服务大数据,以南京市为例,从时间、空间、活动3个方面分析城市活动空间的动态变化,并在掌握变化规律的基础上进一步划分城市活动区域.研究发现:传统的作息规律仍然支配着人们的签到活动,时间与活动内容间的对应关系仍然存在;居民活动在工作日、休息日与节假日,以及主城与外围地区存在差异;城市活动空间在一天内经历了相对分散-集聚-进一步集聚-分散-相对集聚的动态变化;城市活动区域可以划分为就业活动区、居住活动区、休闲活动区、夜生活活动区,及综合活动区;活动功能区呈现出混合化与边界模糊化的特征.
[本文引用: 1]
,
DOI:http://www.dlyj.ac.cn/article/2021/1000-0585/10.3724/SP.J.1047.2016.01227URL [本文引用: 1]
受城市资源配置、区域功能分化的影响,城市中居民的出行往往呈现出特定的模式和规律,而这种出行模式的背后反映出城市的功能结构。城市车辆GPS导航的广泛使用,以及车辆轨迹数据的大量获取,为分析城市居民出行模式及理解城市功能结构提供了数据支撑。本文以道路分割城市得到的地块为研究单元,利用北京市一个月的出租车轨迹数据,对北京居民的出行模式及城市功能格局进行分析。在轨迹数据分析中,本文从轨迹数据中提取每个地块的出行量时间序列信息,然后采用结合时间序列距离度量和时间序列自身相关性的聚类方法,对出行量时间序列数据进行聚类分析,从而研究乘客出行的时空分布特征,最后结合北京市POI数据,探讨了不同区域乘客出行规律和区域功能类型的相互关系。结果表明,出租车出行量时间序列模式在工作日和周末间存在明显差异。此外,工作日的2个出行高峰与通常的通勤早晚高峰不同。由出行量所得的区域聚类结构,除具有重要交通枢纽功能的地块外,总体上以市中心为圆心大致呈同心圆分布,且距离市中心越远出行量越小。研究结果对于分析北京市居民出行行为、辅助城市交通规划具有一定的意义。
[本文引用: 1]
,
DOI:http://www.dlyj.ac.cn/article/2021/1000-0585/10.11821/dlxb201603010URL [本文引用: 1]
随着中国城市化进程的不断推进和深入,城市内部空间结构正发生不断的变化.城市内部形成的不同功能区标识研究,对城市结构理论以及政策制定,资源配置等方面具有非常重要的意义.这些不同的功能区包括住宅区,工业区,教育区以及办公区等.本文以大数据为依托,重点研究城市功能区的特点和分布状态,选取广州市6个区为样本,以最新道路网络为分割依据把研究样本分为439个区域.对历时一周的海量浮动车(GPS)数据以及兴趣点数据采用时空语义挖掘方法,建立潜在的狄利克雷模型(LDA)以及狄利克雷多项式回归模型(DMR);通过OPTICS聚类方法对不同模型的结果进行聚类,进而利用POI类别密度,居民出行特征等方法进行分区结果识别.同时,参考百度地图的地理信息,将研究得到的广州市功能分区结果与广州市城镇用地现状图,居民日常出行特征进行对比验证分析.研究表明,该方法基本能识别出具明显特征的城市功能区,如成熟居住区,科教文化区,商业娱乐区,开发区等.识别出的广州市不同类型的功能区呈现了以居住区和商业区为主导,其他类型功能区围绕其展开的特点.研究证明,利用大规模,高质量的个体时空数据开展人们移动行为和日常活动组织及社会空间的研究,能从一个新的视角揭示城市功能区的形成及其机制.
[本文引用: 1]
,
DOI:http://www.dlyj.ac.cn/article/2021/1000-0585/10.13284/j.cnki.rddl.003097URL [本文引用: 2]
以深圳市出租车GPS数据为基础,运用时空拓展的轨迹数据场聚类方法提取城市交通热点区域,结合城市POI(Point of Interest)数据和地理实况对热点区域加以理解和分析。基于复杂网络的视角,计算交互分析指标并可视化热点区域的空间交互网络,探究城市交通和居民出行的时空规律。结果表明:1)交通枢纽(机场、火车站和口岸)、综合性商圈、城市重要主干道周边和城市商务中心在节假日和工作日均表现为持续热点区域;2)节假日热点区域分布较“发散”,主要反映了居民个性化出行需求;3)工作日热点区域分布较“收敛”,主要表现为职住分离的通勤模式;4)不同热点区域在空间交互网络中的重要性存在明显差异,其空间交互体现了距离衰减效应和局部抱团现象,居民出行的热点区域网络本身具有小世界效应和无标度特征。
[本文引用: 2]
,
DOI:http://www.dlyj.ac.cn/article/2021/1000-0585/10.12082/dqxxkx.2018.170531URL [本文引用: 1]
受区域功能分化影响,城市居民出行呈现出特定的时序特征,因而不同的出行时序特征可以反映区域功能的差异性。同时,区域功能的交互特征可以通过居民出行的空间交互活动体现。大数据时代的到来,使得以GPS数据为代表的个体时空大数据可以从微观视角反映居民出行特征。本文采用个体时空大数据,应用数据挖掘方法,从居民感知视角研究城市区域功能的差异性与联系性。以北京六环为研究区域,采用规则格网划分城市地块,通过北京市3个月的出租车GPS数据提取地块的居民出行时序特征。采用期望最大化算法进行聚类分析,并结合兴趣点数据和居民出行调查实现功能区识别,识别出居住区、商业娱乐区等6类功能区。从距离和时间2个维度分析功能区之间的空间交互特征,发现功能互补性在一定程度上削弱了空间交互强度的距离衰减效应,同时功能交互呈现出显著的时序差异。
[本文引用: 1]
,
[本文引用: 1]
[本文引用: 1]
,
URL [本文引用: 1]
In essence, we first construct a weighted directed graph from these travel records. Each node in the graph denotes an urban area, edges denote the possibility of travel between any two areas, and the weight of edges denotes the volume of travel, which is the number of trips made. We then make use of (a) the graph properties to obtain an overall view of travel demand, (b) graph centralities for detecting urban centers and hubs, and (c) graph community structures for uncovering socioeconomic clusters defined as neighborhoods and their borders. Finally, results of this network analysis are projected back onto geographical space to reveal the spatial structure of urban movements. The revealed community structure shows a clear subdivision into different areas that separate the population's activity space into smaller neighborhoods. The generated borders are different from existing administrative ones. By comparing the results from 3years of data, we find that Singapore, even from such a short time series, is developing rapidly towards a polycentric urban form, where new subcenters and communities are emerging largely in line with the city's master plan.To summarize, our approach yields important insights into urban phenomena generated by human movements. It represents a quantitative approach to urban analysis, which explicitly identifies ongoing urban transformations.]]>
,
[本文引用: 1]
,
[本文引用: 2]
[本文引用: 2]
,
URLPMID:9623998 [本文引用: 1]
Networks of coupled dynamical systems have been used to model biological oscillators, Josephson junction arrays, excitable media, neural networks, spatial games, genetic control networks and many other self-organizing systems. Ordinarily, the connection topology is assumed to be either completely regular or completely random. But many biological, technological and social networks lie somewhere between these two extremes. Here we explore simple models of networks that can be tuned through this middle ground: regular networks 'rewired' to introduce increasing amounts of disorder. We find that these systems can be highly clustered, like regular lattices, yet have small characteristic path lengths, like random graphs. We call them 'small-world' networks, by analogy with the small-world phenomenon (popularly known as six degrees of separation. The neural network of the worm Caenorhabditis elegans, the power grid of the western United States, and the collaboration graph of film actors are shown to be small-world networks. Models of dynamical systems with small-world coupling display enhanced signal-propagation speed, computational power, and synchronizability. In particular, infectious diseases spread more easily in small-world networks than in regular lattices.
,
URLPMID:10521342 [本文引用: 1]
,
DOI:http://www.dlyj.ac.cn/article/2021/1000-0585/10.3969/j.issn.1000-3428.2011.20.066URL [本文引用: 1]
交通检测器获得的数据存在无效、冗余、错误、时间点漂移及丢失等质量问题。为此,在分析影响数据质量问题原因的基础上,给出交通流数据清洗的概念,研究“脏数据”的清洗规则与清洗步骤,并对环形线圈检测器检测到的数据进行验证。结果表明,该清洗规则对错误、丢失、冗余等“脏数据”的识别率均在90%以上。
[本文引用: 1]
,
DOI:http://www.dlyj.ac.cn/article/2021/1000-0585/10.3724/SP.J.1047.2016.00886URL [本文引用: 1]
微博客文本蕴含类型丰富的地理事件信息,能够弥补传统定点监测手段的不足,提高事件应急响应质量。然而,由于大规模标注语料的普遍匮乏,无法利用监督学习过程识别蕴含地理事件信息的微博客文本。为此,本文提出一种蕴含地理事件微博客消息的自动识别方法,通过快速获取的语料资源增强识别效果。该方法利用主题模型具有提取文档中主题集合的优势,通过主题过滤候选语料文本,实现地理事件语料的自动提取。同时,将分布式表达词向量模型引入事件相关性计算过程,借助词向量隐含的语义信息丰富微博客短文本的上下文内容,进一步增强事件消息的识别效果。通过以新浪微博为数据源开展的实验分析表明,本文提出的蕴含地理事件信息微博客消息识别方法,识别来自事件微博话题的消息文本的F-1值可达到71.41%,比经典的基于SVM模型的监督学习方法提高了10.79%。在模拟真实微博环境的500万微博客数据集上的识别准确率达到60%。
[本文引用: 1]
,
DOI:10.13249/j.cnki.sgs.2017.02.006URL [本文引用: 1]
针对城市道路拥堵问题的日益加剧的问题,智能化城市交通管理平台是缓解拥堵问题的有效方法,利用交通流大数据预测结果进行交通诱导,能够指导用户调整出行方案,有效缓解交通压力。研究了交通流大数据的分布式增量聚合方法,对海量交通流数据进行清洗统计,为交通流预测提供数据基础,基于交通流在路网中上下游路段的相关性分析,利用路口转弯率多阶分配将该相关性量化,构建基于路网相关性的空间权重矩阵,完成对于STARIMA模型的改进。通过应用试验证明,该方法能更准确的进行交通流预测,为交通诱导信息发布提供依据。
[本文引用: 1]
,
[本文引用: 1]
[本文引用: 1]
,
[本文引用: 2]
[本文引用: 2]
,
URL [本文引用: 1]
聚类分析是统计、模式识别和数据挖掘等领域中一个非常重要的研究课题,具有广泛的应用前景.受物理学中场论思想的启发,提出一种基于数据场的层次聚类方法.该方法将物质粒子间的相互作用及其场描述方法引入抽象的数域空间,通过模拟对象在虚拟数据场中的相互作用和运动实现数据对象的自组织层次聚集.实验显示,该方法不依赖于用户输入参数的仔细选择,能够发现任意大小和密度的非球形聚类,对噪声数据不敏感,且具有近似线性的收敛速度.
[本文引用: 1]
,
DOI:http://www.dlyj.ac.cn/article/2021/1000-0585/10.18306/dlkxjz.2017.09.011URL [本文引用: 1]
城市热点区域是人们频繁活动的体现,利用人们的出行可构建空间交互网络。目前的相关研究主要集中于对热点提取方法及其动态变化的研究,对交通热点的交互作用及其构成的空间交互网络的研究还很少。本文以武汉市的出租车轨迹为数据源,利用基于时空数据场的聚类方法提取城市交通热点区域;基于复杂网络理论与方法,分析城市交通热点区域之间的空间交互作用。通过研究发现:①节假日,热点区域之间的往返交互较多;工作日,热点区域之间的交互较少;②节假日,影响力较大的节点为车站、机场等;工作日,影响力较大的节点是社区和工作地;③社团探测发现,工作日跨越长江的交互较多,非工作日跨越长江的交互较少。上述研究结论可为交通管理部门针对节假日和工作日分别制定不同的交通管理政策和方法提供参考。
[本文引用: 1]