Modeling and analysis of geographic events supported by multi-source geographic big data
DU Yunyan,1,2, YI Jiawei1,2, XUE Cunjin2,3, QIAN Jiale1,2, PEI Tao1,2收稿日期:2020-07-20修回日期:2021-04-19
基金资助: |
Received:2020-07-20Revised:2021-04-19
Fund supported: |
作者简介 About authors
杜云艳(1972-), 女, 研究员, 博士生导师, 主要从事地理事件的人类活动感知。E-mail:
摘要
关键词:
Abstract
Keywords:
PDF (3880KB)元数据多维度评价相关文章导出EndNote|Ris|Bibtex收藏本文
本文引用格式
杜云艳, 易嘉伟, 薛存金, 千家乐, 裴韬. 多源地理大数据支撑下的地理事件建模与分析. 地理学报, 2021, 76(11): 2853-2866 doi:10.11821/dlxb202111018
DU Yunyan, YI Jiawei, XUE Cunjin, QIAN Jiale, PEI Tao.
1 引言
百科全书中事件被定义为比较重大且对一定人群产生一定影响的事情,包含人类有目的的行为及其与物体间的相互作用,具有复杂的动态多变性[1]。从认知科学角度看,事件发展过程也是人类认知世界的过程,作为知识的一种表示形式,“事件”被认为是人类认识世界的基础单元[2]。由此不难推断,发生在客观世界中具有一定时空范围的地理事件是人类活动与地球表层相互作用且产生重大影响的事情,是地理信息科学(GIS)机理认知的基本单元,因此,对其深入研究是了解人地系统各要素间相互作用机理与动态演化趋势的重要突破口。然而,由于早期GIS系统受数据获取手段的限制,无法定量刻画人的特征及其活动,因此,以往对地理事件的研究重点关注事件引起的客观世界变化的表达及其影响的评估与预测。具体包含两方面:其一是从时空数据模型角度,把事件作为引起客观世界变化的原因或结果提出的时空演化模型研究;其二是地理事件的过程分析与模拟。在时空数据模型方面,自Langran等提出“状态—事件—依据”3种时空数据表达类型后,基于事件的GIS时空数据模型被提出并不断地发展[3]。该类模型的主要特征是同时描述时空变化过程和触发这种变化(事件)的原因与结果,显式存储事件序列,顾及状态与因果关系,最具代表性的模型是ESTDM(Event based Spatio-Temporal Data Model)[4]。在该模型中地理现象的时空变化通过一连串的事件序列和基础网格图层来表达,每一个事件包含了事件发生时间和若干记录不同地理位置上属性变化的组件,通过事件记录地理现象的每一次重要变化,用事件的多个组件来反映现象在空间上的演化结果。后期不同****不断地改进和完善该类模型[5,6,7]以进一步增强地理现象变化的原因及空间语义的表达。但上述研究依然侧重于地理状态变化或起因的描述,缺乏对地理事件时空过程建模及对其所涉及人类活动响应的相关表达与分析。
在地理事件过程分析与模拟方面,由于自然灾害类事件对地表要素的改变在短时间内极为剧烈,因此以往研究多关注自然灾害类事件的影响评估与模拟预测。上世纪90年代以来,自然灾害的遥感监测和高精度灾情评估与预警成为地理事件过程分析的研究核心[8,9,10]。基于卫星遥感的应急制图(Satellite-based Emergency Mapping Systems, SEM)系统被广泛用于自然灾害监测与应急管理中,在海啸、地震、飓风、洪水等灾害的动态过程监测、协调救灾等应急管理中发挥着不可替代的作用[11,12,13,14]。但是由于SEM系统无法提供灾害过程中人类活动和情绪变化的定量监测,依然无法监测灾害事件下的人类活动,但这些信息往往对灾害的紧急救援与管理是至关重要。而关于公共卫生事件的研究,由于其主要依靠流行病调查数据,传统研究主要在GIS时空模型支撑下开展流行病传播链条及区域传播时空差异的分析,2003年SARS流行病研究中GIS的空间分析与模拟发挥了巨大作用[15,16,17]。但这些研究都未能关注流行病对社会公众的时空行为模式、舆论和情感等带来的影响分析,更谈不上对其进行模拟与预测。
随着基于位置服务(Location Based Service, LBS)的数据及社交媒体等网络大数据的爆炸式增长和人类活动大数据定量刻画手段的快速发展,地理事件对人类活动的影响以及公众对地理事件的网络参与度引起了多个领域的广泛关注,进而也对地理事件的时空认知、建模方法和分析框架等提出了巨大的挑战[18,19,20]。当前基于人类活动大数据开展的地理事件相关研究为特定地理事件数据的近实时获取[21,22,23,24,25],人类社交活动强度随地理事件的时空变化分析以及地理事件损失与影响的快速推断[26,27,28,29]等。但上述研究大都针对某次特大事件进行具体地实例分析,对人类活动在某类典型地理事件下响应的区域差异及普适性模式的分析相对缺乏,更谈不上系统分析地理事件中人地关系耦合及其驱动机制。
另一方面,图数据模型的发展和成熟使其逐渐成为应对LBS数据的一种新的表达与建模手段。图数据模型是采用图结构对现实世界进行数据特征抽象与描述的一组概念和定义,是图数据库中数据的存储方式,主要包括数据类型与结构描述、数据操作与查询语言,以及数据完整性规则[30,31,32]。该模型以离散数学的图论为数学基础,通过节点和边来抽象客观世界中的对象和关系[33,34]。目前常见的图数据模型包括属性图模型、超图模型和RDF三元组模型,已成为新的地理时空数据建模手段,并广泛应用于地理时空表达与建模领域[35,36,37]。地理时空图模型是基于传统的图建模思想,提出并不断地完善可以准确的抽象地理对象并表达对象之间空间、时间以及亲缘关系的数据模型[33, 38-41]。相比于传统的地理数据模型,时空图模型一方面继承了地理对象模型对空间、时间和属性整体表达的优点,也实现了地理对象与对象关系的一体化表达。由于采用无索引邻接技术,在处理复杂地理时空关系时具有级跳查询能力[35],相比于地理对象—关系模型具有明显的时空关系查询与分析优势[37],从而为分析复杂的地理事件奠定了基础。当前地理时空图模型的应用主要针对的是具有复杂时空演化关系及行为的地理现象,发现其演化特征和时空模式[34],但对地理事件所引起的人类活动或者级联响应事件的表达涉及较少,亟需加强研究。
因此,综上所述,在人类活动大数据日渐丰富的背景下,地理事件的认知与研究范畴发生了根本性的变化,地理事件不仅其自身演变同时其演变的内因与外因都得到了广泛的关注。但当前的地理事件模型对不同地理现象间的相互关系及作用的表达以及地理事件及事件所引起的人类活动的级联事件表达都涉及的较少,难以开展地理事件演变的前因与后果分析。因此,无论是从GIS数据模型还是从大数据背景下地理事件的分析与挖掘的研究需求出发,都亟需开展融合“人”类活动大数据的地理事件建模与分析,充分发挥地理时空图模型在复杂关系表达上的优势,结合当前地理事件自身特点构建基于地理事件图数据概念模型与分析框架。本文不仅为GIS数据模型研究提供新视角,还能为地理事件级联效应及其人类活动响应的时空规律与区域模式挖掘奠定基础。
2 基于图模型的地理事件建模
2.1 地理事件概念及分类
从时空数据模型研究出发,当前的大数据背景下首先需要拓展的就是地理事件的概念。但目前为止地理事件还没有明确统一的概念,从目前国内外****所关注的地理事件建模与分析研究对象来看,可归纳为两类:以地理变化为主题的事件和以触发变化为主题的事件。前者强调在某时间范围某空间区域地理对象发生了变化,如犯罪、传染病爆发、交通事故、异常变化等,该地理事件不关注发生到结束时间的长短,仅强调发生变化。比如,谢炯等利用地理变元把土地利用变化定义为地理事件[42];郑宇把时空集体异常定义为地理事件[43];薛存金等把海洋环境要素的异常变化过程定义为海洋异常事件等[44]。以触发变化为主题的事件认为地理实体或对象的产生、状态的变化、对象的进化和消亡都由特定事件触发,把引起这种对象变化的事件定义为地理事件。地理事件不仅仅是状态开始和结束的标志,同时也是地理实体或对象演化历程的关系或纽带[45]。驱动对象发生变化的直接原因定义为原子事件,包括对象的产生、发展及消亡,而在宏观尺度下多个具有因果关系的原子事件组成形成复合事件,它对应于一个更宏观的对象变化[46,47,48]。
无论是以地理变化为主题还是以触发地理变化为主题的地理事件表达了地理对象在一定的时空范围内相互关系,这种相互关系既包含了地理对象内部的演变关系[49],也包含了地理对象之间的关联关系[50]。目前地理大数据的发展促进了人地相互关系的研究,特别是地理异常事件对人类活动造成的影响和人类面对异常地理事件时如何快速响应,已成为地理科学研究的热点问题[51],迫切需要新的地理事件模型支撑人地相互关系的研究。因此,本文把地理事件归纳为在一定的时空域内,地理主体对象(现象)的行为或空间结构、属性或组合发生了变化,且这种变化对人类或地理客体对象(现象)造成了重要影响的事件,包括5个基本要素:地理空间、时间、主题属性、对象变化和变化引起的相互关系。本文定义的地理事件以描述人类活动与地理客体对象(对象间)相互作用为主,重点刻画地理事件主体与客体的作用关系,强调主体对象的行为导致客体对象(现象)发生了重要变化并产生重要的影响。如:疫情爆发导致的人类时空行为模式的变化,台风到来引起的城市正常节律的异常,道路交通的管制导致的车流量的异常减少等。
2.2 地理事件语义与图表达模型
地理大数据背景下,迫切需求对人地关系开展研究来解决地理事件的前因后果,因此,地理事件由地理对象(现象)、对象变化和变化引起的相互关系组成。地理对象包括地理空间位置、时间和主题属性3个要素,用于描述地理事件的时空特征;地理对象变化是地理属性、空间位置或空间关系随时间的变化,用于描述地理事件的时空变化,在不同的时间尺度下,地理事件的变化性质存在差异;地理事件的相互作用用于表达地理事件与外界环境的交互,刻画地理事件发生的前因后果:外界地理事件在何时、何地引起了本地理事件的发生发展和本地理事件的变化又如何驱动外界其他地理事件的变化,比如,城市暴雨事件在何时何地引起了城市内涝,而城市内涝又如何引起城市交通拥堵等。地理事件的语义描述框架如图1所示。图1
新窗口打开|下载原图ZIP|生成PPT图1地理事件描述语义
Fig. 1Description semantics of geographic event
根据地理事件描述语义,面向大数据的地理事件可以采用属性图模型进行表达,由2类节点和3类边组成,如图2所示。
图2
新窗口打开|下载原图ZIP|生成PPT图2地理事件图表达模型
Fig. 2Graph representation model of geographic events
地理事件的两类节点包括事件节点和对象节点。事件节点是对象的父节点,用于表达地理事件的空间覆盖范围、持续时间、事件的主题属性和包含的地理对象;对象节点用于表达某时刻的地理对象的空间位置、空间结构、时间信息和主题属性。
地理事件的3类边包括事件—对象的隶属边、对象—对象的演变边和事件—事件的相互作用边。事件—对象的隶属边表达地理事件与地理对象之间的隶属关系,表达地理事件包含多少个地理对象,某个地理对象隶属于哪个地理事件;对象—对象的演变边表达地理对象在时刻间的关系,主要包括发展、合并、分裂、消弱关系,用以表达地理对象在地理事件范围内的演变;事件—事件的相互作用边表达地理事件间的相互作用关系,比如,事件之间的响应关系、驱动关系等。
2.3 地理事件图存储模型
本文采用Neo4j图数据库对地理事件图存储模型进行说明。Neo4j是一款基于图模型的开源数据库,在动态数据存储和关系查询方面比对象—关系数据库具有明显优势[35, 37]。Neo4j由一个节点存储文件和一个关系存储文件存储,节点存储文件用来存储地理事件的两类节点信息:事件节点用于存储地理事件的基本信息,包括事件ID、空间覆盖范围、时间、主题属性类型、属性的基本统计信息等;对象节点用于存储时刻状态对象信息,包括对象ID、空间位置、空间形态、发生时刻、主题属性等。关系存储文件用来存储地理事件的3类边信息:隶属边存储边ID、边类型、父节点ID和子节点ID;相互作用边存储边ID、边类型、前节点ID和后节点ID;演变边存储边ID、边类型、前节点ID和后节点ID。节点存储文件和关系存储文件采用双向链表进行连接,图存储表达模型如图3所示。图3
新窗口打开|下载原图ZIP|生成PPT图3地理事件图存储模型
Fig. 3Graph storage model of geographic event
3 基于大数据的地理事件 分析与挖掘
大数据背景下地理事件的概念得到拓展,重点强调了事件之间的相互作用及其表达。相应地,在分析方法及分析思路上,传统地理事件大都针对事件的自然要素变化进行时空模式挖掘,缺乏对地理事件前因与后果的级联事件分析与挖掘。因此,在上述地理事件概念拓展基础上,对大数据背景下的地理事件分析与挖掘方法体系也亟待深入地拓展。本节针对性地讨论与构建基于地理大数据的事件分析与挖掘框架,设计该框架下地理事件分析与模拟方法,并利用人类活动与人地交互影响的地理演变模式和级联模式来修正和完善地理事件时空表达模型与方法。3.1 地理事件分析与挖掘方法框架
基于地理大数据的地理事件分析与挖掘框架强调在突破传统地理空间对事件概念与认知局限性基础上,深入理解当前重大地理事件在地理活动空间和虚拟网络空间的传播与演化特征,开展地理大数据的事件分析与挖掘,主要包括地理事件多源数据感知与认知模型、地理事件重构、表达与地理事件库构建和地理事件演变行为和级联效应挖掘方法。地理事件多源数据感知与认知模型基于对地观测、位置服务和社交感知大数据等多源数据收集与处理技术,从“自然空间—地理活动空间—虚拟网络”多个空间开展事件时空特征、演化语义、人类情绪、社会反响的特征分析,实现地理事件的多源数据感知和认知。地理事件重构与表达采用传统地理空间的历史事件过程重构和基于大数据驱动事件发现方法两种思路开展典型地理事件案例获取,获取两大类地理事件,其一是具有细粒度演化过程的“天—地—人”交互耦合的事件(具有完整的历史演化过程和多维空间交互作用),其二是粗粒度的具有级联效应地理事件,重点关注事件直接或间接引起的人类各种活动响应事件;然后采用GIS时空演化模型开展地理事件时空过程描述,采用关系模型开展级联事件时空传播的描述与舆情话题时空表达,而整体上采用图数据模型进行地理事件地理空间和虚拟空间一体化表达;最后,基于图数据组织模型开展地理事件的表达和数据建模,构建地理事件库,实现地理事件的组织存储。地理事件演变行为和级联效应挖掘方法基于构建的地理事件数据库,分别从事件时空演化的人类空间行为—舆论—情感等耦合建模和事件所导致的人类行为等区域模式两个不同的视角开展人类活动定量感知方法研究,重点在事件级联效应时空模拟、人类行为、情绪及舆情定量评价方法、时空聚类分析、时空可视化挖掘等方法。基于地理大数据的地理事件分析与挖掘框架如图4所示。图4
新窗口打开|下载原图ZIP|生成PPT图4地理大数据事件分析与挖掘基本框架
Fig. 4Basic framework of geographic big data event analysis and mining
3.2 地理事件发现方法研究
地理事件发现是实现地理大数据事件分析与挖掘的核心,而地理大数据支撑的地理事件发现与传统地理空间的发现具有较大的差异。地理事件发现主要采用两大类方法,其一是历史重大事件的重构方法,其二是基于数据驱动的事件发现方法。传统对地理事件研究更多采用事件重构方法,应用最多领域为自然灾害类突发性事件,分析与建模更多关注于事件发生后地理要素的变化及影响评估。但随着地理事件公众的网络参与度的提升及其演化过程中人类时空、情感和舆论等定量获取技术的发展,对地理事件发现则更多采用数据驱动方法[52,53,54]。然而由于地理事件在地理要素和社交媒体数据呈现的不同时空特征,导致地理事件的数据驱动方法多种多样。总体上,地理事件发现方法可以归纳为基于统计模型、基于时空数据挖掘和基于人工智能的3大类(图5)。① 基于统计模型的事件发现方法:主要包括时空扫描统计、核密度、似然比检验等方法。其中最常用的是时空扫描统计方法,其基本思想是设定一个圆柱形的扫描窗口(圆柱底对应地理区域,圆柱高对应时间),利用扫描窗口内外的实际事件数量和预期事件数量构造检验统计量LLR,统计评价选出LLR最大窗口即为事件时空区域[55,56,57,58]。② 基于时空数据挖掘的事件发现方法:主要包括时空聚类、时间序列分析、时空异常探测和复杂网络挖掘等。时空聚类在传统地理空间的事件发现中普遍使用,近年来主要是结合社交媒体数据等开展新的数据源事件发现与探测研究[59,60,61,62],反映人类时空行为各种时序数据,则主要采用时间序列与时空异常相结合的检测方法[63];而复杂网络时空挖掘则主要针对近年来出现的流数据开展的地理事件发现的常用方法[64]。③ 基于人工智能机器学习的事件发现方法主要是处理反映人类舆情的文本与视频等信息,与自然语言处理所涉及到的方法多有融合,成为网络虚拟空间地理事件发现的热点方法,包括深度信念网络,深度残差网络,深度卷积神经网络等[65,66,67]。图5
新窗口打开|下载原图ZIP|生成PPT图5基于大数据的地理事件发现方法分类
Fig. 5Classification of geographic event discovery methods based on big data
综上,在大数据背景下,地理事件发现方法的本质是面向众源数据,基于地理事件的空间分布特征、时间演变特征、属性特征、或其综合特征,引入地理大数据挖掘的思想,实现地理事件的识别与提取,包括地理事件的影响范围,持续时间及其带来的对地理客体对象(现象)的作用及影响。在地理事件的发现过程中涉及到两个关键问题:其一是如何解决众源数据的有偏及代表性问题;其二是如何解决不同空间中地理事件的一致性匹配与关联问题。这些是后面开展地理事件级联效应分析的技术基础。
3.3 地理事件级联效应分析
随着地理事件发展过程中与人类相关位置信息(主动或被动)的快速收集与处理,对地理事件的分析并不仅仅局限于对客观世界变化的分析与影响评估,更多的涉及人类空间行为、情感与舆情等时空响应及事件级联效应分析。如城市降雨所引起的交通拥堵、公共卫生事件所引发的人类活动变化、舆情关注等。虽然传统地理事件的研究也涉及事件链分析,比如台风引起的降雨和洪涝等,但以往研究由于没有直接涉及人的时空动态分布及情感、舆情等活动分析,其复杂性和跨学科特定并不突出。因此当前在地理大数据快速涌现的情况下,综合分析地理事件演化所引起的地理要素突变、人群时空聚集、舆情与情感的异常特征,用多种时空统计与挖掘方法解析事件的级联效应及其内在因果关系,会成为事件建模与分析必不可少的一部分。基于上述地理事件发现方法获取到相关数据集开展地理事件级联效应分析(图6)。首先,需要对不同空间用不同事件探测方法获取到的地理事件集合进行地理事件的匹配分析。分两个方面开展事件匹配。如果不同空间探测到的是同一次历史事件,则选择时空匹配方法进行该次事件时空演化过程的重构;如果不是同一次历史事件,则从全国—城市—城市内部3个尺度分别开展同类型的相关事件时空语义匹配,构建关联事件多尺度数据集,以图数据模型开展事件及其关联事件的语义关系描述。其次,针对同一历史事件的过程重构,则在精细粒度采用时空可视化、时空一致性、时空关联规则挖掘或深度学习等模型方法开展“自然—地理—人类”多个空间的地理事件级联效应分析及演化模式分析与预测。第三,针对同种类型相互关联的地理事件多尺度数据集,则采用一致性检验、时空聚集模式、时空谱分析、机器学习、及贝叶斯统计分析等方法开展地理事件不同空间交互影响探索性分析,获取同一个或同一类地理事件在不同时空尺度上级联关系及时空聚类模式;上述不同尺度地理事件的级联效应分析为不同层面、不同视角下事件的人类活动感知奠定方法基础。
图6
新窗口打开|下载原图ZIP|生成PPT图6地理事件级联效应分析框架
Fig. 6Cascading effect analysis framework of geographic events
4 实例分析
当短时大量的降水超过城市的排水能力时会导致城市发生积水内涝灾害,严重影响人们的正常出行、工作与生活,甚至危害生命财产安全,因此城市暴雨事件不局限于暴雨事件自身的演变,还会导致人类出行异常,引发城市交通拥堵等级联效应。本文以城市暴雨事件为例,通过含位置信息的大数据感知暴雨事件给城市人类活动带来的异常变化与影响,从事件表达、异常挖掘、级联效应三方面开展实例验证,诠释地理事件建模与分析方法在暴雨事件研究中的价值。4.1 城市暴雨事件时空表达
城市暴雨事件的时空过程及其影响可以通过图数据模型进行表达。基于图模型,可以将最小时间分辨率观测到的降雨过程切片作为一种离散的“状态”节点,状态节点可以记录此刻降雨的强度和范围,而整个降雨事件通过一系列时间相邻的状态节点来表示其时空过程。降雨引发的道路积水、房屋及地下车库淹水等次生事件,也可以通过节点来记录事件发生的时间、损失程度、恢复时间等关键信息,并且可以通过图的连接来描述这些事件与降雨事件之间的事件链关系(图7)。图7
新窗口打开|下载原图ZIP|生成PPT图7城市暴雨事件的图模型表达
Fig. 7Graphical model representation of urban rainstorm events
暴雨事件对城市的影响表现为城市日常节律的扰乱。图数据库中的节点可以记录异常发生的时间、位置及异常程度,从而实现暴雨事件影响的数据表达。由暴雨事件引发的节律异常通常会与暴雨过程在时空上具有一致性或具有时滞的一致性,通过图的连接关联暴雨事件与节律异常,可以表达暴雨事件引发的人类活动异常现象,从而有助于检索和发现事件的影响,为分析暴雨灾害的级联影响提供数据支持。
相比目前常用的关系数据模型,图数据模型更灵活、直观地表达了暴雨事件中降雨动态过程与人类活动异常、受灾状况等不同对象之间复杂的相互关系。与关系型数据库中通过建立暴雨状态表和节律异常表的主键—外键来描述对象关系不同,图模型更灵活地建立了数据对象之间的关系,而非整个数据集之间的关系,降低了数据表达冗余,如4.2节通过异常模式挖掘而发现的暴雨与人类活动之间的响应关系,图数据模型将节律异常和与之关联的降雨状态进行关联,而无需为所有时刻的降雨状态都建立关联。同时,相比传统数据库检索,图数据库在级联检索效率上的优势[35]是实现快速检索与降雨关联的异常和灾情的重要,有效保障了应对灾害的快速响应能力。
4.2 暴雨事件中的人类活动异常特征发现
通过大数据异常挖掘可以识别暴雨事件引发的城市节律异常。以北京市2018年7月16日的暴雨事件为例,本文采集了2018年7月9—16日连续8天的位置请求数据。该数据是手机用户使用腾讯地图位置服务时的位置数据,来自腾讯位置大数据网站(在精细的网格尺度上定位请求量的异常节律检测,首先通过STL时间序列分解方法剔除趋势和周期变化,然后采用GESD统计方法判断残差分量中的正、负异常时间及程度[68]。检测结果以正异常为主,负异常网格数量较少且与暴雨事件无明显响应特征。从时间上统计正异常网格数量与偏离量的逐时变化,发现7月16日8—9时、16—17时、19—20时的值超过一周统计的同期Q3水平,而夜间22—24时低于同期中值(图8)。从空间上统计正异常网格的核密度分布,发现上述时段的异常网格与降雨的空间分布十分一致。可见,暴雨事件引发了定位请求量的节律异常变化,并且这种变化在时间和空间上与降雨的时空过程是比较一致的。
图8
新窗口打开|下载原图ZIP|生成PPT图8北京市2018年7月16日暴雨事件及其人类活动影响
Fig. 8The July 16, 2018 heavy rain event in Beijing and its impact on human activities
4.3 暴雨事件的级联影响分析
基于城市节律的异常变化,本文进一步对暴雨事件对人类活动造成的级联影响及其与城市环境要素之间的关系进行了分析。我们选取了在2017年8月发生了严重暴雨事件的8个城市,构建了异常评分指标来综合每次暴雨事件引发的城市节律正异常在数量、程度和空间密度上的特征,进而分析异常评分指标与降雨强度之间的关系及这种关系在城市间的差异[69](图9)。从降雨强度与异常评分指标的统计结果来看,暴雨事件的降雨强度越大,引发的节律正异常发生概率越高。但不同城市对雨强大小的敏感性存在差异,即引发城市出现人类活动异常的降雨强度在不同城市存在差异。通过拟合各城市雨强与异常评分指标的线性关系,可以发现哈尔滨的回归系数较大,而海口较小,表明同样强度的降雨对哈尔滨的影响要比对海口的影响更大。这种差异表明了理解暴雨事件对人类活动影响还需要考虑城市地理环境的差异。从城市的气候特征(如年均降雨量)和城市排水能力来看,海口的年均降雨量超过1600 mm,超过哈尔滨,同时海口的排水管密度为11.74 km/km2,大于哈尔滨。所以,相比哈尔滨,海口市的居民每年会经历更多的降雨,而城市有效的排水能力保障了居民的正常工作与生活。图9
新窗口打开|下载原图ZIP|生成PPT图9暴雨事件影响的城市间差异
Fig. 9Differences between cities affected by rainstorm events
以上实证研究展示了地理事件的图模型表达和挖掘这套方法体系在描述和理解暴雨事件影响下的人类活动节律变化及其与城市环境因素之间关系的有效性与实用性。与目前暴雨事件的研究方法相比,该方法系统性地将时空图数据表达与异常模式挖掘相结合,不仅有效描述了地理事件的时空变化,更突出了地理事件对“人”的影响,为揭示事件视角下特殊的人地关系提供了有效的研究手段。
5 总结
地理事件的建模与分析是地理信息机理研究的核心内容,但由于各种社交媒体大数据的出现,使得人类对地理事件响应与人—地理事件互影响的研究成为可能,也因此给地理事件的建模与分析带来前所未有挑战。具体为3个方面:① 由于大数据时代,公众对地理事件网络参与度提升,地理事件在改变各种地理要素之外,还在一定程度上引起了人类各种社会、经济、情感等活动的变化,这些对如何界定地理事件提出了挑战,其概念内涵和外延都有很大程度地拓展;② 面对新的地理事件概念及其组成,如何开展地理事件数据建模成为地理事件的关键研究问题。如何从地物要素变化的表达视角转向直接表达“事件”本体及其前因和后果成为大数据时代地理事件数据建模的关键点;③ 如何有效融合“虚拟空间”的地理事件发现与传播模拟分析方法,构建地理大数据支撑下的地理事件时空分析与推理方法框架,实现地理事件下“人—地”交互关系的时空规律与区域模式挖掘成为新时代地理事件分析的核心内容。本文针对上述3项具体挑战,本文详细阐述了地理大数据支撑下的事件建模与分析理论框架,并以城市强降雨为例进行了实例研究。① 界定地理事件为在一定时空域内地理对象(现象)空间结构、属性或组合发生了变化,且对人类或其它地理事件或地理对象造成了影响的事件,从概念上拓宽了地理事件仅仅局限于传统地理空间要素变化的约束;② 采用图数据模型开展地理事件“本体”及其关联事件的表达与建模,使得地理事件的数据建模可以有效地融合传统地理要素变化表达与大数据支撑的“人类活动”的表达;③ 给出了地理大数据支撑下的事件时空分析框架,以地理事件下“人类活动”为桥梁构建地理事件的“地理空间”与“虚拟空间”的一体化级联效应分析与建模;最后以多个城市的暴雨事件开展地理事件不同尺度的一体化分析实例研究,诠释了暴雨事件引起的人类活动响应的时空模式及区域差异。希望通过本文的研究成果,能抛转引玉,激发大数据时代地理事件分析与建模新思路与研究热潮。
参考文献 原文顺序
文献年度倒序
文中引用次数倒序
被引期刊影响因子
[本文引用: 1]
[本文引用: 1]
,
[本文引用: 1]
,
[本文引用: 1]
,
DOI:10.1080/02693799508902022URL [本文引用: 1]
,
URL [本文引用: 1]
,
DOI:10.1080/13658816.2017.1306862URL [本文引用: 1]
,
URL [本文引用: 1]
DOI:10.11821/dlxb201507002 [本文引用: 1]
This paper presented a new conceptual framework by taking account of heat stress, social vulnerability, and population exposure. Meanwhile, an index system combining environmental data, demographics data and socioeconomic data has been built for the quantitative assessment of county-level heat stress risk pattern of China. The counties with the greatest vulnerability scores contain the Tarim Basin in Northwest China, Yudong Plain and Huaibei Plain in North China, Sichuan Basin in Southwest China, Jianghan Plain and Dongting Lake Basin in Central China, and Pearl River Basin in South China. The hot spots of heat stress risk are located in Jianghan Plain and Dongting Lake Basin in Central China, Sichuan Basin in Southwest China, the junction of Jiangsu, Zhejiang and Shanghai in East China, and Pearl River Basin in South China, especially the Pearl River Delta Region. The hot spots of vulnerability are located in counties of high heat stress or high social vulnerability level, while the hot spots of risk mainly consist of metropolitan areas with dense population and advanced economic level. The results of dominant factor partition show that heat stress dominant areas are mainly located in basins or plains which are more prone to high temperature, social vulnerability dominant areas are mainly located in less developed counties, and population exposure dominant areas are mainly located in coastal counties with dense population.
,
[本文引用: 1]
,
URL [本文引用: 1]
,
URL [本文引用: 1]
,
DOI:10.1126/science.aad8728URL [本文引用: 1]
,
[本文引用: 1]
[本文引用: 1]
,
[本文引用: 1]
,
[本文引用: 1]
[本文引用: 1]
,
[本文引用: 1]
[D]. ,
[本文引用: 1]
DOI:10.11821/dlxb201808001 [本文引用: 1]
Since 2010, big data has played a significant role in various fields of science, engineering and society. The paper introduces the concepts of geographic big-data, the fourth paradigm and nonlinear complex geographic system, and discusses interactive relationships of these concepts. It is proposed that geographic big-data and the fourth paradigm would become a new opportunity to research on geography complexity. Then the paper discusses how to use the methods of geographic big-data and complexity science to examine geography complexity. For example, based on big-data, a series of indicators of statistical physics fields could be constructed to describe the complex nonlinear characteristics of the real geographic world. Deep learning, complex network and multi-agent methods can be used to model and simulate the complex nonlinear geographic systems. These methods are important for a better understanding of the complexity of geographic phenomena and processes, as well as the analysis, simulation, inversion and prediction of complex geographic systems. Finally, the paper highlights that the combination of geographic big-data and complexity science would be the mainstream scientific method of geography in the 21st century.
,
[本文引用: 1]
DOI:10.11821/dlxb201903014 [本文引用: 1]
This paper reveals the principle of geographic big data mining and its significance to geographic research. In this paper, big geodata are first categorized into two domains: earth observation big data and human behavior big data. Then, another five attributes except for "5V", including granularity, scope, density, skewness and precision, are summarized regarding big geodata. Based on this, the essence and effect of big geodata mining are uncovered by the following four aspects. First, as the burst of human behavior big data, flow space, where the OD flow is the basic unit instead of the point in traditional space, will become a new presentation form for big geodata. Second, the target of big geodata mining is defined as revealing the spatial pattern and the spatial relationship. Third, spatio-temporal distributions of big geodata can be seen as the overlay of multiple geographic patterns and the patterns may be changed with scale. Fourth, big geodata mining can be viewed as a tool for discovering geographic patterns while the revealed patterns are finally attributed to the outcome of human-land relationship. Big geodata mining methods are categorized into two types in light of mining target, i.e. classification mining and relationship mining. The future research will be facing the following challenges, namely, the aggregation and connection of big geodata, the effective evaluation of mining result and mining "true and useful" knowledge.
,
[本文引用: 1]
[本文引用: 1]
,
[本文引用: 1]
,
URL [本文引用: 1]
,
URL [本文引用: 1]
,
URL [本文引用: 1]
,
[本文引用: 1]
,
DOI:10.1080/01431161.2017.1400193URL [本文引用: 1]
,
URL [本文引用: 1]
,
[本文引用: 1]
,
[本文引用: 1]
,
DOI:10.1111/tgis.v23.1URL [本文引用: 1]
,
DOI:10.1016/j.geomorph.2014.12.024URL [本文引用: 1]
,
[本文引用: 1]
,
DOI:10.1080/13658816.2015.1081910URL [本文引用: 1]
,
DOI:10.1016/j.datak.2012.12.007URL [本文引用: 2]
,
[本文引用: 2]
[本文引用: 4]
,
DOI:10.1080/13658816.2016.1211282URL [本文引用: 1]
,
[本文引用: 3]
,
[本文引用: 1]
,
,
,
[本文引用: 1]
[本文引用: 1]
,
[本文引用: 1]
[本文引用: 1]
,
[本文引用: 1]
,
[本文引用: 1]
,
DOI:10.1023/A:1026565929263URL [本文引用: 1]
,
[本文引用: 1]
,
[本文引用: 1]
,
DOI:10.1080/13658816.2014.890201URL [本文引用: 1]
,
DOI:10.1080/13658816.2015.1042380URL [本文引用: 1]
[本文引用: 1]
,
[本文引用: 1]
,
DOI:10.1080/17538947.2019.1645894URL [本文引用: 1]
,
URL [本文引用: 1]
,
DOI:10.1109/JSTARS.4609443URL [本文引用: 1]
,
URL [本文引用: 1]
,
DOI:10.1080/13658816.2012.724175URL [本文引用: 1]
,
DOI:10.1111/j.1467-9671.2010.01194.xURL [本文引用: 1]
.
DOI:10.1016/j.datak.2013.05.002URL [本文引用: 1]
,
URL [本文引用: 1]
,
DOI:10.1007/s10618-014-0366-xURL [本文引用: 1]
,
DOI:10.1016/j.eswa.2012.02.136URL [本文引用: 1]
,
[本文引用: 1]
,
URL [本文引用: 1]
,
DOI:10.1109/JSTARS.4609443URL [本文引用: 1]
,
[本文引用: 1]
,
[本文引用: 1]
,
[本文引用: 1]
DOI:10.11821/dlxb202003005 [本文引用: 1]
As global climate change intensifies, extreme rainfalls and floods become more frequent and pose a serious threat to urban sustainable development. Fast assessment of the rainfall disaster impact upon urban traffic and population plays an important role in improving disaster emergency management and incident response capabilities. This study adopts a time series anomaly detection method to discover and quantify the impact of rainfall-triggered flood on road traffic and human activities using real-time traffic condition information and mobile phone location request data. The anomaly detection method combines the STL time series decomposition technique and the extreme student deviation statistics to identify the response characteristics of traffic data and location requests during the event. The extreme rainfall event that occurred in Beijing on July 16, 2018 is used as a case study to examine the method effectiveness. The results show that the precipitation peaked in the morning and evening rush hours, during which the number of congested roads exceeded the average level by up to 150%. The anomaly detection analysis indicates that the number of congested roads and the traffic congestion index reached the outlier level. The anomaly analysis of human activity responses shows that the heavy rainfall event also caused an abnormal increase in the number of location requests, and the spatial distribution of the anomalous grids was highly correlated with the rainfall distribution one hour before. The above results not only prove the effectiveness of the big data and the anomaly detection method in understanding the impact of heavy rainfall events on urban traffic and population, but also provide new means for urban emergency response and management against rainfall disasters.
,
[本文引用: 1]
,
[本文引用: 1]