地图是人类日常生活中不可或缺的工具。地图认知作为研究人对地图的感知、学习、记忆、推理和决策的科学,一直以来是地图学基础理论的重要内容。作为地图认知研究的核心,近年来地图视觉认知在相关学科(如心理学、认知科学和计算机视觉)和新的研究手段(如眼动跟踪、脑电和核磁)的促进下取得了一系列新的研究成果。尤其是眼动跟踪方法作为地图视觉认知研究的重要手段之一,越来越受到研究者的关注,为地图视觉认知研究的定量化、实用化提供了有力支撑。本文系统地梳理了2008年以来眼动跟踪方法在地图视觉认知研究中取得的新进展,并将其归纳为6个发展趋势,分别包括:① 刺激材料:从静态地图到动态交互地图;② 研究范围:从地图认知到地图空间认知;③ 实验环境:从实验室环境到真实环境;④ 地图维度:从二维地图到三维地图;⑤ 个体差异:从单一维度到多维度;⑥ 研究目的:从规律探究到实践应用。本文最后总结了未来研究面临的挑战、难点和可能的解决方法,期望能在地图视觉认知研究中起到抛砖引玉的作用。

Maps are a necessity in people's lives. Map cognition research, a science of investigating perception, learning, memory, reasoning and decision making of maps, has long been an important issue in the foundation of cartography. As a core part of map cognition research, studies on visual cognition of maps have made a series of achievements promoted by advancements of related fields (e.g., psychology, cognitive science and computer vision) and new techniques (e.g., eye tracking, EEG and functional magnetic resonance imaging). Particularly, eye tracking approach has gained much attention, which has been used as a crucial method to investigate map cognition. This paper reviews the new progress of eye tracking based visual cognition of maps which have been made since 2008. We summarized these progresses in six aspects: (1) stimulus: from static maps to dynamic and interactive maps; (2) research extent: from map cognition to map-based spatial cognition; (3) experiment environment: from lab environment to real environment; (4) map dimension: from 2D to 3D; (5) individual differences: from single dimension to multiple dimensions; (6) research purpose: from theory exploration to application. We also summarized future research challenges, difficulties and possible solutions. We hope this review can serve as an initial effort to open more endeavor for future eye tracking investigations into map cognition.

Keywords:eye tracking;visual attention;map design;usability evaluation;map-based spatial cognition;pedestrian navigation

1 引言

地图是对复杂地理空间信息的抽象化表达,自诞生之日起就成为了人们认识自然和社会现象的有效工具。20世纪40年代,美国认知心理学家Tolman开创性地使用现代实验方法研究了小鼠与人类在迷宫中的寻路能力,首次提出了“认知地图”(cognitive maps)的概念[1]。到20世纪60年代,Golledge将动物的空间认知研究推广到人类空间活动的认知研究中,奠定了地理空间认知研究的基础[2]。从20世纪90年代中期开始,地理空间认知在地理信息科学中得到了长足的发展[3]。作为地理空间认知的重要组成部分,地图认知研究的是人类对地图的感知、学习、记忆、推理与传输空间信息的过程和机理。1995年美国国家地理信息与分析中心(NCGIA)将地理空间认知模型研究列入地理信息科学的三大战略领域之一[4]。21世纪初,国际制图协会(ICA)就将认知与可用性问题作为本世纪地理信息可视化的4个研究主题之一[5,6]。地图认知理论与制图综合理论、地图信息传输理论、地图符号理论等成为现代地图学理论的基本内容[7,8,9,10]
眼动跟踪方法为地图认知研究提供了一条新的途径。俗话说“眼睛是心灵的窗户”,视觉是人类所有感官中能力最强的感官通道,眼睛的运动(即:眼动)反映了大脑的视觉信息处理过程[11]。文献表明,人类大脑多达40%的功能都用来处理视觉信息[12]。因此,使用精密仪器(眼动仪)记录眼球的运动并以此分析视觉认知规律和大脑信息处理过程就成为认知研究中最自然的研究手段。眼动跟踪方法从20世纪60年代开始应用于心理学、神经科学的研究中[13,14],此后,在70年代初被引入地图学与地理信息科学中。地图学眼动研究在经历了发展期(20世纪70年代-80年代末)和沉寂期(20世纪80年代末-20世纪末)之后重新受到****的重视,在过去的10多年中,国内外以眼动跟踪为手段的地图视觉认知研究在理论和应用上取得了一系列新的研究成果,地图学眼动研究焕发出新的活力。因此,本文试图总结2008年以来国内外的地图学眼动研究取得的新进展,并分析当前研究面临的挑战,期望能在地图视觉认知研究中起到抛砖引玉的作用。20世纪至21世纪初的相关研究不在本文的关注范围,读者可参阅文献[3, 15-16]

2 眼动跟踪方法

-->Fig. 1Typical procedure of eye tracking experiments

图2两种类别的眼动研究所用的刺激材料示例 (a. b. c. 心理学驱动[21];d. 可用性驱动[20])
-->Fig. 2Example stimuli of the two types of user studies in (a, b, c) psychology-driven studies [21] and in (d) UE-driven studies [20]

(2)可用性工程驱动(usability engineering, UE-driven)的眼动研究:源于可用性工程[22],核心在于评价地图产品的功能是否达到要求,常用的方法是评价地图的有效性(effectiveness)、效率(efficiency)和用户满意度(satisfactory)[23],目的在于发现地图设计中的问题,用来改进地图设计、寻求可迁移到其他类似情况下的地图设计原则,虽然实验流程与心理学驱动研究类似,但是对实验的控制程度较低。该类型的研究通常需要对完整的、真实的地图设计进行评价,以此来提高实验的生态效度(ecological validity)[24],缺点在于只能得到相关关系而非因果关系。
可以看出,眼动跟踪方法作为一个技术手段,既可以应用心理学驱动的方法来探求地图视觉认知规律,又可以应用可用性工程驱动的方法来评价地图设计。因此,眼动跟踪方法可以很好地与地图设计的各个阶段相结合。具体来说,通过眼动跟踪方法挖掘得到的视觉认知规律可以使用“以用户为中心”(user-centered design, UCD)的方法应用于地图设计,即通过:用户认知规律挖掘→地图原型设计→地图可用性评价→地图设计改进→地图再评价的迭代流程来设计满足用户需求、高可用性的地图。相比于传统地图设计流程中强调制图者的设计水平,UCD方法更强调让用户参与规律挖掘、需求分析和地图评价的过程,从而提高地图的可用性。
通过眼动实验收集到眼动数据以后,需要对原始眼动数据进行统计分析,检验不同组别(自变量的不同水平)之间的差异是否具有统计学意义,从而完成假设检验过程。自变量可以是不同时段(如训练前和训练后)[25]、不同用户群体(如专家和新手)[26]、不同地图类型(如二维地图和三维地图)[27]、不同的感兴趣区(AOI)(如图例的不同位置)[28]等,比较的内容是各类眼动指标。不同的眼动指标能够反映大脑视觉信息处理过程的不同特征,这是使用眼动跟踪方法研究地图视觉认知的基础。基本的眼动行为可以分为两类:一类是眼跳(saccade),有的文献中也译作“扫视”,即眼球的快速移动(通常移动速度高达500°/s);另一类是注视(fixation),即眼跳之后保持相对静止(持续时间约200~300 ms)[29]。研究表明,人的视觉系统在眼跳的过程中受到抑制,因而几乎不处理视觉信息,视觉信息处理主要发生在注视的过程中[30]。因此,眼跳和注视两个基本特征能够分别表征视觉搜索和信息处理过程,再结合AOI,可以衍生出一系列的眼动指标用于统计分析。此外,大脑认知负担的变化会引起瞳孔大小的变化,因此,瞳孔大小的相关参数也常用于表征大脑认知负担的高低[31]。本文把常见的眼动指标按照其所反映的认知规律分成三大类,即基于注视点的信息处理指标、基于眼跳的视觉搜索指标、以及基于瞳孔大小的认知负担指标。表1分别列出了常见眼动指标及其认知意义[32,33,34,35,36]
Tab. 1
Tab. 1Common eye movement metrics and their cognitive meaning

将眼动数据可视化是辅助分析的常用方法[37]图3)。比如,注视轨迹图和热点图能够直观地显示被试的注视点空间分布,为进一步的分析提供初步的、定性的证据。其它的可视化方法还包括:① 眼动轨迹综合:由于多个被试的眼动轨迹叠加容易造成视觉上的混乱,因此可以对眼动轨迹进行简化、综合,或者制作轨迹密度图,从而更清晰地表达眼动的整体分布规律[38];② 时空立方体(Space-Time-Cube, STC)分析法:Li等借鉴了H?gerstrand提出的时空立方体[39],将眼动数据用STC可视化并进行分析[40]。眼动数据可视化能方便地解决视觉注意“在哪里”和“多久”的问题,但更重要的是要解决“是什么”和“为什么”的问题。
图3眼动数据可视化示例[41] (a. 注视点轨迹图;b. 注视热点图;c. 眼跳密度图;d. 注视点时间序列)
-->Fig. 3Illustration of visual analytics of eye movement data[41]. (a. Eye movement trajectories; b. Fixation heat maps; c. Saccade density maps; d. Time series of eye movement trajectories)

3 国内外研究新进展


3.1 刺激材料:从静态地图到动态交互地图

不同于一般的自然场景图像,地图是经过高度概括综合的图形模型。地图视觉变量是信息传输的载体,不同地图形状、符号和注记的有机组合形成了复杂各异的地图表达。系统化地研究自底向上(bottom-up)的地图视觉变量的认知机理是地图视觉认知一直关注的内容,相关的研究内容包括地图注记[20, 42]、图例[28]、颜色和字体[43]、源—目的地(origin-destination, OD)图[44]、地图感知复杂度[45]等。
-->Fig. 4Eye tracking studies for animated maps and interactive maps[49,50]


3.2 研究范围:从地图认知到地图空间认知

近年来的地图学眼动研究越来越关注地图空间认知。由瑞士苏黎世联邦理工学院(ETH)Martin Raubal团队发起和组织的眼动空间认知会议从2013年开始至今已经举办了3届(ET4S: http://spatialeyetracking.org/et4s-2018/)。基于眼动的地图空间认知研究也吸引了来自心理学、计算机和人机交互等领域的****的参与[53]

3.3 实验环境:从实验室环境到真实环境

地图空间认知离不开真实环境,理想的情况是在真实环境中开展实验。但是由于真实环境的动态性和复杂性,在真实环境中开展眼动研究面临诸多挑战。比如,真实环境中的视觉刺激是不可控的、要将被试从一个环境换到另一个环境也不便利,并且会在转移的过程中使被试产生学习效应。此外,真实环境下的眼动数据质量容易受到太阳光照的影响[56]。以往的研究大多是在实验室环境下使用虚拟环境或虚拟现实来模型真实环 境[57,58,59,60]。与真实环境相比,虚拟环境灵活性高、易于管理和组织、更方便采集到高质量的眼动数据、可控程度高。但是虚拟环境也存在一些缺点,比如在虚拟环境中运动缺乏“本体感受”、较难维持良好的“态势感知”(situation awareness)、容易迷失方向等[61],因此,虚拟环境不能作为真实实验环境的代替品。
通过将眼动追踪设备嵌入眼镜当中(如SMI ETG, Tobii Glasses),使得眼动跟踪 可以脱离实验室环境的束缚能够在室外真实环境中进行(图5),越来越受到研究者的关注[53, 56, 62-64],基于便携式眼动仪的穿戴计算拥有新的发展前景[65]。比如,Kiefer等使用头戴式眼动仪开展真实环境下的地图和环境匹配实验用来研究人的空间定位定向过程[66]。在该实验中,被试站在一个固定的位置,通过对比给定的地图与其所处的环境来判断自己在地图上的位置。结果表明,与判断错误的被试相比,判断正确的被试分配了更多的视觉注意到有用的地图符号上,并且他们在匹配这些符号和真实环境中的路标时,视觉注意在地图与真实环境之间的转换次数也更多。
-->Fig. 5Eye tracking experiments in real environments

需要注意的是,真实环境既可以是室外开阔环境(比如城市街道、公园等),也可以是室内封闭环境(比如大楼、地铁站、商场等),使用便携式眼动仪进行室内场景的空间认知研究也是近年来研究者关注的一个重要方向。比如,Ohm等使用SMI ETG收集被试在室内环境中寻路的眼动数据,通过对比被试使用不同的导航地图寻路的表现来评价不同细节程度的地图的优劣[67]。Wang等通过开展商场内的地图寻路实验分析不同年龄和性别的眼动差异[68]
真实环境下的眼动研究面临的一个挑战是如何分析基于动态刺激材料的眼动数据。由于环境在不断发生变化,被试在环境中的动作也各不相同,因此不同被试的眼动数据不能直接对比[69]。传统的分析方法是手工对数据进行分析,比如逐帧查看眼动数据,然后将被试看到的物体记录下来进行分析[64]、创建动态AOI[27, 70]、手工将每一个注视点标定到参考图像上[71]。但是真实环境下实验采集得到的视频数据量非常大,手工对这些数据进行分析非常耗时,且可靠性很难保证。

3.4 地图维度:从二维地图到三维地图

三维地图认知与设计是一个很大的话题,本文仅侧重探讨眼动跟踪方法在三维地图符号设计中的应用。近年来的地图学眼动研究开始关注三维地图的视觉认知问题,已有一些****对三维地图符号及其视觉参量进行了研究,包括视场角和观察角度[79]图6a)、三维视觉变量的引导性和恒常性[80]、三维符号的抽象程度[81,82]等。Liao等对比了用户在使用真实感三维表达(Realistic 3D representation)和传统二维地图在寻路时的视觉差异,发现两者的优劣取决于用户的任务:传统二维地图更利于空间知识获取,这是由于真实感三维表达包含过多冗余信息,导致用户进行了大量冗余的视觉搜索;而三维表达则更利于复杂路口决策,这是因为真实感三维表达有助于路标识别,从而使用户在复杂路口时进行空间定位和定向的效率更高(图6b~6c)[60]。Lei等通过眼动实验发现与二维地图相比,使用三维地图时的平均单个注视点的注视时长更长,注视点更聚集、观察角度更小。作者推测这有可能是由于三维地图在细节上有更高的视觉复杂度引起的[83]。此后的研究表明,二、三维的混合表达可以使它们的优势互补,不管是三维符号和二维符号的混合(图6d~6e)[27],还是真实感和非真实感(Non-realistic)三维符号的混合[84],都更有利于空间记忆。
图6眼动跟踪研究三维地图[27, 60, 79]
-->Fig. 6An eye tracking studies investigating 3D maps[27, 60, 79]

3.5 个体差异:从单一维度到多维度

研究人员还进一步探索了使用定量模型方法来分析用户分类和个体差异,从而对用户的地图阅读能力和地图空间能力进行定量建模。比如,郑束蕾等使用聚类分析和判别分析对不同性别、年龄、教育水平、职业和收入的地图用户进行自动分类[91]。郑束蕾等还通过分析不同被试的眼动(行为)参数,揭示了地图的个性化认知特点并构建了以眼动指标为基础的个性化地图认知适合度评估模型,为个性化地图的设计提供理论和方法基础[92]。Dong等强调地理教育在提升个人地图空间认知能力中所发挥的重要作用[90, 93],提出了以地图空间认知能力为核心的“图商”的概念,并基于多种眼动指标建立贝叶斯结构方程模型来评价用户的地图空间认知能力,从而将个体差异的研究定量化、模型化,将群体差异研究细化到真正的“个体”差异研究[94]

3.6 研究目的:从规律探究到实践应用

(3)用户行为预测。智慧地图服务的一个前提是识别和预测用户的行为、挖掘用户的行为模式[19, 63, 104],在此基础上进行信息推荐。传统的方法是用户通过交互显式地将自己的需求输入系统,而当前的研究主要使用机器学习和数据挖掘的方法从眼动数据中预测用户行为,属于隐式交互。比如,Kiefer等从用户阅读地图的眼动数据中提取了229个特征,使用支持向量机(SVM)对眼动特征进行学习,并以此预测用户的6种阅读行为,最高达到了77.7%的总体分类精度[105]。Liao等对真实环境中的行人导航场景中的眼动数据进行特征提取,基于随机森林分类器推断行人在导航期间的五种常见任务,最高达到67%的总体精度[106]。Krejtz等通过探测用户注视位置和周边信息进行信息推荐[107]

4 未来研究挑战


5 总结与展望

The authors have declared that no competing interests exist.

相关话题/地图 视觉 空间 信息 环境