Different perceptions of Beijing's destination images from tourists: An analysis of Flickr photos based on deep learning method
DENGNing收稿日期:2018-10-8
修回日期:2019-02-16
网络出版日期:2019-03-20
版权声明:2019《资源科学》编辑部《资源科学》编辑部
基金资助:
作者简介:
-->
展开
摘要
关键词:
Abstract
Keywords:
-->0
PDF (12809KB)元数据多维度评价相关文章收藏文章
本文引用格式导出EndNoteRisBibtex收藏本文-->
1 引言
旅游目的地形象是目的地营销和管理的重要内容,代表了旅游者对目的地的印象和观点,其形成受旅游者所处的文化因素影响,因而不同文化背景的旅游者对目的地的感知存在差异[1,2,3]。一方面,随着社交媒体的快速发展,越来越多的旅游者利用社交媒体分享旅游经历、交流互动,从被动的信息接收者变为目的地形象的建构者和传播者;另一方面,由“用户所产生的内容”(User Generated Content,UGC)成为潜在旅游者获取信息的重要来源,影响着他们对目的地的感知及旅游决策。基于UGC所传播的目的地投射形象,区别于传统由目的地营销机构(Destination Marketing Organization, DMO)所刻意传播的目的地形象,越来越成为目的地营销研究的重点。其中图片又以直观具象的特点成为目的地形象跨文化、跨语境传播的重要载体,丰富的UGC图片数据可为目的地形象研究提供新的维度。在UGC图片的目的地形象研究中,人工对图片内容进行编码的分析法应用最为广泛,其分析准确率较高,但分析样本数量有限。而UGC图片动辄数以万计的样本量,使传统图片分析方法无法满足其分析需要。已有相关研究采用计算机技术自动化分析UGC图片元数据(Metadata)中用户自定义的信息(例如图片名称、标签、描述等)及图片评论[4],拓宽了目的地形象研究方法和思路,但仍停留在图片元数据文本分析阶段,对更多缺乏用户标签的图片不具普适性。鉴于此,本文首次将深度学习方法引入旅游图片分析中,以中国港澳台(中国的香港特别行政区、澳门特别行政区和台湾省)、英国和美国这3个地区和国家入境游客发布在Flickr上的北京图片作为研究样本,通过计算机自动化的解析海量UGC图片内容和其隐含的情感,比较不同文化背景游客关于北京目的地形象感知情况。该方法可弥补图片人工编码在样本数量和效率方面的不足,充分发挥海量UGC数据在数据完整性、客观性等方面的价值,为目的地形象测量方法创新提供了有益的尝试,丰富了跨文化、跨语境下的目的地形象研究的数据维度和测量方法。
2 研究综述
2.1 跨文化的目的地形象研究
目的地形象作为旅游研究中的热点,在目的地营销中扮演重要角色,是游客选择目的地的重要依据[5,6,7,8]。Crompton提出目的地形象是个体对目的地的观点、观念及印象总和[9]。Baloglu等进一步将情感作为重要的部分加以考虑[10]。Beerli等认为目的地形象应该包含认知形象和情感形象2个方面[11]。李蕾蕾提出旅游目的地形象是旅游者对地理环境实体的感知,以及对旅游目的地人文环境的抽象感知,旅游者通过各种途径(如实地旅游、间接了解等)认知并获得目的地的印象[12]。杨永德等通过总结相关研究,提出目的地构成是形象内部的组成部分,包括形象主观构成(认知形象、情感形象和总体形象)和客体属性(一般性和特有性)[13]。多数相关研究认为,认知形象(Cognitive Image)和情感形象(Affective Image)是目的地形象建构的主要方面, 并在具体研究中得到论证[13,14,15]。其中,认知形象是关于目的地的特征或者属性的印象,聚焦于建筑、自然风光、人物等特定的对象[7];情感形象是对旅游目的地的一种主观的、情绪化的印象[16],通常以“雄伟壮观的”“多姿多彩的”“趣味十足的”等形容词表示[17]。由于人的情感复杂多变,Phillips等认为应避免将情感简单地划分为积极和消极2个维度[18]。认知是情感产生的基础,情感是认知的延伸,两者结合构成目的地整体形象,从而对目的地产生正面或者负面的评价,直接影响旅游者前往和推荐目的地的意愿[19,20,21]。文化是影响个体行为的重要因素,不同文化背景的旅游者对目的地的感知可能不同[22]。由于文化常常以对比形式呈现,而以国籍代表文化被证实具有一定的可行性和有效性[23]。跨文化研究集中在不同文化群体的旅游动机、旅游偏好、旅游产品评价以及目的地形象感知等方面[24,25],但以图片为媒介的跨文化研究较少。已有研究中,Mackay等选择美籍研究生和在美的中国台湾研究生2个群体,以图片实验法研究2个群体对加拿大阿尔伯塔省的目的地感知。结果表明,台湾受访者倾向于认为水是自然、和平的,美国受访者则认为水与未知世界、自然有关[2]。Stepchenkova等研究者通过旅游图片分析韩国和美国游客关于俄罗斯认知形象的差异,发现两国游客在城市、建筑、文化等方面认知相似,但韩国游客对观光等休闲活动表现出更强烈的兴趣[26]。基于跨文化背景的目的地形象一般都存在差异,这在一定程度上证实了文化对目的地形象建构的影响力[1]。问卷调查、访谈等仍是当前目的地形象差异研究的主流方法,鲜有文献利用UGC图片对目的地形象进行分析和比较。基于上述考虑,本文以Flickr上不同文化群体发布的UGC图片内容作为研究样本,利用大数据和深度学习技术探讨目的地形象感知异同。
2.2 基于UGC图片的旅游目的地形象研究
目的地形象根据其主体的不同一般可分为投射形象和感知形象。其中投射形象是DMO或各种投射主体有意(Intentional)或无意(Unintentional)传递的关于目的地的各种信息、印象等的总和,可直接影响潜在游客对于目的地的感受和旅游决策[27],本文所研究的UGC图片便属于后者。由UGC发布的内容比由旅游目的地营销组织(Destination Marketing Organization , DMO)发布的信息更能引起旅游者的信赖和共鸣[28],已成为潜在旅游者重要且可靠的信息来源;另一方面,DMO作为传统意义上信息“中心”的功能被逐步削弱[29],目的地形象的传播从由DMO主导变为由UGC和DMO共同主导,聚焦UGC内容成为目的地营销的关键[30]。同时,由于UGC数据具备可获取性高、成本低的优点,现已被广泛应用于旅游研究[31]。随着文本分析方法的逐步成熟,越来越多的旅游研究聚焦于游客发布的海量旅游图片[32]。与文本相比,图片是旅游者关于目的地认知的视觉化表达,蕴藏了丰富的目的地信息,为旅游研究提供了新的素材和视角[8,33,34]。近年来,基于UGC图片的目的地形象研究已成为热点。研究方法上,内容分析法仍是最常用的方法,即按照一定规则对图片表征进行内容量化[17,35-37]。囿于时间、人力方面限制,内容分析法适用于小样本的数量分析,其样本总数一般不超过3000张。而当面对数据量动辄上万的UGC图片数据时,采用传统人工编码的方法显然难以胜任。有限数量的照片通常反映目的地形象的某一局部,影响形象感知的完整性和客观性。为分析UGC图片,研究者利用计算机文本分析处理海量图片元数据中用户自定义的内容(包含图片名称、标签、描述等),为目的地形象测量提供了新方法,更多的是利用图片附加的文本信息间接分析图片内容[4]。而计算机领域图片分析技术在图片的低层次特征(如颜色、纹理、形状等)与图片所表达的高级信息(如情感、隐喻等)之间存在一定的“情感差距”和“语义鸿沟”(Semantic Gap)[38]。因此,利用更为智能、自动化的图片分析方法成为目的地形象研究新的重点,随着计算机深度学习方法逐步成熟,为UGC图片分析提供了新的研究技术。
2.3 深度学习
伴随着计算机深度学习技术的发展,卷积神经网络(Convolutional Neural Networks,CNN)已被广泛应用于图像分类、物体检索、人脸识别等领域,极大地提高了图像识别的准确率[39,40]。Krizhevsky等首次将深度学习卷积神经网络用于大规模图像识别并取得了84.7%的准确率[41]。在基于CNN的图像物体检测方面,Girshick等提出了R-CNN模型用于图像物体差异检测,在PASCAL VOC的物体检测数据集上取得了比传统算法高约20%的平均准确率[42]。Li等则利用深度神经网络在移动终端进行皮肤癌测试,其效果与皮肤医生诊断类似[43]。此外,一些研究也开始利用深度学习算法分析图片内容和蕴含的潜在情感[44]。Chen等设计了图片情感分析器——DeepSenti Bank[45],利用CNN分析将图片解析成为形容词与名词的组合(Adjective-Noun Pair,ANP)。本文利用其分析Flickr上的北京相关图片,突破了已有图片自动化分析方法对图片自带文本信息的依赖,提供了一种普适性更强的图片分析方法。3 研究案例地及数据来源
3.1 研究案例地与游客来源
北京是中国的首都,全国的政治、文化、科技创新和国际交往中心,也是世界著名的历史文化名城和古都之一,拥有故宫、颐和园、八达岭长城等具有全球影响力的旅游资源,在研究入境游客方面具有典型性。选择中国港澳台、英国和美国作为研究主体基于2个方面考量:一是中国港澳台、英国和美国作为北京的入境旅游主要客源地,有针对性地分析其不同文化旅游者对北京旅游的关注点以及情感倾向,具有对外营销意义;二是具有文化代表性和地域典型性,中国港澳台属于东方文化,英国和美国分属欧洲和美洲国家,是西方文化的典型代表,可了解不同文化背景的旅游者对北京形象的感知差异。3.2 数据来源
本文主要从图片社交平台Flickr获取图片以及元数据。Flickr成立于2004年,因具有海量的图片和开放性的获取方式,已成为旅游图片研究最主要的数据来源。2015年7月,Flickr发布了一个面向图片研究的元数据集合——YFCC 100M[46],其涵盖了2004—2014年间Flickr上9920万张图片和视频的元数据信息,包括照片ID、使用者ID、昵称、图片拍摄时间、经纬度、图片下载地址、图片标签等信息。基于北京大致的地理坐标范围(北纬39°36′4.32″-41°02′26.91″,东经115°47′55.78″-117°19′58.49″),对YFCC 100M中2004—2014年间的数据进行数据清洗;同时,利用Flickr API1)( 1) Flickr API 下载地址为https://github.com/alexis-mignon/python-flickr-api。)(Flickr Application Programming Interface)获取图片原图及拍摄者的常驻地信息。最终获得符合以上要求的图片27054张,其中中国港澳台5134张、英国4090张、美国17830张,构成了北京旅游形象差异比较的研究样本。
4 研究方法
4.1 基于深度学习的图片分析
4.1.1 卷积神经网络卷积神经网络(Convolutional Neural Networks,CNN)是深度学习算法在图像处理领域的一个应用[47,48]。其工作原理如图1所示,它的基本结构由输入层、卷积层(Convolutional Layer)、池化层(Pooling Layer)、全连接层(Full Connection)和输出层组成。
显示原图|下载原图ZIP|生成PPT
图1卷积神经网络图片识别原理示意图
-->Figure 1Illustration of photo recognition using convolutional neural networks (CNN)
-->
一个典型的CNN网络结构为:输入→卷积→ReLU→卷积→ReLU→池化→ReLU→卷积→ReLU→池化→全连接。其中ReLU(Rectified Linear Unit)是线性纠正单元,作为激活函数控制卷积层的输出映射,形式为:
(1)输入层。CNN用于图像处理时,输入是图像的像素数矩阵(例如,若图像大小为a×a,则神经网的输入a×a×3的矩阵,其中3表示像素点RGB数值)。输出则是一个一维向量,其中向量长度表示分类类别,向量中的各个值则表示图像隶属于此类别的概率大小。
(2)卷积层。CNN模型在输入层之后连接卷积层,用于捕获图像的局部特征。卷积层通过h×h的卷积核(过滤器filter)为输入矩阵中的每一个元素赋予一个权重,并加权求和,使一个卷积核面积大小部分上的输入矩阵变为一个数;再通过固定步长横向,纵向移动这个卷积窗口,形成若干特征图;其中h为卷积核尺寸或卷积窗口大小。一般会选用多种尺寸的卷积核,使模型可以得到多种不同的特征图,进而学习到不同的局部特征。
(3)池化层。池化层连接于卷积层之后,为卷积层得到的特征图进行降维,从而得到特征图中最明确的局部特征,减少图像的空间大小。池化层的最常见形式是最大池化(Max Pooling)。池化在每一个纵深维度上独自完成,因此图像的纵深保持不变。
(4)全连接层。CNN中的输出层是全连接层,它连接于池化层之后,由2层构成:第1层是负责整合池化层输出的局部特征信息的隐藏层,其与上一层池化层的所有神经元节点进行全连接;第2层是连接在隐藏层之后的分类层,其负责进行分类,最后输出图像所属类别。
(5)反向传播。每层中卷积核参数,权重矩阵W成了特征提取的关键。卷积核的确定,或者各层权重值的确定需要通过“训练”得到。以上从输入层开始到输出层结束的过程称为前向传播。但神经网络模型的训练还需要通过BP算法(Back Propagation)进行后向传播。通过计算输出值和期望值之间的误差(损失函数),不断调整权重矩阵W,提高分类的准确度的过程,后向传播开始于神经网络的输出层,并逐层向前传递。损失函数如下:
根据以上损失函数计算输出值和期望值之间的误差。一个训练周期由单次正向和反向传递完成。对每一训练图片,程序将重复固定数目的周期过程。一旦完成了最后训练样本上的参数更新,网络有望得到足够好的训练,以便层级中的权重得到正确调整。
4.1.2 DeepSentiBank
本文欲探究不同文化背景旅游者对目的地图片情感认知,使用了哥伦比亚大学Chen等研究者基于图片深度学习研发的分析工具——DeepSenti Bank[45],可有效提取UGC图片中内容和情感关键词,输出结果以“形容词+名词”(Adjective Noun Pairs,ANP)的形式表征图像内容,其原理如图2所示。例如一张北京故宫相关的图片,可被DeepSentiBank解析为一组包含2089项(该图仅列出前5项)ANP的数据结果,根据ANP与图片内容的相关性进行排序,排序靠前的ANP数值越大,表示其与图片内容越相关。DeepSentiBank通过将图片信息转化为文本,构建了UGC图片目的地形象分析的基础。
显示原图|下载原图ZIP|生成PPT
图2基于DeepSentiBank的图片内容分析
-->Figure 2Image content analysis based on DeepSentiBank
-->
4.2 研究设计
本文主要分析UGC图片中的目的地形象构成要素,遵循“认知—情感”的结构理论,利用深度学习算法分析图片表征内容,利用计算机编程语言Python 2.72)( 2) python官方网站为https://www.python.org/。)编写程序分析数据。具体操作上,利用DeepSentiBank对图片进行解析,所得到的分析结果以“形容词+名词”形式呈现,其中的名词部分是对图片内容的描述,亦即目的地认知形象的体现;形容词则反映了拍摄者对特定对象的情感倾向性,在一定程度上可视为情感形象的体现。本文技术路线如图3所示。显示原图|下载原图ZIP|生成PPT
图3基于海量UGC图片的目的地形象感知研究方法示意图
-->Figure 3Illustration of the destination image perception research method based on user generated content (UGC) photos
-->
该研究设计可分为以下4个步骤:①北京相关图片采集。根据北京市域范围坐标对YFCC 100M中北京相关数据进行清洗,得到符合要求的北京图片数据并利用Flickr API为其标注拍摄者常驻地信息;②原始图片解析。利用不同客源地的游客图片元数据信息下载原图,并利用DeepSentiBank对图片进行解析,得到不同来源地游客拍摄图片的ANP集合;③目的地形象关键词提取。对ANP集合进行文本分析,根据客源地不同分别对其目的地形象关键词进行归类;④目的地形象对比分析。对不同来源地游客所摄图片的目的地形象关键词进行词频对比和分类对比,并分析其差异产生的可能原因。
5 研究结果与分析
5.1 研究结果
5.1.1 认知形象(1)认知高频词对比
认知形象表达了旅游者对目的地内容的关注,本文将每张图片通过DeepSentiBank所解析得到的前500项ANP进行词频分析,其中的名词部分视为北京认知形象的体现。表1显示了不同来源地游客对北京认知形象中排名前30的高频名词。由表1可知,在几乎所有来源地游客的认知形象中,建筑、建筑艺术、城市、街道、食物等名词频次都较高,反映了中国港澳台、英、美旅游者关注焦点具有相似性;但不同来源地游客对图片所反映的内容呈现出不同的倾向性,具体表现在名词高频词排序方面的差异。如宫殿在中国港澳台与英国旅游者拍摄的图片中出现频率较高,而美国旅游者拍摄的这部分内容并没有出现在前30项的高频词中。
Table 1
表1
表1北京相关图片信息中名词高频词统计表(前30项)
Table 1High-frequency nouns of the Beijing related photos (top 30)
中国港澳台 | 英国 | 美国 | |||||
---|---|---|---|---|---|---|---|
名词 | 词频 | 名词 | 词频 | 名词 | 词频 | ||
建筑 | 208 | 建筑艺术 | 203 | 建筑艺术 | 622 | ||
建筑艺术 | 201 | 城市 | 175 | 建筑 | 609 | ||
城市 | 177 | 建筑 | 171 | 城市 | 605 | ||
食物 | 150 | 街道 | 129 | 食物 | 459 | ||
街道 | 137 | 鸟瞰风景 | 80 | 街道 | 447 | ||
房屋 | 88 | 房屋 | 79 | 房屋 | 312 | ||
脸 | 67 | 食物 | 76 | 鸟瞰风景 | 290 | ||
狗 | 67 | 石桥 | 53 | 脸 | 271 | ||
鸟瞰风景 | 62 | 脸 | 50 | 狗 | 198 | ||
雕塑 | 56 | 教堂 | 48 | 人们 | 186 | ||
人们 | 54 | 湖 | 47 | 雕塑 | 185 | ||
石桥 | 49 | 公园 | 46 | 石桥 | 181 | ||
猫 | 49 | 雕塑 | 44 | 女孩 | 174 | ||
教堂 | 46 | 人们 | 42 | 教堂 | 159 | ||
冬天 | 45 | 餐厅 | 41 | 公园 | 155 | ||
湖 | 44 | 堡垒 | 40 | 猫 | 154 | ||
公园 | 43 | 纪念碑 | 40 | 纪念碑 | 153 | ||
女孩 | 42 | 狗 | 40 | 景象 | 148 | ||
河流 | 42 | 景象 | 40 | 花园 | 145 | ||
宫殿 | 41 | 河流 | 38 | 河流 | 145 | ||
雕刻品 | 41 | 宫殿 | 37 | 宫殿 | 142 | ||
酒店 | 41 | 酒店 | 37 | 雕刻品 | 136 | ||
景象 | 40 | 道路 | 35 | 堡垒 | 135 | ||
纪念碑 | 40 | 雕刻品 | 34 | 酒店 | 132 | ||
夜晚 | 38 | 花园 | 34 | 道路 | 130 | ||
餐厅 | 36 | 冬天 | 33 | 冬天 | 130 | ||
花园 | 35 | 女孩 | 33 | 湖 | 127 | ||
汽车 | 35 | 超市 | 27 | 汽车 | 117 | ||
道路 | 32 | 早晨 | 27 | 小孩 | 107 | ||
超市 | 32 | 夜晚 | 26 | 眼睛 | 106 |
新窗口打开
(2)认知维度对比
通过对DeepSentiBank词库中所有的名词进行分类,并将girls和girl、tree和trees等单复数词语合并,同时参考Beerli等[11]、Stepchenkova等[36]对认知形象的分类方法,将所得到的认知形象高频词进行分类,共计得到9个维度:自然风光、人物、设施、娱乐休闲活动、文化艺术、食物、城市生活、建筑及其他。
将分析结果中各来源地游客认知形象的前100项名词高频词按维度进行分类,统计各维度所占比例,得到的结果如表2所示。总体上,建筑、自然风光和人物是旅游者拍摄最多的画面。具体而言,建筑类在所有旅游者拍摄的内容中占比最高,在故宫、长城、颐和园、天坛、奥林匹克公园等景点拍摄的单体或代表性建筑,表明了建筑仍是吸引不同国家和地区游客的重要旅游资源,且英国(26.9%)在这一维度高于中国港澳台(23.6%)和美国(22.8%)游客;自然风光类在所有旅游者拍摄的内容中占比排名第2,主要包括天气、动植物、湖泊以及以景点为代表的自然风景,美国(22.5%)高于中国港澳台(21.5%)和英国(21.1%)游客;人物类在相关图片位列第3,包括了旅游者自拍、当地居民生活场景、中国旅游者、服务人员等,美国(17.9%)关注度高于中国港澳台(16.3%)和英国(14.4%)游客;城市生活、食物、设施、文化艺术从不同程度上反映了旅游者聚焦内容差异,中国港澳台旅游者最为关注食物(6.8%)和文化艺术(6.9%),英国旅游者看重设施(8.3%)和城市生活(13%);而娱乐休闲活动在所有来源地游客拍摄照片占比最小(中国港澳台2%、英国1.8%、美国1.6%)。
Table 2
表2
表2北京认知形象比重表
Table 2Ratio table of Beijing cognitive image
序号 | 种类 | 中国港澳台/% | 英国/% | 美国/% |
---|---|---|---|---|
1 | 自然风光 | 21.5 | 21.1 | 22.5 |
2 | 人物 | 16.3 | 14.4 | 17.9 |
3 | 设施 | 8 | 8.3 | 7.5 |
4 | 娱乐休闲活动 | 2 | 1.8 | 1.6 |
5 | 文化艺术 | 6.9 | 6.6 | 6.9 |
6 | 食物 | 6.8 | 3.3 | 5.6 |
7 | 城市生活 | 11 | 13 | 11.1 |
8 | 建筑 | 23.6 | 26.9 | 22.8 |
9 | 其他 | 3.9 | 4.6 | 4.1 |
新窗口打开
5.1.2 情感形象
(1)情感高频词对比
本文提取北京不同来源地游客拍摄的每张图片前500项ANP中的形容词部分作为情感形象的体现,表3为各来源地前30项形容词高频词汇总表。总体而言,中国港澳台、英、美旅游者拍摄图片所蕴含的情感以正向积极性的词语为主,古老的(Ancient)、传统的(Traditional)、著名的(Famous)、伟大的(Great)、令人惊叹的(Amazing)等情感高频词出现频率最高。
Table 3
表3
表3北京相关图片信息中形容词高频词统计表(前30项)
Table 3High-frequency adjectives of the Beijing related photos (top 30)
中国港澳台 | 英国 | 美国 | |||||
---|---|---|---|---|---|---|---|
形容词 | 词频 | 形容词 | 词频 | 形容词 | 词频 | ||
古老的 ancient | 289 | 古老的 ancient | 265 | 古老的 ancient | 927 | ||
著名的 famous | 174 | 著名的 famous | 176 | 著名的 famous | 581 | ||
传统的 traditional | 149 | 传统的 traditional | 122 | 传统的 traditional | 465 | ||
伟大的 great | 105 | 伟大的 great | 98 | 伟大的 great | 334 | ||
令人惊异的 amazing | 85 | 令人惊异的amazing | 67 | 令人惊异的 amazing | 264 | ||
空的 empty | 85 | 忙碌的 busy | 61 | 空的 empty | 254 | ||
金碧辉煌的 golden | 71 | 空的 empty | 60 | 忙碌的 busy | 218 | ||
忙碌的 busy | 65 | 令人震惊的 stunning | 54 | 好的 nice | 213 | ||
神圣的 holy | 65 | 好的 nice | 53 | 自然的 natural | 207 | ||
可怕的 weird | 64 | 神圣的 holy | 52 | 室外的 outdoor | 203 | ||
室外的 outdoor | 60 | 室外的 outdoor | 49 | 神圣的 holy | 201 | ||
好的 nice | 60 | 可爱的 lovely | 46 | 极好的 awesome | 198 | ||
热的 hot | 58 | 极好的 awesome | 44 | 金碧辉煌的 golden | 191 | ||
极好的 awesome | 58 | 可怕的 weird | 44 | 令人震惊的 stunning | 188 | ||
遗弃的 abandoned | 56 | 安静的 quiet | 43 | 遗弃的 abandoned | 184 | ||
极小的 little | 51 | 华丽宏伟的 magnificent | 43 | 可怕的 weird | 181 | ||
冷的 cold | 50 | 自然的 natural | 42 | 可爱的 lovely | 179 | ||
不好的 bad | 50 | 遗弃的 abandoned | 41 | 极小的 little | 170 | ||
自然的 natural | 50 | 金碧辉煌的 golden | 40 | 不好的 bad | 169 | ||
可爱的 lovely | 50 | 优秀的 excellent | 37 | 美丽的 beautiful | 163 | ||
令人震惊的 stunning | 48 | 疯狂的 crazy | 37 | 安静的 quiet | 162 | ||
疯狂的 crazy | 47 | 清晰的 clear | 36 | 疯狂的 crazy | 156 | ||
优秀的 excellent | 47 | 信基督的 Christian | 36 | 坏的 broken | 153 | ||
坏的 broken | 45 | 不可置信的 incredible | 36 | 年轻的 young | 149 | ||
信基督的 Christian | 44 | 不好的 bad | 36 | 优秀的 excellent | 148 | ||
安静的 quiet | 43 | 孤单的 lonely | 35 | 脏的 dirty | 146 | ||
明亮的 bright | 42 | 迷人的 fascinating | 35 | 信基督的 Christian | 143 | ||
美丽的 beautiful | 41 | 平和的 peaceful | 34 | 热闹的 hot | 143 | ||
孤单的 lonely | 41 | 多雨的 rainy | 34 | 孤单的 lonely | 143 | ||
清晰的 clear | 40 | 美丽的 beautiful | 34 | 华丽宏伟的 magnificent | 142 |
新窗口打开
(2)情感维度对比
本文根据Russell的情感环状模型[49],对DeepSentiBank词库中所有的形容词进行了情感维度分类,依次统计排名在前50项高频形容词在各维度比例,得到的结果如表4所示。“令人愉快的”(Pleasant)代表了入境旅游者(中国港澳台占比41%、英国占比37.6%、美国占比40.1%)最主要的情感倾向;“兴奋的”(Exciting)在所有入境游客(中国港澳台占比16.4%、英国占比19.5%、美国占比16.4%)所表现的情感形象高频词中排名次之。尽管对于北京情感形象的整体评价以正面为主,但入境旅游者拍摄的图片隐含有“不愉快”(Unpleasant)的情感,且中国港澳台旅游者(占比12.2%)表达的情感最为强烈。中国港澳台、英、美游客拍摄的图片还流露出“令人振奋的”(Arousing)、“沮丧抑郁的”(Gloomy)、“放松闲适的”(Relaxing)情感。除上述内容外,中国港澳台(占比1.3%)和美国游客(占比1.2%)拍摄的图片包含了“困倦欲睡的”(Sleepy)情感,英国游客(占比1.1%)则表达了“不安苦恼的”(Distressing)情感,反映跨文化背景的游客对北京包含复杂多样的情感和态度。
Table 4
表4
表4北京情感形象比重表
Table 4Ratio table of Beijing cognitive image
种类 | 中国港澳台/% | 英国/% | 美国/% | |
---|---|---|---|---|
1 | 令人振奋的 arousing | 7.1 | 7.7 | 6.1 |
2 | 困倦欲睡的 sleepy | 1.3 | 0 | 1.2 |
3 | 兴奋的 exciting | 16.4 | 19.5 | 16.4 |
4 | 沮丧抑郁的 gloomy | 2.8 | 4.3 | 4.2 |
5 | 令人愉快 pleasant | 41 | 37.6 | 40.1 |
6 | 不愉快 unpleasant | 12.2 | 10.7 | 12 |
7 | 放松闲适的 relaxing | 5.7 | 6.4 | 6.6 |
8 | 不安苦恼的 distressing | 0 | 1.1 | 0 |
9 | 其他 others | 13.5 | 12.7 | 13.4 |
新窗口打开
5.2 结果成因分析
根据高频词和认知—情感维度数据表明,不同文化旅游者关于北京形象呈现出同中有异趋势,核心吸引物的图片具有相似性,旅游者表达的情感积极为主,但是负面情感所占比例较高,也是目的地营销需要关注的重点。本节将从认知形象和情感形象2个方面进行具体分析。认知形象方面,中国港澳台、英、美旅游者拍摄的图片内容具有相似性,建筑、城市、食物、街道等高频词代表了不同旅游者对于北京目的地的偏好,以北京为代表的中国文化是目的地的核心吸引力资源,有关于建筑、自然风光、人物等维度的图片数量较多,娱乐活动这一维度的相关图片最少,也一定程度上反映了不同文化群体对北京形象感知具有相似性。旅游者行为看似是个体行为,背后则是文化和目的地本身特质等因素共同影响的结果。一方面,目的地形象本身是共性和独特性的统一,即每个旅游者对目的地有共同的感知形象,也有对目的地个性的感知[50]。Kim等在美、韩旅游者关于俄罗斯感知研究中指出,共性与独特性都是目的地最核心的吸引物[51]。旅游者关于目的地认知的共性部分,实则代表了目的地最值得欣赏的旅游资源,它不会随着时间和文化背景的差异而有所不同[50]。另一方面,文化求同与求异是跨文化旅游者行为背后更深层的原因,李伟山认为中国入境客源市场总体呈现出文化求同的基本特征,无论是中国港澳台同胞的“同中求异”,还是外国游客表现出“异中求同”的文化需求[52],共同反映了旅游者关于北京形象的认知相似。
不同文化旅游者对北京认知存在相似性的特征之外,通过计算机和人工分析原图内容,本文还发现不同来源地旅游者在文化艺术、人物、食物方面拍摄内容差异较大,为此我们下载了以上3个维度中具有代表性的图片,进一步通过分析其内容对比不同来源地游客对北京认知形象的差异。代表性图片的选择遵循了如下原则:在所涉及的维度中有至少5张图片内容大致一致,则此图片内容被认为可作为该维度具有代表性的图片内容。
在文化艺术方面,虽然中国港澳台、英美旅游者拍摄图片中包含了大量的文化艺术性景观,但具体图片内容存在一定的差异。中国港澳台旅游者拍摄的图片倾向于展现中国古代的艺术珍品,包括中国的瓷器、玉器等;英、美游客则拍摄照片多与传统的神兽雕塑、表演、彩绘等文化艺术相关,代表性图片如图4所示。袁本华等认为东西方文化关于绘画、雕塑、戏剧等艺术认知存在差别,西方人讲求艺术的逼真性、直率的描绘或重墨挥洒,喜欢雕塑、油画等直观感强烈的艺术形式;而东方人则注重艺术作品的传神、重视内在情感的表达,彰显了东方的淡远、含蓄、回味无穷的艺术美学标准[53]。因此,东西方游客的艺术审美标准差异体现在图片内容上时,生动、具有表现力的艺术表演、雕塑建筑等受到西方旅游者的追捧;通过制作工艺、寓意等展示中国文化的艺术欣赏品则受到中国港澳台旅游者的喜爱。此外,本文还印证了Pizam等关于美国人对旅游文物一般不感兴趣的研究结论[54]。
显示原图|下载原图ZIP|生成PPT
图4旅游者拍摄北京文化艺术图片(中国港澳台a,英国b,美国c)
-->Figure 4Photos of Beijing culture and art photographed by tourists (from a to c, Hong Kong, Macao, and Taiwan of China; UK; USA)
-->
人物方面,中国港澳台旅游者以自拍为主,更多出于自身旅游留影的需要;英国旅游者拍摄较多的是天安门中站岗士兵、服务人员照片;而美国旅游者拍摄内容与居民生活场景以及中国旅游者的画面更为相关,代表性图片如图5所示。图片内容的差异源自于东西方不同的文化观念下人际交往的差异。中国港澳台与内地同根同源,中国的政治、地理的大一统促使儒家文化深入影响民众的人际交往行为。儒家文化强调以人为中心的交往,人们根据熟悉程度划分关系圈,一般情况下,不会主动与陌生人互动、交流,因而东方人通常给人以谨慎、保守和内敛的印象,注重自己内心感受的变化,这种人际行为同样体现在旅游中[55]。英国受海洋地理环境影响,地域、国家间贸易、人员交往频繁,同时资本主义经济的崛起、文艺复兴时期追求人的全面、自由发展,强调人与人的直接交往、重视与陌生人的交往;美国地域广阔、人口相对稀少,当地居民与其他人交往的意愿比较强烈,热衷于同陌生人交流等,因而,西方旅游者整体上展现的是积极、开放和外向的形象,表现出极强的交往意愿,通过与服务者、居民的互动中直接表达自己的需求,了解当地文化、融入特色文化氛围[56]。
显示原图|下载原图ZIP|生成PPT
图5旅游者拍摄北京人物图片(中国港澳台a,英国b,美国c)
-->Figure 5Photos of Beijing people photographed by tourists (from a to c, Hong Kong, Macao, and Taiwan of China; UK; USA)
-->
美食是目的地形象重要的文化符号。中国港澳台旅游者拍摄的食物以中国菜肴为主;英国游客拍摄的食物画面最少,且多为日常西餐画面;美国旅游者拍摄的内容大多是烧烤、小吃、中国啤酒图片,代表性图片如图6所示。Cohen[57]和Mayo等[58]研究表明,大部分旅游者始终在寻求冒险、新奇与保守、熟悉之间的平衡,这种心理上的平衡同样反映在饮食上。与内地相似的饮食习惯未影响中国港澳台旅游者的饮食选择;却促使西方旅游者回归原文化,选择自己熟悉的食物;同时,猎奇心理也会促使他们尝试那些具有较大文化差异的食物,并用北京和故土同类型食物的差异形成独特的旅行体验。罗鲜荣等的研究也表明西方旅游者对饮食的原真性体验上并不彻底,虽然也尝试当地的特色食物,却相对保守,有时尝试的目的可能只是为了能告诉其他同类游客“我已经尝试过了”(I’ve tried it!)[59]。
显示原图|下载原图ZIP|生成PPT
图6旅游者拍摄北京食物图片(中国港澳台a,英国b,美国c)
-->Figure 6Photos of Beijing food photographed by tourists (from a to c, Hong Kong, Macao, and Taiwan of China; UK; USA)
-->
情感形象方面,“令人愉快的”(Pleasant)和“兴奋的”(Exciting)在所有来源地游客心中最为突出,其中又以“古老的”(Ancient)、“传统的”(Traditional)、“著名的”(Famous)和“伟大的”(Great)情感形容词出现频率最高,一定程度上反映了在旅游者心中,北京是集国际化与悠久历史于一体的大都市;其次,“不愉快的”(Unpleasant)在所有来源地游客情感中所占比重较高,且中国港澳台旅游者的这种情感高于英国和美国旅游者,证实了Weiermair 提出的目的地与客源地之间文化差异越大,对服务等内容包容性更强的这一观点[60];此外,中国港澳台与美国旅游者流露出“困倦欲睡的”(Sleepy)情感,根据这一维度的形容词回溯到ANP分析结果中,发现旅游者拍摄的内容大多与动物相关,画面多为猫、狗等慵懒的姿态;英国旅游者则表达了“不安苦恼的”(Distressing)情感,回溯到ANP分析结果中,发现旅游者表述内容大多与陵墓等建筑相关。
6 研究结论与展望
6.1 研究结论
本文采用深度学习算法,对Flickr上海外游客拍摄的27047张北京旅游图片进行了内容分析,并根据拍摄者来源地不同比较了中国港澳台、英国和美国游客对北京目的地形象感知的差异。该方法与人工对图片内容进行编码的研究方法相比,有效地提升了图片分析速度和效率,可在海量的图片样本空间对目的地形象进行分析,充分发挥了UGC图片数据的价值。在研究结论方面,利用计算机对中国港澳台、英国和美国旅游者拍摄的图片表征内容进行分析,提取、分类并汇总了认知形象和情感形象高频词,得到不同文化背景旅游者关于北京的认知形象和情感形象。首先,建筑在中国港澳台、英国和美国旅游者拍摄的图片中比重最高,表明了不同文化群体的北京形象感知具有共同性,说明北京入境客源市场总体存在文化求同的基本特征。尽管北京的娱乐化资源丰富,但中国港澳台、英美旅游者拍摄的相关内容图片相对较少。其次,中国港澳台、英美旅游者拍摄的文化艺术、人物、食物图片存在差异。在文化艺术方面,中国港澳台旅游者比英美旅游者展示了更多古代艺术珍品图片,这种差异可能与西方注重艺术逼真性、东方注重艺术传神表意的文化艺术审美理念相关。在人物方面,英美旅游者对北京当地居民、其他旅游者更感兴趣,表明了东方儒家文化与西方文化在人际交往观念存在明显的不同;在饮食方面,中国港澳台旅游者拍摄内容展示的是中餐,英美旅游者拍摄的食物图片包含了中餐和西餐,表明了旅游者倾向于在寻求冒险、新奇与保守、熟悉之间平衡;最后,不同文化群体关于北京的情感形象中,愉快的情感占据主导,古老的、著名的、传统的都是北京旅游形象中固有的内容。与此同时,需注意旅游者消极情感的表达,特别是中国港澳台旅游者不愉快的情感最为强烈,一定程度上说明了距离越近,旅游者对旅游目的地服务的要求越高。
根据上述分析,本文的主要创新点体现在以下3个方面:首先,从理论层面证明了利用深度学习对UGC图片进行内容分析可验证不同文化背景游客投射形象差异的存在及其成因,从地理环境、旅游者所在地文化与目的地文化间关联、价值观、审美等角度分析投射形象异同,揭示了文化熟悉情况与旅游地消极情感之间的关系,对目的地的文化越熟悉,对目的地服务要求更高,也更容易产生消极不满的情感,为进一步基于文化背景旅游者行为深层次原因分析奠定了基础;其次,从方法层面提出了利用深度卷积神经网络识别图片内容进行目的地形象分析的方法,即对旅游者拍摄的图片内容及隐含的目的地情感分析,其较之基于文本元数据的图片分析方法更具通用性,解决了图片描述性文本数据缺失这一问题,适用于多个网络平台的图片数据分析,满足多个场景的目的地形象研究需要,为目的地形象研究提供新的思路。最后,该方法在基于图片的旅游目的地形象研究和目的地营销中具有广阔的应用价值,通过充分挖掘图片表征内容信息,了解细分市场下的旅游者群体对目的地的偏好,针对不同文化背景旅游者制定相应的营销策略,选择更符合旅游者偏好的图片进行宣传,激发潜在旅游者前往目的地旅游的意愿。
本文基于北京UGC图片的分析,对北京进行旅游目的地营销提出以下建议:在针对不同文化的旅游者营销时,应着重宣传北京的建筑、展现美丽的风光和人物面貌。同时,针对不同文化的旅游者开展精准性营销策略,如对于中国港澳台旅游者,增加北京文化、食物等内容展示;对于英国旅游者可宣传多元化的城市生活;对美国旅游者,增加人物、艺术场景等图片内容的展示。
6.2 未来展望
对于海量UGC图片采用深度学习算法进行分析在旅游领域尚处于初级阶段,本文具有以下局限性并有待完善。首先,本文利用深度学习对图片内容和情感进行解析,其对认知内容判断较准,但图片质量对情感判断准确性影响较大,且结果中ANP的情感形容词只代表图片本身投射的某种情绪,其与游客关于目的地感知中的情感形象之间的关系有待进一步研究;其次,本文采用机器代替人工分析对图片进行解析,在提高分析样本和分析效率的同时,还需进一步与人工分类结果进行对比,明确机器方法与人工方法的边界。The authors have declared that no competing interests exist.
参考文献 原文顺序
文献年度倒序
文中引用次数倒序
被引期刊影响因子
[1] | [J]. , [J]. , |
[2] | [J]. , |
[3] | [J]. , [J]., |
[4] | [J]. , [J]. , |
[5] | [J]. , |
[6] | [J]. , |
[7] | [J]. , |
[8] | [J]. , |
[9] | [J]. , |
[10] | [J]. , |
[11] | [J]. , |
[12] | [J]. , [J]. , |
[13] | [J]. , [J]. , |
[14] | [J]. , |
[15] | [J]. |
[16] | [J]. , |
[17] | [J]. , |
[18] | [J]. , |
[19] | [J]. , |
[20] | [J]., |
[21] | [J]. , [J]. , |
[22] | [J]. , [J]. , |
[23] | [J]. , [J]. , |
[24] | [J]. , |
[25] | [J]. , |
[26] | [J]. , |
[27] | [J]. , |
[28] | [J]. , |
[29] | [J]. , [J]. , |
[30] | [J]. , [J]. , |
[31] | [J]. , |
[32] | [J]. , [J]. , |
[33] | [J]. , |
[34] | [J]. , |
[35] | [J]. , [J]. , |
[36] | [J]., |
[37] | [J]. , [J]. , |
[38] | [J]. , |
[39] | [J]. , [J]., |
[40] | [, |
[41] | [J]. , |
[42] | [, |
[43] | [C]. , |
[44] | [J]. , [J]. , |
[45] | |
[46] | [J]. , |
[47] | [J]. , |
[48] | [J]. , |
[49] | [J]. , |
[50] | [J]. , |
[51] | [J]. , |
[52] | [J]. , [J]. , |
[53] | [J]. , [J]. , |
[54] | [J]. , |
[55] | [J]. , [J]. , |
[56] | [J]. , [J]. , |
[57] | [J]. , |
[58] | [M]. , |
[59] | [J]. , [J]. |
[60] | [J]. , |