An assessment of the effectiveness of China's nature reserves for mitigating anthropogenic pressures based on propensity score matching

张涵, 黎夏, 石洪, 刘晓娟. 基于倾向得分匹配方法的中国自然保护区缓解人类活动压力评估. 地理学报[J], 2021, 76(3): 680-693 doi:10.11821/dlxb202103013
ZHANG Han, LI Xia, SHI Hong, LIU Xiaojuan.
1 引言
建立自然保护区是世界各国和地区避免人类活动损害生物多样性和生态系统服务的主要手段[1]。世界自然保护联盟(International Union for Conservation of Nature, IUCN)在最新的保护星球报告中指出,全球陆地保护区覆盖率从2016年的14.7%增长至2021年的15.4%[2,3]。虽然不断扩张的保护用地在一定程度上为自然留出了空间,但它仍不能完全免受人类活动的影响。有研究证明,全球1/3的自然保护地正承受着巨大的人类活动压力[4]。并且人类活动压力在生物多样性高的地方非常强烈、广泛,且呈现迅速加剧趋势[5]。自然保护区内持续增长的人类活动压力会削减其本身的保护效果。如人类活动会破坏自然保护区的生态系统[6],使得动物的栖息地减少[7,8]。此外,有研究证实人类活动带来的压力增加了物种灭绝的风险[9]。因此,对自然保护区内人类活动压力现状及其变化进行监测是保护区有效性评价的有效手段。在这一研究领域中,获取代表人类活动的数据是最困难的。一些研究通过实地调查(航空摄影、问卷调查等)的手段监测保护区内的人类活动[10,11]。这种方法精准且具有针对性,但成本较大,难以进行大尺度的研究。所以,采用耦合多源数据构建人类活动压力数据产品的方法更为通用。目前,全球已有很多套衡量人类活动压力的数据产品,涵盖了不同分辨率及类型。其中包括单一压力产品和综合压力产品。单一压力产品包括土地利用、交通与可达性、污染物、人口、入侵物种等[12]。综合压力产品则是将上述压力图层中具有代表性的几类赋予权重后叠加得到[12,13]。二者均在监测保护区内人类活动压力的研究中有着广泛的应用,但综合压力产品估算方法已成为较为普遍的共识[13]。
监测自然保护区内人类活动压力现状及其变化的目的,旨在于评估保护区缓解人类活动压力的效果。目前研究的方法大致可分为两类:不对比和对比的方法。第一种方法仅考虑保护区自身状态,不考虑周围地区。如Jones等[4]使用人类足迹产品来测量全球保护区内的人类活动压力。第二种方法将保护区内部的人类活动压力与所有未受保护地区或者缓冲区的人类活动压力进行对比。如Hellwig等[14]比较了欧洲的保护区、非保护区和保护区周围1 km缓冲区内的土地覆盖变化。Guetté等[15]探究了全球保护区和生物多样性热点区域及其25 km、25~70 km的缓冲区内夜间灯光遥感影像像元亮度值(Digital Number, DN)的变化趋势。Durán等[16]揭示了4种金属采矿活动与全球保护区及其10 km缓冲区的重叠。Radeloff等[17]采用了1940—2030年美国的住房增长数据,量化了荒野地区、国家公园和国家森林及其缓冲区的住房增长率。Qiu等[18]计算了云南省58个自然保护区及其2 km缓冲区内的3种单一压力指数(人口密度、GDP、土地利用)和综合压力指数。
以上方法存在一定的局限性。第一种方法仅考虑保护区自身的人类活动压力状况,没有与未受保护地区进行对比,难以得出合理的结论。第二种方法则难以克服样本选择性偏差的问题,即保护区的位置选择受海拔、气候、可达性等因素的影响[19,20],很难分清保护区内的人类活动压力增长量小于保护区外的原因是由于保护区的建立,还是保护区本身的地理背景影响。因此,匹配法开始被用来解决这种非随机位置的偏差[21]。Geldmann等[22]采用倾向得分匹配(Propensity Score Matching, PSM),对全球保护区的人类活动压力进行了研究,证实了该方法的有效性和合理性。倾向得分匹配是一种统计学方法,它的核心思想是根据多维观测变量来计算样本的倾向得分(Propensity Score),并将实验组和对照组的倾向得分作为距离函数来进行匹配,使两个组的观测变量尽可能相似,从而消除样本选择性偏差[23]。
2 数据与方法
2.1 研究区概况
本文自然保护区边界数据来源于中国自然保护区标本资源共享平台地理信息库,共计799条矢量面数据。将采集到的数据与生态环境部发布的2017年全国自然保护区名录进行匹配,删除面积小于1 km2的保护区,最终得到680个保护区矢量边界数据,其中包括9种保护区类型(图1),覆盖了中国30个省、自治区、直辖市(暂缺上海、台湾、香港、澳门的数据)。这些保护区均建立在2013年之前。图1

Fig. 1Spatial distribution of 680 nature reserves in China in 2017
2.2 人类活动压力指数
参考Venter等[13]的方法,选取城市建设用地、人口密度、电力设施、农田、公路和铁路来构建人类活动压力指数。构建得分规则如表1所示,将所有得分相加后,得到综合的人类活动压力指数,范围为0~57。所有数据都使用WGS 1984圆柱等面积投影,空间分辨率采样为1 km。值得注意的是,本文构建的是综合人类活动压力指数,所选择的几类压力可能存在一定关联,并非相互排斥。人类活动压力指数构建见公式(1)。式中:sall是人类活动压力总得分;surban是城市建设用地的压力得分;spop是人口的压力得分;selec是电力设施的压力得分;scrop是农田的压力得分;shighway是公路的压力得分;srail是铁路的压力得分。
Tab. 1
Tab. 1
压力 | 得分 | 描述 |
城市建设用地 | 0, 10 | 所有城市建设用地像元得分均为10 |
人口密度 | 0~10 | 人口密度大于1000人/km2的像元得分为10,其余按公式计算 |
电力设施 | 0~10 | 对夜间灯光数据进行分位数分级 |
农田 | 0, 7 | 所有农田像元得分均为7 |
公路 | 0~10 | 公路像元得分为10,公路外部按距离以指数递减,一直到距离公路15 km处 |
铁路 | 0, 10 | 所有铁路像元得分为10 |
建设用地给自然系统带来的压力是不能忽略的。由于乡镇和村庄建设用地不易提取,此处仅考虑城市建设用地。为了便捷、准确地获得全国城市建设用地,本文采用VIIRS DNB夜间灯光数据结合统计数据的方法来提取[25]。夜间灯光数据来源于美国海洋和大气管理局国家环境信息中心数据库,全国城市建设用地面积数据来源于中华人民共和国国家统计局。首先采用VIIRS DNB夜间灯光月度数据来合成年度数据。为了减少VIIRS数据的异常值,以北京、上海、广州3个城市的像元最大值作为全国范围内的像元最大值,将大于这个值的像元都用邻域内像元的最大值取代[26]。5—8月份的VIIRS数据在北半球高纬度地区存在值缺失的情况[27],因此把至少有6个月像元值均大于0的像元作平均,并将值小于0.3 nw cm-2 sr-2的像元作为背景噪声置为0[28],得到合成年度数据。最后采用二分法找到最适提取阈值[25],提取出全国城市建设用地,并将其压力得分置为10。
人口密度数据来源于美国国家航空航天局社会经济数据和应用中心。假设人类对自然系统的压力随人口密度的增加呈对数增加,并在1000人 km-2的密度下达到饱和。于是,将人口密度大于1000人 km-2的格网压力得分置为10,而人口密度低于1000人 km-2格网,以公式(2)来计算得分。
道路数据来源于开放道路数据,由于本文考虑的主要是人类活动压力在生态保护区的增长,因此主要选择了该数据中连接城镇间的道路。公路和铁路都是不透水面,因此将其本身的压力得分置为10。公路两边的压力值随着距离的增长呈现指数递减,一直到距离公路15 km。因为铁路沿线极少有人活动,因此不考虑间接影响。
2.3 倾向得分匹配方法
选取保护区内部的随机点作为实验组,保护区外部的随机点作为对照组。具体做法是,在保护区边界内创建随机点,设置距离不小于1 km,生成了27594个随机点。对应的,保护区外部则生成20万个随机点,同样设置距离不小于1 km。本文构建的人类活动压力产品的空间分辨率为1 km,若随机点的距离小于1 km,样本点可能会进入同一像元;而且研究的自然保护区最小面积约为1 km2,间距设置太大则不能保证一定的样本数量,因此选择了1 km作为最小间隔。为了避免自然保护区溢出效应的影响,保护区外部的随机点不在保护区10 km缓冲区内生成[30]。在采用对比法来探究自然保护区缓减人类活动压力的效果之前,本文参照类似研究[22, 31],选择了倾向得分匹配的方法来消除样本选择性偏差。假设人类活动压力完全取决于一组观测变量,那么通过匹配使对照组与实验组的观测变量尽可能相似,从而使两组随机点仅在是否受到保护方面有所不同[32],达到消除样本选择性偏差的目的。倾向得分匹配方法将两组随机点的倾向得分作为距离函数,根据最邻近或整体匹配的规则来进行匹配[33]。随机点i的倾向得分定义为,在给定观测变量Xi的情况下,随机点i进入实验组或对照组的概率[23]。其计算方法表示如下:
2.4 缓解人类活动压力的相对有效性指标
2.5 面板模型
当以同一基准来评估自然保护区缓解人类活动压力的效果时,其区域性差异会被忽略。因此,本文运用匹配后的随机点在2013年、2015年、2017年的变量值构建了面板模型,探讨全国及各大区的自然保护区建设对缓解人类活动压力的影响。具体做法是,对样本点构建虚拟变量PAS,值为0代表对照组,即匹配后代表非保护区的随机点;值为1代表实验组,即匹配后代表保护区的随机点。模型公式如下:式中:Yit为随机点i第t年的人类活动压力;PASit为个体哑变量,PASit = 1为实验组,PASit = 0为对照组。Xit为一系列控制变量,本文选择高程、坡度、年均降水、年均温度作为控制变量。εit为随机误差项。因为虚拟变量PAS不随时间变化,面板模型不能用固定效应模型,故采用随机效应模型。所使用的数据集如表2所示。
Tab. 2
Tab. 2
数据 | 数据属性 | 年份 | 数据来源 |
中国自然保护区矢量边界 | 矢量数据 | - | http://www.papc.cn/ |
中国自然保护区名录 | 统计数据 | 2017 | http://www.mee.gov.cn/ |
VIIRS DNB夜间灯光影像 | 遥感影像 | 2013、2015、2017 | https://www.ngdc.noaa.gov/eog/viirs/ download_dnb_composites.html |
中国城市建设用地面积 | 统计数据 | 2013、2015、2017 | http://www.stats.gov.cn/ |
人口密度 | 栅格数据 | 2010、2015、2020 | https://sedac.ciesin.columbia.edu/data/ collection/gpw-v4/sets/browse |
农田 | 栅格数据 | 2013、2015、2017 | http://maps.elie.ucl.ac.be/CCI/viewer/ index.php |
公路、铁路 | 矢量数据 | 2014、2015、2017 | https://download.geofabrik.de/ |
高程 | 栅格数据 | - | http://www.fao.org/soils-portal/soil-survey/soil-maps-and-databases/harmonized-world-soil-database-v12/zh/ |
气温、降水 | 站点数据 | 2013、2015、2017 | https://data.nodc.noaa.gov/cgi-bin/iso?id=gov.noaa.ncdc:C00516 |
3 结果与分析
3.1 中国自然保护区的人类活动压力指数空间分布

Fig. 2Spatial distribution of Anthropogenic Pressure Index in China and its nature reserves

Fig. 3Numerical distribution of the overall level and slope of Anthropogenic Pressure Index in China's nature reserves
3.2 倾向得分匹配的平衡性检验结果
判断匹配过程的效果主要看两点,一是看匹配前后的t统计量显著性水平的变化,二是看匹配前后标准偏差的变化[35]。倾向得分匹配的平衡性检验结果如表3所示。经t统计检验,在0.05的水平下,实验组与对照组的观测变量经匹配后无显著性差异,且所有观测变量在匹配后的标准偏差绝对值都小于5%,说明匹配结果相对较好,选择的匹配变量和匹配方法是合理的。匹配结束后,实验组、对照组分别剩余24954个、170938个随机点作为样本。Tab. 3
Tab. 3
变量 | 均值 | 标准偏差 (%) | 标准偏差减小 幅度(%) | t检测 | |||
实验组 | 对照组 | t统计量 | t检验相伴概率 | ||||
lnpecp | 匹配前 | -2.5682 | -2.8677 | 37.5 | 50.42 | 0.000 | |
匹配后 | -2.5682 | -2.5679 | 0.2 | 99.5 | 0.22 | 0.824 | |
lntemp | 匹配前 | 3.9294 | 3.9054 | 10.3 | 15.26 | 0.000 | |
匹配后 | 3.9294 | 3.935 | -2.4 | 76.9 | -2.55 | 0.011 | |
lnslope | 匹配前 | 0.76959 | 0.23972 | 29.9 | 44.54 | 0.000 | |
匹配后 | 0.76959 | 0.76637 | 0.2 | 99.4 | 0.22 | 0.829 | |
lnelev | 匹配前 | 6.7174 | 6.5833 | 9.1 | 12.84 | 0.000 | |
匹配后 | 6.7174 | 6.7039 | 0.9 | 89.9 | 1.07 | 0.286 | |
lntjcq | 匹配前 | 10.496 | 10.454 | 4.3 | 5.69 | 0.000 | |
匹配后 | 10.496 | 10.497 | -0.0 | 99.3 | -0.03 | 0.973 | |
lntoroad | 匹配前 | 10.805 | 10.716 | 7.5 | 10.06 | 0.000 | |
匹配后 | 10.805 | 10.797 | 0.7 | 91.0 | 0.76 | 0.445 | |
lnlandcover | 匹配前 | 0.73629 | 0.73672 | -0.1 | -0.10 | 0.918 | |
匹配后 | 0.73629 | 0.74132 | -0.9 | -1053.9 | -1.07 | 0.284 |
3.3 中国自然保护区缓解人类活动压力的相对有效性分析

Fig. 4The spatial distribution of relative effectiveness of China's nature reserves for mitigating anthropogenic pressures
Tab. 4
Tab. 4
保护区类别 | 保护区数目 | 指标为负(%) | 指标为正(%) | 相对有效性(平均值) |
东北 | 115 | 79.13 | 20.87 | -0.40 |
华北 | 66 | 68.18 | 31.82 | -0.31 |
华东 | 90 | 56.67 | 43.33 | 0.43 |
中南 | 154 | 66.23 | 33.77 | 0.06 |
西北 | 87 | 74.71 | 25.29 | -0.30 |
西南 | 158 | 72.15 | 27.85 | -0.18 |
全国 | 670 | 69.85 | 30.15 | -0.11 |
Tab. 5
Tab. 5
保护区类别 | 保护区数目 | 指标为负(%) | 指标为正(%) | 相对有效性(平均值) |
草原草甸 | 7 | 85.71 | 14.29 | -0.37 |
地质遗迹 | 21 | 71.43 | 28.57 | -0.04 |
古生物遗迹 | 11 | 81.82 | 18.18 | -0.02 |
海洋海岸 | 11 | 63.64 | 36.36 | 0.53 |
荒漠生态 | 16 | 81.25 | 18.75 | -0.67 |
内陆湿地 | 81 | 67.90 | 32.10 | -0.28 |
森林生态 | 304 | 70.72 | 29.28 | -0.18 |
野生动物 | 179 | 68.72 | 31.28 | 0.04 |
野生植物 | 40 | 62.50 | 37.50 | 0.19 |
Tab. 6
Tab. 6
保护区类别 | 保护区数目 | 指标为负(%) | 指标为正(%) | 相对有效性(平均值) |
国家级 | 359 | 73.54 | 26.46 | -0.29 |
省级 | 128 | 69.53 | 30.47 | -0.06 |
地级市级 | 46 | 63.04 | 36.96 | 0.06 |
县级 | 137 | 62.77 | 37.23 | 0.27 |
3.4 中国自然保护区建设对缓解人类活动压力的影响
面板模型结果见表7。从全国层面来看,相较于保护区外,中国自然保护区在2013—2017年可以缓解22.90%的人类活动压力。东北、华东和西南地区的自然保护区建设在缓解人类活动压力方面的效果最为显著,系数分别为-61.40%、-61.30%和-51.60%。需要注意的是,西北地区的保护区在2013—2017年并没有缓解人类活动压力,反而使人类活动压力增加。可能的原因是,中国西北地区人口较少,人类活动压力增加主要来源于道路建设,在西部大开发等政策影响下,西部地区的基础设施建设在这一阶段大幅增加,如公路和高铁,这使得保护区内的人类活动压力增加。Tab. 7
Tab. 7
变量 | (1) | (2) | (1) | (2) | (3) | (4) | (5) | (6) |
全国 | 全国 | 东北 | 华北 | 西北 | 华东 | 西南 | 中南 | |
PAS | -0.192*** | -0.229*** | -0.614*** | -0.263*** | 0.252*** | -0.613*** | -0.516*** | -0.279*** |
(0.0138) | (0.0126) | (0.0292) | (0.0384) | (0.0389) | (0.0194) | (0.0194) | (0.0081) | |
lnelev | -0.675*** | -0.568*** | -0.620*** | -0.697*** | -0.123*** | -1.183*** | -0.173*** | |
(0.0034) | (0.0169) | (0.0113) | (0.0197) | (0.0063) | (0.0087) | (0.0036) | ||
lnslope | 0.252*** | -0.0282*** | 0.175*** | 0.306*** | -0.0141*** | 0.0852*** | -0.0654*** | |
(0.0030) | (0.0094) | (0.0084) | (0.0081) | (0.0048) | (0.0063) | (0.0025) | ||
lnpecp | -0.0262*** | 0.00668*** | -0.0125*** | -0.00529*** | -0.00353 | -0.0204*** | -0.0346*** | |
(0.0005) | (0.0022) | (0.0013) | (0.0011) | (0.0026) | (0.0010) | (0.0016) | ||
lntemp | -0.0878*** | -0.0284*** | -0.0660*** | -0.128*** | -0.297*** | -0.294*** | -0.164*** | |
(0.0009) | (0.0014) | (0.0017) | (0.0021) | (0.0083) | (0.0058) | (0.0058) | ||
_cons | 1.383*** | 6.010*** | 5.145*** | 5.403*** | 6.030*** | 4.294*** | 11.38*** | 3.951*** |
(0.0049) | (0.0226) | (0.0962) | (0.0771) | (0.1471) | (0.0484) | (0.0732) | (0.0332) | |
N | 587448 | 577719 | 55552 | 95390 | 147855 | 56697 | 142963 | 79062 |
R2 | 0.0010 | 0.1677 | 0.1204 | 0.0948 | 0.0340 | 0.1580 | 0.2458 | 0.3527 |

Fig. 5Mean change in anthropogenic pressures between 2013 and 2017 (after matching)
4 结论与讨论
4.1 结论
4.2 讨论
虽然大数据和遥感在人类活动压力的研究中发挥着重要作用[37],但数据在来源、分辨率、精确度上仍存在问题。比如,由于空间分辨率、数值单位等不同,常用来代表社会经济活动的两种夜间灯光数据NPP-VIIRS和DMSP/OLS[38]还不能在时间分辨率上互补;来源一致、实时更新、精确度较高的道路数据较难获取;一些特殊的人类活动压力(比如偷猎、放牧等)也难以在大尺度上进行量化。因此,提高人类活动压力产品的质量是目前的研究方向之一。在评估自然保护区有效性的研究中,以人类活动压力作为有效性指标[22, 39]或以生物多样性和生态系统服务作为有效性指标[40,41,42,43,44]的研究都很多,但单方面评估的局限性很明显。未来对保护区有效性的研究应该聚焦到因果关系上,比如人类活动压力如何影响不同自然保护区的保护结果,以及这些保护结果将如何作出响应。
