Spatial downscaling of remotely sensed precipitation in Taihang Mountains
HU Shi1, HAN Jian2, ZHAN Chesheng,1, LIU Liangmeizi1,3通讯作者:
收稿日期:2019-07-2修回日期:2019-11-22网络出版日期:2020-07-20
基金资助: |
Received:2019-07-2Revised:2019-11-22Online:2020-07-20
作者简介 About authors
胡实(1982-),女,湖北咸宁人,博士,助理研究员,主要从事生态水文研究E-mail:hus.08b@igsnrr.ac.cn。
摘要
关键词:
Abstract
Keywords:
PDF (10170KB)元数据多维度评价相关文章导出EndNote|Ris|Bibtex收藏本文
本文引用格式
胡实, 韩建, 占车生, 刘梁美子. 太行山区遥感卫星反演降雨产品降尺度研究. 地理研究[J], 2020, 39(7): 1680-1690 doi:10.11821/dlyj020190545
HU Shi, HAN Jian, ZHAN Chesheng, LIU Liangmeizi.
1 引言
降水是水循环过程的关键要素,具有高度的时空异质性。利用站点的观测数据进行空间插值可以获取降雨的空间格局,然而山区降雨观测站点较少,且山区降雨受海拔、坡向及水汽来源等多方面的影响,插值结果难以准确再现山区降雨的空间格局。随着卫星遥感和地理信息技术的发展,近年来大量的卫星降水产品陆续出现[1],例如热带降雨观测计划(Tropical Rainfall Measuring Mission,TRMM)、CMORPH降水产品(Climate Prediction Center Morphing Technique)、全球降水卫星制图(Global Satellite Mapping of Precipitation, GSMaP)和全球降水观测计划(Global Precipitation Measurement Mission, GPM)等。遥感降雨产品能够提供连续的长时间序列降雨信息,然而受其空间分辨率较低的限制,卫星降水产品难以满足陆地水循环研究及分布式生态水文模型的需求。例如广泛应用的TRMM产品空间分辨率仅为0.25°(约25 km),GPM产品的空间分辨率为0.1°(约10 km)。为此,研究者们提出和发展了多种卫星降水产品空间降尺度算法,并且成功的应用于TRMM、NLDAS-2等产品[2,3,4]。与以往的卫星降水产品相比,GPM具有更高的空间精度和时间分辨率,其适用性在全球各大流域已经得到了初步评估[5,6,7,8],但仍不足以满足分布式生态水文模型的需要,对GPM产品进行尺度下延及精度评价仍然十分迫切。假定变量之间的相关关系具有空间非平稳性的地理加权回归是一种适用于降水空间降尺度的有效算法,已成功运用于中国的东北地区[9]、秦巴山区[10]以及天山山区[11]。由于山区降雨与地形密切相关,海拔高度是较为常用的解释变量,此外由于降雨与植被的关系非常密切,体现植被生长状况的标准化植被指数(NDVI)也是较为常用的解释变量。一般而言,总初级生产力(GPP),净初级生产力(NPP)和NDVI等植被生长指标与降水有显著的正相关关系[12,13,14],尤其是在干旱半干旱地区,但降水与植被生长状态(NPP或NDVI等)之间存在一定的时间延迟,时滞长度因物种和区域而不同。例如:降雨与不同植被NDVI的时滞关系在美国南部为6~12天[15],在中国西北黑河流域为8~16天[16],在青藏高原为0~1个月之间[17]。Duan等[18]认为在干旱半干旱地区降水-NDVI关系时滞可能达到2~3月,因此当月NDVI不能用于估算月降水。而Xu[19]却发现当月NDVI用于估算月降水效果良好,时滞性并不意味着NDVI与当月降水的相关性低,只要精度可以接受,仅用当月NDVI估算降水并无不可。因此不同的地区,对降雨产品进行尺度下延时是否需要考虑降雨与NDVI的时滞性,降雨与NDVI的时滞性对降雨降尺度的影响有多大等问题仍然需要进一步研究。
作为TRMM的接替者,GPM产品的研究和应用尚不充分。本研究拟以太行山为研究对象,在考虑降雨与NDVI时滞性的基础上,采用时滞地理加权回归模型对GPM数据进行尺度下延,在评估降尺度效果的基础上对太行山降雨的时空格局进行分析。
2 研究区域与数据
2.1 研究区概况
太行山区(34°14′N~41°06′N,110°13′E~116°34′E),东临华北平原,西靠吕梁山脉和黄土高原,海拔100~3058 m,面积约14万km2(图1)。太行山区地处我国中纬度温带暖温带地区,主要受夏季东南季风的控制,年均温-9.1~21.6℃,由南向北逐渐降低,多年平均降雨量介于318~817 mm,主要集中于每年的7—9月,多年平均蒸散发约602 mm[20]。研究区以林地、草地和耕地为主,其中林地主要为暖温带落叶阔叶林,由于人类活动的影响,大部分原始植被已遭到不同程度的破坏,以次生植被为主。图1
新窗口打开|下载原图ZIP|生成PPT图1太行山地理位置、DEM、NDVI及气象站分布
Fig. 1Location, DEM, NDVI and meteorological stations of Taihang Mountains
2.2 数据来源及处理
本研究的数据主要包括卫星降水数据GPM,气象站降雨观测数据,DEM数据和植被指数数据。GPM数据为美国航空航天局提供的2014—2016年月尺度降雨数据GPM-3IMERGM(简称为GPM)(https://pmm.nasa.gov/data-access/downloads/gpm),空间分辨率为0.1°;该产品融合了GPM,GCOM-W1,NOAA-18,NOAA-19,DMSP F-16,DMSP F-17,DMSP F-18,Metop-A和Metop-B 9种全球降水探测卫星和部分地面气象站的降水分析数据,对微小雨量和降雪的探测能力更强。降雨观测数据由中国气象局气象数据中心提供(
3 研究方法
3.1 降尺度算法
基于在低分辨率上建立的模型同样适用于高分辨率数据的假设[2],采用时滞地理加权回归模型对GPM月尺度产品进行尺度下延,主要包括以下四个步骤:(1)数据准备:分别采用双线性插值方法和三次立方卷积法将1 km分辨率的NDVI数据和DEM数据重采样至10 km分辨率,采用双线性插值方法将0.1°的GPM数据重采样至10 km。
(2)构建时滞地理加权回归模型。采用10 km分辨率的NDVI、DEM和GPM数据构建时滞地理加权回归模型。从回归模型中提取每一栅格中心点对应的常数项、NDVI系数项、DEM系数项以及残差项,得到低分辨率的模型回归系数、常数项及残差项的空间格局。
式中:PLR为10 km分辨率的GPM数据;NDVILR和DEMLR分别为10 km分辨率的NDVI和DEM数据;T为考虑的最大时滞阶数。本文主要考虑当月降雨对之后三个月内植被NDVI的影响,即在构建时滞地理加权回归模型时,分别采用滞后1~3个月(1~3阶)的NDVI,当采用当月的NDVI时,即为地理加权回归模型(0阶)。此外,本研究仅考虑回归系数的空间非平稳性,不考虑地理加权回归模型中时滞阶数的空间非平稳性,即NDVI的时滞阶数没有空间异质性。
式中:
式中:
(3)高分辨率的模型回归系数、常数项及残差项的空间格局。采用双线性插值方法将低分辨率(10 km)的模型回归系数、常数项及残差项的空间格局重采样为1 km(高分辨率),基于1 km分辨率建立逐栅格的地理加权回归模型。
(4)获取1 km分辨率的GPM数据。采用1 km分辨率的DEM与NDVI数据,基于步骤(3)中构建的1 km分辨率的地理加权回归模型预估1 km分辨率的GPM降尺度数据。
3.2 降尺度效果评估方法
GPM数据的降尺度效果评估包括降尺度数据与站点实测数据的对比,以及不同降尺度方法间的对比。不同降尺度方法间的对比包括时滞地理加权回归模型与多元线性回归模型[21]和地理加权回归模型的对比,值得注意的是,由于多元线性回归模型属于全局回归模型,需要考虑残差对最终降尺度结果的影响,因此对于多元线性回归模型,最终的降尺度数据为统计模型预估的1 km分辨率的数据加上残差[21]。通过对比降尺度前后的GPM数据与实测站点的相关性,采用均方根误差RMSE(eq.4),平均绝对误差MAE(eq.5),确定性系数R2(eq.6)分别对GPM原始数据、GWRDL降尺度数据、GWR降尺度数据、多元线性回归模型降尺度数据与气象站实测数据进行对比。各指标的计算如下:
式中:P表示GPM数据或降尺度GPM数据;O表示降雨观测值;n表示样本数量;
4 结果分析
4.1 降尺度模型的建立
时滞阶数的确定是分布滞后模型建立的关键问题。一般而言,时滞阶数是通过比较模型率定阶段的确定系数或者均方根误差等指标来确定,但本文GPM数据降尺度的目的是为了在获取高分辨率降水的同时,更加准确地捕捉降雨的空间差异。因此本文不是通过比较率定阶段的精度来确定各月份分布滞后模型的时滞阶数,而是通过综合比较不同时滞阶数的地理加权回归(GWRDL)模型降尺度效果,确定模型最优的时滞阶数。不同时滞阶数的时滞地理加权回归模型(GWRDL)的降尺度数据与站点实测值的确定性系数、均方根误差和平均绝对值误差见表1。在确定性系数最大时,均方根误差和平均绝对值误差最小即为最优的时滞阶数。太行山区春季(3—5月),最优时滞阶数为1阶;夏季和秋季(6—10月)最优时滞阶数均为0阶;秋末及冬季(11—次年2月),最优时滞阶数为1~3阶不等。因此在构建降雨降尺度模型时,春季(3—5月)和11月采用下一个月的NDVI,而夏季和秋季(6—10月)和2月采用当月的NDVI;1月采用当年3月的NDVI;12月采用次年3月的NDVI。
Tab. 1
表1
表1太行山分布时滞地理加权模型的确定性系数R2,均方根误差RMSE,平均绝对值误差MAE
Tab. 1
时滞阶数 | 1月 | 2月 | 3月 | 4月 | 5月 | 6月 | 7月 | 8月 | 9月 | 10月 | 11月 | 12月 | 平均 | |
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
R2 | 0 | 0.42 | 0.72 | 0.92 | 0.92 | 0.74 | 0.62 | 0.76 | 0.81 | 0.82 | 0.89 | 0.37 | 0.33 | 0.628 |
1 | 0.45 | 0.69 | 0.92 | 0.93 | 0.75 | 0.60 | 0.71 | 0.76 | 0.81 | 0.89 | 0.37 | 0.33 | 0.618 | |
2 | 0.57 | 0.70 | 0.90 | 0.93 | 0.78 | 0.61 | 0.70 | 0.74 | 0.80 | 0.88 | 0.36 | 0.37 | 0.627 | |
3 | 0.46 | 0.68 | 0.91 | 0.93 | 0.74 | 0.60 | 0.76 | 0.75 | 0.79 | 0.87 | 0.34 | 0.46 | 0.627 | |
RMSE (mm/月) | 0 | 3.36 | 3.52 | 7.24 | 6.59 | 18.44 | 26.93 | 32.64 | 35.05 | 15.71 | 7.79 | 11.52 | 1.73 | 14.211 |
1 | 3.27 | 3.71 | 7.20 | 6.31 | 18.52 | 27.80 | 36.20 | 35.38 | 16.21 | 8.11 | 11.38 | 1.68 | 14.647 | |
2 | 2.91 | 3.69 | 7.54 | 6.52 | 17.67 | 27.56 | 36.31 | 36.70 | 16.44 | 8.40 | 11.82 | 1.71 | 14.771 | |
3 | 3.16 | 3.80 | 7.29 | 6.49 | 17.97 | 27.67 | 32.61 | 35.71 | 16.70 | 8.65 | 12.14 | 1.63 | 14.487 | |
MAE (mm/月) | 0 | 2.25 | 2.51 | 5.86 | 5.00 | 13.32 | 20.61 | 25.17 | 28.45 | 13.71 | 6.24 | 10.09 | 1.23 | 11.204 |
1 | 2.25 | 2.91 | 5.82 | 4.84 | 13.63 | 21.19 | 26.22 | 28.96 | 13.93 | 6.27 | 9.99 | 1.27 | 11.439 | |
2 | 2.05 | 2.93 | 6.20 | 5.02 | 13.10 | 21.26 | 25.52 | 29.94 | 14.16 | 6.29 | 9.75 | 1.29 | 11.458 | |
3 | 2.19 | 2.94 | 6.07 | 5.04 | 13.35 | 21.63 | 23.68 | 29.71 | 14.68 | 6.56 | 9.81 | 1.23 | 11.407 | |
最优时滞阶数 | 2 | 0 | 1 | 1 | 2 | 0 | 0 | 0 | 0 | 0 | 1 | 3 | — |
新窗口打开|下载CSV
4.2 降尺度效果评估
以2015年7月为例,GPM产品在降尺度前后的空间格局如图2所示,可以发现GPM数据在降尺度前后具有相似的空间格局。与研究区实测降雨数据的对比发现(图3,见第1686页),70%的降尺度数据与实测数据的相关性在0.6~0.9之间,说明降尺度数据能够较好的反应大部分月份的降雨量空间格局。由于GPM数据在降雨量较大时和较小时都存在相对较大的误差[6],因此在太行山冬季(11—12月)降雨量较低,5月和8月(降雨量较大)时,GPM原始数据与实测降雨数据的相关性均较低,使得降尺度数据与实测数据的相关性也较低(图3,见第1686页)。与原始GPM和实测数据的相关性相比,68%的月份降尺度数据与实测数据的R2有所提高,75%的月份MAE和RMSE下降,其中冬季和春季(11—5月)的降雨精度提升较为显著。平均而言,降尺度后太行山GPM数据与实测降雨的RMSE降低了0.31 mm(2.16%),R2提高了0.05,说明GWRDL模型在保留GPM数据精度的同时提高了GPM数据的空间分辨率。图2
新窗口打开|下载原图ZIP|生成PPT图22015年7月GPM原始数据及其降尺度数据的空间格局
Fig. 2Spatial pattern of monthly original GPM data and downscaled GPM data in July 2015
图3
新窗口打开|下载原图ZIP|生成PPT图3GPM月降水降尺度前后精度对比
注:GPM_ORI为GPM原始数据与实测数据的对比,GPM_GWR为GPM降尺度数据与实测数据的对比。
Fig. 3Comparisons of observed precipitation with original GPM precipitation and downscaled GPM data at monthly scale
4.3 不同降尺度方法的对比
4.3.1 时滞地理加权回归模型与多元线性回归模型的对比 与多元线性回归模型(MLR模型)这种全局回归模型相比,局部回归模型(地理加权回归模型)更加适用于降水的空间降尺度。太行山区月尺度GWRDL模型的确定性系数介于0.83~0.99,远高于MLR模型(0.06~0.32),说明地理加权回归模型的鲁棒性更好。与研究区内实测降雨数据的对比发现(图4,见第1686页),利用多元线性回归模型降尺度后,所有月份R2均低于降尺度前,当以MAE或RMSE为评价指标,只有4%的月份降尺度后效果更优,说明多元线性回归模型虽然能够提高GPM数据的空间分辨率,但是降低了原始GPM数据的精度。而采用时滞地理加权回归模型对GPM数据进行降尺度后,降尺度数据与实测数据的相关性要高于原始GPM数据与实测数据的相关性(图3)。总体而言,与MLR模型相比,GWRDL模型的降尺度数据与实测数据的确定系数(R2)提高了0.1,RMSE和MAE分别降低了1.47 mm(9.49%)和1.03 mm(8.46%),其中,3—10月的降尺度效果差异最为显著。
图4
新窗口打开|下载原图ZIP|生成PPT图4不同方法降尺度结果与实测数据对比
注:GPM_GWRDL为时滞地理加权回归模型,GPM_GWR为地理加权回归模型,GPM_MLR为多元线性回归模型。
Fig. 4Comparisons of observed data with downscaling precipitation using different methods
4.3.2 时滞地理加权回归模型与地理加权回归模型的对比 与未考虑NDVI和降雨的时滞效应时相比,考虑时滞效应后,降尺度数据与实测数据的确定性系数平均提高了0.026,RMSE降低了0.15 mm,MAE降低了0.06 mm(表1)。其中春季时滞阶数为1阶时,确定性系数平均提高了0.011,RMSE降低了0.365 mm(3.4%),MAE降低了0.14 mm(1.74%);而冬季平均时滞阶数为2阶时,确定性系数提高了0.093,RMSE降低了0.184 mm(6.4%),MAE降低了0.067 mm(3.36%);说明在地理加权回归模型中引入时滞模型能有效提高降尺度结果的精度,其提升幅度与地理加权回归模型降尺度结果(0阶时的结果)相对原始GPM产品的精度提升幅度相当。
4.4 太行山区降雨的时空分布格局
太行山年均降水量介于400~800 mm,顺着山脉走势由东南向西北递减。受季风气候影响,山区降雨呈现两大特点(图5,见第1687页),一则来自东南方向的夏季风主导了全年降水过程,夏季降雨占全年降雨的70%以上;二则研究区月降水量的空间分布与风向关系紧密。太行山去冬季(12月—次年2月)受西北风控制,降水高值区位于北部山区;春末夏初(5月)东南风渐强,降水高值区向太行山东南迎风坡侧移动;夏季(6—8月)东南风最强,降水集中于东南面迎风坡;9月东南风减弱,降水中心向东北侧移动。就全年降雨量而言,东南方向(夏季迎风坡)降雨量显著高于西北方向(背风坡)。图5
新窗口打开|下载原图ZIP|生成PPT图52015年不同月份太行山降雨的空间格局
Fig. 5Spatial pattern of monthly precipitation in Taihang Mountains in 2015
5 讨论
5.1 残差修正
残差修正是否是降尺度算法的必要步骤一直是一个具有争议的话题。虽然绝大部分的卫星降水降尺度算法中包含残差修正,但也有研究表明对于全局回归模型(多元线性回归模型和指数回归模型),残差修正是必要的,但对于局部回归模型(地理加权回归模型)却无必要[19]。以太行山降尺度结果为例,将残差修正后的降尺度结果记为GPM_AF,残差修正前的结果记为GPM_BF,通过对比两者与实测降雨资料的差异可以发现。残差修正后58.3%的月份RMSE和MEA降低,50%的月份R2提高;而未经残差修正时,91.6%的月份RMSE和MEA降低,83.3%的月份R2提高(图6,见第1688页);残差修正使得GPM降尺度数据与实测数据的RMSE和MAE分别降低了0.67 mm和0.43 mm。上述研究表明在时滞地理加权回归模型中,不考虑残差修正的降尺度数据更加接近于实测降雨量,采用地理加权回归模型进行降雨降尺度时残差修正不是必要步骤。图6
新窗口打开|下载原图ZIP|生成PPT图6残差修正对降尺度效果的影响
注:GPM_BF为不考虑残差修正的结果,GPM_AF为考虑残差修正的结果
Fig. 6Effect of residual correction on downscaled precipitation
5.2 降尺度方法的适用性
局部回归模型假定变量之间的相关关系具有空间非平稳性,比全局回归模型(多元线性回归模型)更加适用于降水的空间降尺度。在年尺度上,TRMM产品的地理加权回归降尺度效果在中国华北地区[22]、天山山区[23]和青藏高原[19]均优于多元线性回归模型。本文的研究结果也印证了这一观点,与MLR模型相比,太行山地区的GWRDL模型降尺度数据与实测数据的确定系数(R2)提高了0.1,RMSE和MAE分别降低了1.47 mm(9.49%)和1.03 mm(8.46%)。这主要是由于太行山区位于半干旱地区,月降水分布具有很强的空间变异性,在全局尺度上,NDVI和DEM仅能解释月降雨变异的15%~20%,使得多元线性回归模型的确定系数仅为0.06~0.32,远低于其在干旱区的预估能力。例如位于中国干旱区的甘肃省,NDVI能解释80%以上的年降水空间变异[24],而NDVI和DEM能共同解释柴达木盆地65%以上的年降水空间变异[21]。可见,在半干旱区山地,以NDVI和DEM为解释变量的多元线性回归模型虽有一定效果,但其拟合度低于干旱区,使得多元线性回归模型对高分辨率降水空间分布的预测能力大打折扣。同为局部回归模型,时滞加权回归模型由于使用了与降雨关系更为密切的NDVI指数,其效果要优于地理加权回归模型,说明解释变量的选择在降尺度中至关重要。太行山区夏季和秋季(6—10月)受东南季风控制,集中了全年70%以上的雨量,植被的生长与当季降雨关系密切;而冬季降水主要为固态降水(即降雪),多储存于土壤中,用于春季植被返青,因此冬季降雨与第二年春季植被NDVI的关系较为密切,采用第二年春季的NDVI作为解释变量能有效的提高冬季降雨的降尺度效果。虽然采用时滞地理加权回归模型能够提高冬季降尺度模型的确定系数,但是鉴于NDVI与降雨在冬季没有显著的相关关系,利用NDVI来进行降水降尺度研究在冬季具有一定的局限性,使得冬季降尺度模型的确定系数均低于0.5,因此建议在植被生长季采用NDVI作为解释变量对GPM进行降尺度研究。
6 结论
基于GPM降水数据与NDVI、DEM等因子具有较好相关关系的假设,在考虑降雨与NDVI时滞效应的基础上,本文采用时滞地理加权回归模型对GPM降水数据进行了尺度下延,获取了2014—2016年太行山区1 km分辨率GPM月尺度数据。时滞地理加权回归模型能有效的对GPM数据进行空间降尺度,降尺度数据能够更加详细描述降雨的空间分布特征。降尺度后,GPM数据与实测数据的相关性较原始数据略微提高。考虑降雨与NDVI时滞性后,降尺度精度进一步提高,显著优于全局回归模型(多元线性回归模型)。然而降水还与许多别的因子具有相关性,例如坡度、坡向、风向、遮蔽度和地表温度等等,在以后的研究中,应当考虑在降尺度算法中引入更多合适的解释变量,以提高降尺度数据的精度。致谢:
真诚感谢二位匿名评审专家在论文评审中所付出的时间和精力,评审专家对本文结果分析、结论梳理方面的修改意见,使本文获益匪浅。参考文献 原文顺序
文献年度倒序
文中引用次数倒序
被引期刊影响因子
,
[本文引用: 1]
[本文引用: 1]
,
[本文引用: 2]
,
[本文引用: 1]
,
[本文引用: 1]
,
[本文引用: 1]
,
[本文引用: 2]
,
[本文引用: 1]
,
[本文引用: 1]
,
[本文引用: 1]
[本文引用: 1]
,
[本文引用: 1]
[本文引用: 1]
,
[本文引用: 1]
,
[本文引用: 1]
,
[本文引用: 1]
,
[本文引用: 1]
,
[本文引用: 1]
,
URLPMID:24019888 [本文引用: 1]
,
[本文引用: 1]
[本文引用: 1]
,
[本文引用: 1]
,
[本文引用: 3]
,
[本文引用: 1]
[本文引用: 1]
,
[本文引用: 3]
,
[本文引用: 1]
,
[本文引用: 1]
,
[本文引用: 1]
[本文引用: 1]