Statistical evaluation of proxies for the R factor of the Universal Soil Loss Equation
MAXiaoqing通讯作者:
收稿日期:2017-11-15
修回日期:2018-02-27
网络出版日期:2018-08-25
版权声明:2018《资源科学》编辑部《资源科学》编辑部
基金资助:
作者简介:
-->
展开
摘要
关键词:
Abstract
Keywords:
-->0
PDF (7842KB)元数据多维度评价相关文章收藏文章
本文引用格式导出EndNoteRisBibtex收藏本文-->
1 引言
土壤侵蚀是中国一大环境问题[1],其影响因子包括降雨、植被、地形等。与植被、地形等因子不同,降雨因子很难被人为控制和改变,是土壤侵蚀的重要地带性限制因素[2]。降雨侵蚀力反映了降雨引发土壤侵蚀的潜在能力,目前一般采用USLE(Universal Soil Loss Equation)和RUSLE(Revised Universal Soil Loss Equation)方法计算多年平均降雨侵蚀力(即R因子),这两种方法都是基于次降雨的EI30指标计算(E为次降雨总动能,I30为最大30min降雨强度)[3,4,5]。王万忠等[6]探究了不同降雨指标与土壤侵蚀的相关性,认为用EI30指标计算降雨侵蚀力在中国同样适用,目前,USLE和RUSLE中R因子广泛用于中国降雨侵蚀力相关研究[7,8,9]。R因子的计算需要较高时间分辨率的降雨过程数据。Wischmeier等认为[4],计算R因子时,降雨资料的时间分辨率应小于15min,且资料的时间序列长度大于20a[4],但这类降雨资料往往不易获取,尤其在发展中国家,此外,该计算方法相对复杂,计算需要花费大量的时间和劳力。因此,国内外众多研究者建立了简易模型(Proxies for the R factor,以下简称PR),该模型可以基于更容易获取的降雨数据来估算R因子,这些降雨数据包括日降雨、月降雨和年降雨等。表1列举了目前国内外应用较为普遍的15种降雨侵蚀力简易计算模型。这15种模型中,有2种(PR1、PR2)基于年降雨数据计算,6种基于月降雨数据计算(PR3—PR8),7种基于日降雨量数据计算(PR9—PR15),有5种基于中国数据建立(PR7、PR8、PR11、PR12、PR13),其中PR11在国内应用最为普遍(一般称为章文波模型),PR13为中国第一次水利普查时所采用的模型。
Table 1
表1
表1降雨侵蚀力简易计算模型
Table 1The simply models of the R factor
方程 | 建模地区 | 参考文献编号 | 变量说明 | ||
---|---|---|---|---|---|
年降雨量资料 | PRi表示第i个降雨侵蚀力简易计算方法; ARi、MRj和HMRk (MJ·mm/(hm2·h·a))分别表示第i年,第j月和第k个半月的降雨侵蚀力值; pj、pa、pi、p和MAP(mm)分别表示第j月的降雨量,年降雨量,第i月的年平均降雨量,最高的月平均降雨量以及年平均雨量; rain10(mm)表示一个月中日降雨量超过10mm的月降雨量,day10表示一个月中日降雨量超过10mm的天数; Pd>12.7(12, 0)(mm)表示大于12.7mm(或12mm或0mm)的日降雨量; Pdmax(mm)表示多年平均的最大日降雨量; H(m)和L分别表示站点的高程和以十进制为单位的 纬度; S(mm)表示多年平均的雨季降雨量(对于北半球区域为5—9月的降雨量,对于南半球区域为11—4月的降雨量); α、β、和η表示模型计算的参数,这些参数针对某一固定的站点为常量; F、MFI分别表示Fournier指数和修正的Fournier指数。 | ||||
PR1=0.048 30MAP1.610 (P<850mm) PR1=587.8-1.219 MAP+0.004105 MAP 2 (P ≥ 850mm) | 美国 | [10] | |||
PR2=699.3+7.000 1 MAP-2.719 0H | 美国 | [11] | |||
月降雨量资料 | |||||
美国 | [12] | ||||
PR4=0.073 97 MFI1.847 (MFI<55mm) PR4=95.77-6.081MFI+0.477 0MFI2 (MFI ≥ 55mm) | 美国 | [10] | |||
PR5=21.56MFI0.927 | 西班牙 | [2] | |||
PR6=25.1F | 西班牙 | [13] | |||
PR7=0.358 9MFI1.9462 | 中国 | [14] | |||
中国 | [15] | ||||
日降雨量资料 | |||||
马来西亚 | [16] | ||||
马来西亚 | [16] | ||||
中国 | [17] | ||||
中国 | [18] | ||||
中国 | [19] | ||||
澳大利亚 | [20] | ||||
澳大利亚 | [21] |
新窗口打开
如上所述,长时间序列的高分辨率降雨过程数据很难获取,甚至表1中的许多研究也并未获取到按USLE或RUSLE要求计算的R值,并以此为基准来建立或校正PR模型。如国内运用最为普遍的章文波模型[17],在其建立过程中根据PdI10d(Pd表示日降雨量,I10d表示日最大10min降雨强度)指标估算R 值[22],并以此为基准建立模型。显然,以R值的估计值作为基准建立降雨侵蚀力模型,必然会影响模型的精度,此外,大多数研究者是根据相对偏差(relative error)和纳什效率系数(Nash-Sutcliffe efficiency coefficient)评价PR对R的逼近程度[2, 23-25],而相对偏差和纳什效率系数都是样本数据的函数,属于随机变量,随样本数据的变化而变化,因此必须采用统计检验的方法以排除随机性因素的影响,但目前的相关研究中基本没有对相对偏差和纳什效率系数进行统计学比较,因此难以排除所观测到的相对偏差和纳什效率系数的提高仅仅是随机因素造成的结果这一可能性。
本研究获取了中国东部地区14个站点的基于1min分辨率降雨资料计算的R值数据,以此为基础,本文以相关系数为评价指标,对表1中15种PR模型在中国东部地区的适用性进行了统计学评估。基于该评估结果,本文也对不同时间分辨率降雨资料情况下的最优PR模型给出了建议。
2 数据来源与研究方法
2.1 数据来源
中国东部地区主要受水力侵蚀的影响,西部地区主要受风蚀和冻融侵蚀的影响[9]。本文以中国东部地区的14个站点为研究区,所采用的R值引用自参考文献[8],为根据1min时间分辨率的降雨过程资料计算结果。用于计算PR值的日降雨数据源于国家气象科学数据共享服务平台(http://data.cma.cn/)[26],并根据这些数据计算获得月和年雨量数据。计算PR的降雨资料的年限与R值保持一致,除五寨和阳城为1971—2000年,其余站点为1961—2000年,个别年份数据缺测较多没有参与计算。各站点基本情况及其R值见表2。Table 2
表2
表2研究区气象站点基本信息
Table 2Information of the selected meteorological stations
省份 | 名称 | 经度/°E | 纬度/°N | 高程/m | 降雨资料年数/a | R/(MJ·mm/(hm2·h·a)) |
---|---|---|---|---|---|---|
黑龙江 | 嫩江 | 125.13 | 49.10 | 222.3 | 30 | 1 368.7 |
通河 | 128.44 | 45.58 | 108.6 | 38 | 1 632.5 | |
山西 | 五寨 | 111.49 | 38.55 | 1 401.0 | 30 | 781.9 |
阳城 | 112.24 | 35.29 | 659.5 | 30 | 1 503.3 | |
陕西 | 绥德 | 110.13 | 37.30 | 929.7 | 29 | 992.8 |
延安 | 109.30 | 36.36 | 958.5 | 39 | 1 233.7 | |
四川 | 西昌 | 102.16 | 27.53 | 1 590.9 | 40 | 3 021.0 |
遂宁 | 105.35 | 30.30 | 278.2 | 33 | 4 091.3 | |
湖北 | 房县 | 110.46 | 32.02 | 426.9 | 31 | 2 298.4 |
黄石 | 115.03 | 30.15 | 19.6 | 32 | 6 049.4 | |
云南 | 腾冲 | 98.30 | 25.01 | 1 654.6 | 36 | 3 648.9 |
昆明 | 102.41 | 25.01 | 1 892.4 | 33 | 3 479.0 | |
福建 | 福州 | 119.17 | 26.05 | 84.0 | 39 | 5 871.1 |
长汀 | 116.22 | 25.51 | 310.0 | 31 | 8 258.5 |
新窗口打开
2.2 R和PR的计算
R值按RUSLE方法计算,公式为:式中R为多年平均降雨侵蚀力;n为降雨资料的年限;m为一年中侵蚀性降雨的次数;EI30为一次降雨事件的降雨侵蚀力;E为一次降雨过程总的降雨动能;I30为一次降雨中最大30分钟降雨强度;er、Pr和ir,分别为单位降雨动能、第r个时段的降雨量和第r个时段的降雨强度。
本文选择了表1中15种PR模型与RUSLE模型中R因子的计算方法进行比较,所有PR的单位统一为MJ·mm/(hm2·h·a),PR模型的计算公式详见表1。
2.3 相关系数差异的显著性检验
本文通过相关系数的统计学比较来评价不同的PR模型。若某一PR与R的相关系数显著大于另一PR,则认为该PR更适合用于估算R,如未通过“显著大”或“显著小”的检验,则认为两者与R的相关系数相等,用于估算R时效果相同。一般情况下,由于总体的所有样本数据不可能全部获取,故获取的相关系数随样本的变化而变化,因此相关系数的比较必须基于统计学检验。相关分为独立性相关(independent correlation)和非独立性相关(dependent correlation)两大类,需采用不同类别的检验方法。本文比较表1中PR1—PR15与R之间的相关系数(即r1、r2、…、r15),这些相关系数建立时均采用了相同的R变量,故应采用非独立性相关检验方法。本文采用Meng’s检验方法[27],该方法作为一种比较非独立性相关的方法,目前广泛应用于社会科学研究。Zheng等[28]用此方法分析了黄土高原最佳次降雨侵蚀力指标。陈晓安等[29]也从统计学角度评估了黄土高原最佳次降雨侵蚀力指标,但采用的方法为独立性相关系数的比较方法,不适合用于非独立性相关系数的比较。
Meng’s检验对两个和两个以上相关系数的比较,采用不同的计算公式。设有k个自变量(x1, x2, …, xi, …, xk)和一个因变量y,ri表示xi与y的相关系数。当比较两个相关系数时(假定为r1和r2),Meng’s检验的计算公式为:
$Z=(z_{r1}-z_{r2})\sqrt{\frac{N-3}{2(1-r_{x})h}}$(4)
式中Z值服从标准正态分布;zri为ri的Fisher z变换结果,
当比较多个相关系数(r1, r2, …, ri, …, rk; k>2)时,Meng’s检验的计算公式为:
式中
公式(7)的原假设为待检验的k个相关系数全相等,该公式只能判断k个相关系数全相等或不全相等,不能具体判定哪一个为异常值(显著大或显著小)。以下公式(8)通过检验某一相关系数ri与其它相关系数的平均值是否有显著差异,以此确定ri在待检验的k个相关系数中是否为异常值:
$Z=r_{\lambda{z_r}}\sqrt{\chi^{2}(k-1)}$(8)
式中
进行相关系数比较时,所进行的检验均为单侧检验,按一般规范,进行统计检验时显著性水平定为0.05。如对公式(8),其显著性水平的单侧检验阈值为±1.65,如计算的Z值小于-1.65,则认为待检验的ri为“显著大”的异常值,如Z值大于1.65,则ri为“显著小”的异常值,否则认为ri与其它相关系数的均值并无显著差异,ri为非异常值。
本研究设计了一种逐步检验的方法来进行r1, r2, …, ri, …, rk的排序。首先以所有待检验的相关系数为输入,通过公式(8),逐个判断每个相关系数是否为异常值,如对ri的检验结果为显著小,则将ri划归为L组(Less-correlated Class),否则划归为O组(Other Class);然后,分别以L组和O组为输入,重复进行以上步骤,直至每个组中均未检测到异常值或仅包含一个相关系数为止。
除进行相关系数的比较外,另选择平均相对误差(MRE,%)、均方根误差(RMES,MJ·mm/(hm2·h·a))和纳什效率系数(NSE)来评估PR对R的估算偏差,计算公式为:
$RMSE=\sqrt{\frac{\sum_{i=1}^{n}(PR_{j}-R_{j})^2}{n}}$(10)
式中n为站点的数量;Rj和PRj为第j个站点的R值和PR值;
3 结果及分析
如表2所示,14个站点的R值变化在(781.9~8258.5)MJ·mm/(hm2·h·a)之间,平均值为3159.3 MJ·mm/(hm2·h·a),最大值出现在长汀站,为8258.5 MJ·mm/(hm2·h·a),最小值出现在五寨站,为781.9 MJ·mm/(hm2·h·a),从南到北逐渐递减,表现出明显纬度地带性(R与站点纬度的相关系数r = -0.69,p =0.007),经度地带性不明显(r = -0.008,p =0.98)。各PR值也表现出类似的空间趋势。PR与R的相关系数及其显著性检验结果见图1。进行比较的15种PR均与R显著相关(r > 0.59,p < 0.03),表明这些方法都可用于估算中国东部地区的R值。图1同时给出了PR和R间的线性回归方程,这些方程可用于对各PR进行修正。表3给出了直接用PR和按图1中方程修正后的PR估算R值的RMSE、MRE和NSE。成对t检验表明,修正情况下的RMSE(p=0.008)、MRE(p=0.002)均显著变小,NSE(p=0.015)显著变大,表明修正后的估算误差显著降低。但并非所有的PR均如此,如PR8和PR13修正前后的RMSE、MRE和NSE变化很小。
显示原图|下载原图ZIP|生成PPT
图1R和PR的相关关系及回归方程
-->Figure 1Relationships between R and PR
-->
Table 3
表3
表3PR模型估算R值的平均相对误差、均方根误差和纳什效率系数
Table 3MRE, RMSE and NSE of the selected PRs in estimating R value
PRi | 直接估算 | 修正后估算 | |||||
---|---|---|---|---|---|---|---|
MRE | RMSE | NSE | MRE | RMSE | NSE | ||
/% | /(MJ·mm/(hm2·h·a)) | /% | /(MJ·mm/(hm2·h·a)) | ||||
PR1 | 29.0 | 1 287 | 0.65 | 31.8 | 1 183 | 0.70 | |
PR2 | 174.3 | 4 122 | -2.60 | 15.9 | 775 | 0.87 | |
PR3 | 32.5 | 1 459 | 0.55 | 29.9 | 1 102 | 0.74 | |
PR4 | 147.0 | 5 819 | -6.18 | 32.7 | 1 262 | 0.66 | |
PR5 | 31.0 | 2 128 | 0.04 | 26.6 | 1 195 | 0.70 | |
PR6 | 57.5 | 2 978 | -0.88 | 54.9 | 1 755 | 0.35 | |
PR7 | 58.8 | 2 438 | -0.26 | 31.7 | 1 253 | 0.67 | |
PR8 | 17.7 | 895 | 0.83 | 15.2 | 816 | 0.86 | |
PR9 | 96.8 | 2 396 | -0.22 | 13.1 | 703 | 0.90 | |
PR10 | 29.2 | 1 457 | 0.55 | 12.9 | 454 | 0.96 | |
PR11 | 31.7 | 1 314 | 0.63 | 10.6 | 316 | 0.98 | |
PR12 | 35.5 | 1 550 | 0.49 | 11.0 | 299 | 0.98 | |
PR13 | 12.5 | 376 | 0.97 | 9.7 | 351 | 0.97 | |
PR14 | 49.9 | 1 294 | 0.65 | 18.7 | 1 103 | 0.74 | |
PR15 | 28.2 | 698 | 0.90 | 14.1 | 361 | 0.97 | |
均值 | 55.4 | 2 014 | -0.26 | 21.9 | 862 | 0.80 |
新窗口打开
按本文设计的逐步检验方法(流程见图2,见第1629页),方程(8)首先将15种PR与R的相关系数分为了L1组(r1、r3、r4、r5、r6、r7、r14)和O1组(r2、r8、r9、r10、r11、r12、r13、r15)。L1组中的相关系数经检验又可分为L2组(r6)和O2组(r1、r3、r4、r5、r7、r14),经检验O2组内相关系数大小无显著性差异(p > 0.16)。O1组内系数经检验分为L3组(r2、r8、r9)和O3组(r10、r11、r12、r13、r15),其中L3组内的相关系数无显著性差异(p > 0.07)。O3组统计检验进一步分为L4组(r10)和O4组(r11、r12、r13、r15),O4组内相关系数的Meng’s检验表明无显著性差异(p > 0.16)。经过四轮检验后,得到了15种PR与R的相关系数的排序:
式中ri表示第i个PR与R之间的相关系数。方程(12)将表1中15个PR按与R的相关性大小分成了5组,从高到低依次为:(r11、r12、r13、r15),(r10),(r2、r8、r9),(r1、r3、r4、r5、r7、r14),(r6)。公式(7)的检验结果也表明每一个组内(只有一个相关系数值的除外)中的相关系数全相等(p > 0.27)。从趋势上看,基于日降雨简易计算模型(PR9—PR15)要显著优于年降雨(PR1、PR2)和月降雨(PR3—PR8)模型,但年降雨和月降雨模型差异不明显,这和表3中MRE、RMSE和NSE的结果基本一致。章文波等也得到了类似结果[14]。
显示原图|下载原图ZIP|生成PPT
图2R与15个PR间的相关系数差异性检验流程
注:括号中的数字为按公式(8)检验的p值,L组表示显著低于平均水平的相关系数,O组包括显著高于平均水平(加下划线)以及与平均水平无显著差异的相关系数。每一个平行四边形表示一个终端节点,其中的相关系数无显著性差异或仅有一个相关系数。
-->Figure 2Flow chart for comparing correlations between R and PR
-->
PR1和PR2是基于年降雨量资料的简易计算模型。方程(12)表明,r2显著大于r1,表3中数据也表明,根据修正后的PR2估算R值要明显优于PR1,PR2与R的相关性甚至显著优于许多月(PR3—PR7)和日(PR14)模型,因此当仅有年降雨量资料时,可采用修正后的PR2估算R值。
PR3—PR8为所选择的6种基于月降雨数据的简易计算模型。方程(12)表明,r8显著大于其它月降雨模型。因此当仅有月降雨量资料时,应选择PR8进行R值的估算。此外,注意到表3中对PR8是否作修正处理对估算结果影响不大,图1中PR8的回归方程的斜率项也很接近于1,进一步的t检验结果表明,可认为其斜率项显著等于1(p = 0.49),常数项显著等于0(p = 0.87),因此可以直接用PR8进行R值的估算,不必按图1中的方程进行修正。PR8是吴素业在大别山区建立的月降雨量模型,田刚等人对比分析了国内外常用的6种降雨侵蚀力简易计算模型在江西省潋水河流域的适用性,也发现PR8的结果最理想,具有最高的纳什效率系数和最低的相对偏差[24]。表1中6种月降雨侵蚀力模型中,PR8与其它模型的建模方式不同,PR3为复合型函数,包含了对数函数和幂函数形式,PR4-PR7是基于MFI指数或F指数建立的模型,而PR8为幂函数模型。Richardson[30]的研究结果也表明降雨量与降雨侵蚀力一般表现为幂函数关系,本文比较的日降雨模型中,相关性最高的PR模型(PR11、PR12、PR13、PR15)也均为幂函数模型。
表1中包括7种基于日降雨的简易侵蚀力计算模型(PR9—PR15)。按方程(12),PR11、PR12、PR13、PR15与R的相关性没有显著差异,且显著优于其它模型,这和表3中MRE、RMSE和NSE的计算结果一致。PR15模型公式包含了纬度信息,该模型基于澳大利亚新南威尔士州的数据建立,该地区纬度在21°S—37°S之间。图3d表明,直接用PR15估算中国东部地区的R值时,计算结果全部偏小,且偏小程度随纬度增加而增加,纬度超过40°的地区相对误差可达到60%~80%。表3计算中数据表明,用图1中的公式修正后,PR15的MRE由31.7%降低到了10.6%,因此,尤其当应用于中国东部高纬度地区时,PR15按图1中的公式进行校正能够得到更为优化的结果。
显示原图|下载原图ZIP|生成PPT
图3纬度与相对误差的关系
注:图中实线、r、p分别表示直接估算的相对误差的趋势线、与纬度的相关系数以及p值;图中虚线、r、p分别表示修正后的相对误差的趋势线、与纬度的相关系数以及p值。
-->Figure 3Relationship between latitude and RE
-->
PR11目前在国内运用最为广泛,PR12仅对PR11作了轻微调整,两者的计算结果非常接近,使得图1中两者的校正公式也很接近。值得关注的是图1中PR11和PR12与R回归方程的斜率项分别为0.74和0.69,与此对应,直接使用PR11和PR12估算R值时大部分情况下误差大于30%(图3a和图3b),因此可认为PR11和PR12估算R值时存在系统偏差,校正后得到更优的估算结果。钟莉娜等[31]在黄土高原的研究结果也表明,PR11和R之间存在显著的线性关系:R = 0.849PR11 ? 29.651,该公式同样表明PR11系统地高估了R值,文献[9]中图8也清楚表明这一趋势。PR11是以指标PdI10d作为基准值建立的,PdI10d与EI30的转换关系是依据全国8个气象站共约104个年度的降雨资料建立,在这104个年度中北方地区约占80%[22]。这导致主要基于北方数据建立的PdI10d和EI30的转换关系可能并不能很好地适用于中国东部,因此建议用修正后的PR11和PR12估算R。
PR13是中国第一次水利普查估算R的方法,图1中PR13的回归方程的斜率项非常接近于1,常数项也较小,t检验结果表明,其斜率项可认为显著等于1(p = 0.45),常数项可认为显著等于0(p = 0.24),因此当能够获取到日降雨量资料时,可直接用PR13估算R值,表3中数据也表明修正后的PR13估算R值的精度并没有显著提高。
4 结论
(1)本文分析比较了国内外运用较为广泛的15种PR模型与R之间的相关性,并建立了各PR与R的回归关系式。参与比较的15种PR都与R显著相关(r > 0.59,p < 0.03),相关系数统计检验的结果表明,日降雨模型的计算结果与R的相关系数显著高于年降雨和月降雨模型,而年降雨和月降雨模型差异不明显。由于大多数PR直接估算R时存有系统偏差,运用建立的回归关系式校正后能获得更好的估计精度。(2)依据相关系数统计学比较结果,本文对不同时间分辨率降雨资料情况下的最优PR模型给出了建议。当仅有年降雨量资料时,建议采用PR2模型;当仅有月降雨量资料时,建议采用PR8模型;以日降雨量数据估算R值时,使用PR11、PR12、PR13和PR15均可。
(3)相关系数分析结果表明,其它国家建立的PR模型也可以较好地运用于中国,尤其是澳大利亚的模型PR15,在与R的相关性排序中,和中国的3个模型PR11、PR12、PR13并列处于最高等级,但该模型的预测误差随纬度增大而增大,按文中给出的公式校正后能获得更为优化的结果。PR11为目前国内应用最为广泛的降雨侵蚀力模型,但估算R存在约30%系统偏差,实际运用时也最好作校正处理。PR13为第一次全国水利普查采用的降雨侵蚀力模型,该模型估算R时不存在系统偏差,可直接用于估算R值。
致谢:本文在数据搜集过程中得到了华中农业大学蔡崇法教授以及北京师范大学符素华教授、殷水清副教授等的鼎力协助,特此致谢。
The authors have declared that no competing interests exist.
参考文献 原文顺序
文献年度倒序
文中引用次数倒序
被引期刊影响因子
[1] | |
[2] | [J]. , |
[3] | [M]. . 282, |
[4] | [M]. 537, |
[5] | [M]. 703, |
[6] | [J]. , [J]. , |
[7] | [J]. , [J]. , |
[8] | [J]. , |
[9] | [J]. , |
[10] | [J]. , |
[11] | [J]. , |
[12] | [J]. , |
[13] | [J]. , |
[14] | [J]. , [J]. , |
[15] | [J]. , [J]. , |
[16] | [J]. , |
[17] | [J]. , [J]. , |
[18] | [J]. , |
[19] | [J]. , [J]. , |
[20] | [J]. , |
[21] | [J]. , |
[22] | [J]. , [J]. , |
[23] | [J]. , [J]., |
[24] | [J]. , [J]. , |
[25] | [J]. , [J]. , |
[26] | [EB/OL]. ( [EB/OL]. ( |
[27] | [J]. , |
[28] | [J]. , |
[29] | [J]. , [J]. , |
[30] | [J]. , |
[31] | [J]. , [J]. , |