删除或更新信息,请邮件至freekaoyan#163.com(#换成@)

基于随机森林模型的西藏人口分布格局及影响因素

本站小编 Free考研考试/2021-12-29

王超1,, 阚瑷珂2,, 曾业隆3, 李国庆4, 王民1, 次仁5
1. 北京师范大学地理科学学部,北京 100875
2. 成都理工大学地球物理学院,成都 610059
3. 中国科学院遥感与数字地球研究所,北京 100101
4. 鲁东大学资源与环境工程学院,烟台 264025
5. 西藏自治区科技信息研究所,拉萨 850000

Population distribution pattern and influencing factors in Tibet based on random forest model

WANGChao1,, KANAike2,, ZENGYelong3, LIGuoqing4, WANGMin1, CIRen5
1. School of Geography, Faculty of Geographical Science, Beijing Normal University, Beijing 100875, China
2. College of Geophysics, Chengdu University of Technology, Chengdu 610059, China
3. Institute of Remote Sensing and Digital Earth, CAS, Beijing 100101, China
4. School of Resources and Environmental Engineering, Ludong University, Yantai 264025, Shandong, China
5. Institute of Science & Technology Information of Tibet Autonomous Region, Lhasa 85000, China;
通讯作者:通讯作者:阚瑷珂(1980-), 男, 四川什邡人, 博士后, 讲师, 研究方向为人文地理与地理信息系统。E-mail: kanaike@qq.com
收稿日期:2017-08-31
修回日期:2019-03-11
网络出版日期:2019-04-25
版权声明:2019《地理学报》编辑部本文是开放获取期刊文献,在以下情况下可以自由使用:学术研究、学术交流、科研教学等,但不允许用于商业目的.
基金资助:西藏自治区自然科学基金项目(XZ2017ZRG-100, 2015ZR-13-56)国家科技支撑计划(2014BAL07B02-2)中国清洁发展机制基金赠款项目(2014058)
作者简介:
-->作者简介:王超(1992-), 女, 山西晋城人, 硕士生, 研究方向为区域可持续发展。E-mail: lrningxiang@163.com



展开

摘要
在乡镇尺度下厘清人口分布格局及其影响因素与区域差异,对在生态脆弱区制定可持续发展政策具有重大指导意义。基于2010年西藏自治区的乡镇尺度人口普查数据,提取人口密度和空间因子,利用空间统计方法分析了人口分布的疏密特征和集聚特征,对比运用多元线性回归方法和随机森林回归方法探索该地区人口分布的影响因素及其区域差异。结果表明:① 西藏乡镇人口密度在空间上表现出极强的非均衡性,其总体趋势是东南高西北低,高密度区与大江大河及主要交通干线具有较强的空间耦合性;② 大致以波绒乡(聂拉木县)—岗尼乡(安多县)为西藏的人口分界线,人口集聚的“核心—边缘”特征明显;③ 多元线性回归方法中,人造地表指数对人口分布的影响程度最大,随后依次为夜间灯光指数和路网密度;④ 利用随机森林方法进行的人口密度预测比多元线性回归方法精度高,可以用来对影响因子的重要性进行排序;排序在前六位的影响因子由高到低依次为夜间灯光指数、人造地表指数、路网密度、工业总产值、GDP和多年平均气温,它们与人口密度均呈正相关关系;地形地貌要素中以海拔和坡度的贡献率最大且与人口密度均呈负相关关系;⑤ 西藏人口分布格局的影响因素及其相互作用呈现出明显的区域差异特征,河谷是西藏地区人口的集聚区,主要分布在拉萨河谷、年楚河谷以及三江河谷;⑥ 通过随机森林回归分析,可以利用概念模型来表达人口分布影响因素,将主导因素概括为土地利用结构、道路通达度及城镇化水平。

关键词:人口分布;影响因素;乡镇尺度;随机森林;概念模型
Abstract
Clarifying the spatial pattern of population distribution, its influencing factors and regional differences at the township level is of great guiding significance for formulating sustainable development policies in ecologically fragile areas. Based on the population census data of Tibet at the township level in 2010, the population density and spatial factors were extracted. The density and clustering characteristics of the population distribution were analyzed by spatial statistical method. The multiple linear regression method and the random forest regression method were used to explore the population influencing factors and their regional differences of population distribution. The results showed that: (1) The population density of Tibet at the township level showed a strong spatial non-equilibrium. The general trend was high in the southeast and low in the northwest, and there was a strong spatial coupling between the main rivers and the main traffic trunks in high density area. (2) The "core-edge" characteristic of population clustering was obvious, and roughly to the wave of Borong (Nyalam County)-Gangni (Anduo County) as the demarcation line. (3) In the multiple linear regression method, the artificial surface index had the greatest influence on the population distribution, followed by the nighttime light index and road network density. (4) Random forest method was more accurate than multiple linear regression method to predict the population density, which can be used to sort the importance of the influencing factors. The influencing factors of the first six factors were the night light index, artificial surface index, road network density, industrial output value, GDP and multi-year average temperature, and these factors were positively correlated with population density. Among topographic factors, the contribution rate of elevation and slope was the largest, which was negatively correlated with population density. (5) The influencing factors and their interactions of population distribution in Tibet showed obvious regional differences. The valley was a gathering area for population in the study region, mainly in Lhasa River Valley, Nianchu River Valley and Sanjiang River Valley. (6) Through the analysis of random forest regression, the conceptual model can be used to express the influencing factors of population distribution, and the dominant factors were summarized as land use structure, road accessibility and urbanization level.

Keywords:population distribution;influencing factor;township scale;random forest;conceptual model

-->0
PDF (3428KB)元数据多维度评价相关文章收藏文章
本文引用格式导出EndNoteRisBibtex收藏本文-->
王超, 阚瑷珂, 曾业隆, 李国庆, 王民, 次仁. 基于随机森林模型的西藏人口分布格局及影响因素[J]. 地理学报, 2019, 74(4): 664-680 https://doi.org/10.11821/dlxb201904004
WANG Chao, KAN Aike, ZENG Yelong, LI Guoqing, WANG Min, CI Ren. Population distribution pattern and influencing factors in Tibet based on random forest model[J]. Acta Geographica Sinica, 2019, 74(4): 664-680 https://doi.org/10.11821/dlxb201904004

1 引言

人口分布是指某一特定时间段内某一空间范围的人口集散状态,同当地的地形、气候、资源等地理要素紧密相关,是自然因素和社会经济因素综合作用的结果,也是人类活动区域差异的客观反映[1]。不同人口分布状态下的人类活动对土地覆被、生态过程乃至全球变化产生重大影响[2,3,4]。揭示人口分布规律及其影响因素,对深刻理解人地关系,协调区域人口、资源与环境之间的矛盾[5,6],制定可持续发展政策具有重要指导意义。
西藏是青藏高原的主要组成部分,地形高差巨大、地质构造复杂、气候独特[7],是中国的“江河源”和“生态源”,更是中国的生态安全屏障[8]。然而,在人类活动和全球变化的综合影响下,该地区出现生态系统稳定性降低、资源环境压力增大等问题,突出表现为冰川退缩显著、水土流失严重、自然灾害增多、土地退化形势严峻(冻土退化、土地沙化及草地退化)等[9,10,11],严重制约着该地区的可持续发展。人口分布研究的深入开展有利于把握人类活动规律,对加强区域认知与可持续发展具有重要作用。目前在探讨青藏高原人口分布格局及影响因素上,众多****探讨了人口分布与海拔、土地利用、交通、河流水系、畜牧业等因素的关系[12,13,14,15]。另外,人口分布空间定量化也得到一定的发 展[16,17,18],进而利用1 km分辨率的人口分布栅格图探析人口分布作用于环境的定量关系[19,20]
值得注意的是,目前对于西藏地区的人口分布研究还主要依赖于县级尺度的统计数据;虽然利用遥感技术可以实现公里网格尺度下的人口空间定量化,但是由于遥感固有的尺度依赖关系,其可塑性面积存在较大的不确定性[21,22];另外由于区域人口分布规律独特,其影响因素是复杂、非线性的,已有研究多利用相关系数和线性回归的方法讨论其影响因素,未能深入刻画其关系[21, 23-24]。尽管公里网格的人口分布数据能展现更详细的空间细节,但由于东西部的自然条件及人口地域差异过大引起西部地区人口空间化存在较大误差[22];而乡镇尺度是中国人口统计数据公开发布的最小统计单元,较县级尺度反映更多的空间异质性,故在青藏高原地区选择乡镇尺度进行人口分布研究更具优势。在影响因素探讨上,现有研究表明,随机森林不需要顾虑一般回归分析面临的多元共线性的问题,不需要做变量选择,便于计算变量的非线性作用,而且可以评估自变量的重要性[25]。因此,本文选取西藏自治区乡镇尺度最近一次人口普查数据(第六次人口普查,2010年)及相应年份的影响因子数据,利用空间统计方法分析人口分布的疏密特征和集聚特征,对比运用多元线性回归方法和随机森林回归方法探索该地区人口分布的影响因素及其区域差异,以期为人口分布精细化模拟与协调人口、资源与环境关系提供科学依据和决策支持。

2 研究区概况

西藏是青藏高原的主体,平均海拔在4000 m以上,地势起伏显著,地形以高原和山地为主;气候复杂多样,以高原高山气候为主;水系发达,湖泊广布。区域内受地形、气候等因素的影响,植被区系丰富,森林、湿地、草原及冰川等自然景观多样,为农牧业和旅游业的发展提供了良好的自然条件,但生态环境脆弱[26]。复杂的地形地貌及高原气候制约着区域的经济发展,同时也造成该地区人口分布不均衡。

3 研究方法与数据来源

3.1 影响因素选取

人口分布的影响因素具有复杂多变性,依据其属性分为自然地理环境和社会经济两大类[27],但其构成要素各异,没有统一的标准。本研究假设任何构成自然地理环境和社会经济且作用于人口的要素皆能成为影响因素,根据前人相关研究及能够被空间量化的原则,总结了影响人口分布的七大因素:地形地貌、气候、植被覆盖、土地利用、河流、道路和经济发展。表1简要描述了这些影响因素,在影响机制上既有单向的因果关系(例如当人类改造客观世界的能力有限时,地形地貌成为了限制因素),也有双向的互为因果关系(例如经济发展程度能影响人口发展,反过来人口的发展状况也能影响经济发展);虽然某些因素(如夜间灯光指数和GDP)存在共线性特征,但在影响人口分布方面体现了不同的侧重点,允许它们同时存在。通过运行相关模型筛选出主要的影响因子,进而厘清西藏人口分布的影响因素。
Tab. 1
表1
表1影响人口分布的因素
Tab. 1Influencing factors of population distribution
影响因素影响因子描述
地形地貌(A)海拔(A1)地形地貌是影响人口分布的最基本因素之一:随着海拔高度的增加,地形起伏度呈现逐渐升高趋势,人口也随之减少[20];在中国人口大多居住在坡度小于15°的地区[19];而坡向是构成地形地貌因素的重要定量指标,通过调节各自然要素的分配影响人口分布,已有研究将其作为乡镇尺度人口分布的影响因子[28]
坡度(A2)
坡向(A3)
地形起伏度(A4)
气候(B)多年平均降雨量(B1)人类对不同水热条件影响下的资源和环境条件具有选择偏好,在较广的范围内,人口密度与气温、降水量呈显著的正相关关系[29]
多年平均气温(B2)
植被覆盖(C)NDVI(C)以NDVI为代表的植被指数能反映植被覆盖情况,一方面显示了人类生产生活所依赖的植被资源分布,另一方面则展示了不适宜居住区的空间分布(如沙漠和密林)[30]
土地利用(D)土地利用指数(Dn)根据“无土地则无人口”原则,人口分布受特定的土地利用类型影响,且土地利用面积与人口分布具有强相关性[22]
河流(E)河网密度(E1)河流一方面为人们提供充足而稳定的水源,另一方面造就沿岸地势低平、土壤肥沃的格局,为人们居住生活、基础设施建设和发展生产提供适宜的空间[20]
距河流距离(E2)
道路(F)路网密度(F1)基于交通条件的区域可达性与人口分布关系密切,该因素对欠发达地区人口集聚所起的作用远大于发达地区[15]
距道路距离(F2)
经济发展(G)夜间灯光指数(G1)夜间灯光亮度是城镇化的一个解释性指标,能反映城镇化水平,根据灯光影像的亮度值和人口距离衰减定律可以估算人口总数和人口分布[31,32];也可以在一定程度上反映GDP,但两者的定量关系仍存在较大不确定性,并且夜间灯光指数反映的是消费而非生产[33],不能完全替代经济统计数据;另外它还能反映区域的总体能源消耗量[34,35]。一般来说,区域人口分布与经济发展之间具有较强的一致性,产业结构的差异也会影响人口分布[36,37]
GDP(G2)
工业总产值(G3)
农林牧渔业
产值(G4)


新窗口打开

3.2 数据来源与预处理

按照原始数据的属性,本文的数据集可分为属性数据和空间数据。属性数据需要通过公共字段关联到空间数据中,空间数据则统一采用Albers等积投影坐标系,栅格空间分辨率为1 km。
人口统计数据来源于《中国2010年人口普查分乡、镇、街道资料》(西藏自治区)数据集,乡镇边界数据、河流水系与道路数据均来源于西藏自治区科技信息研究所。由于行政区域变迁、边界数字化误差等因素影响,乡镇边界和人口普查数据未能完全匹配,有必要对其进行核查与合并。调整一致后,利用ArcGIS将属性数据与对应的乡镇空间数据进行关联,得到624个行政单元,常住总人口为3002165人。需要说明的是,乡镇边界缺少7个县的数字化结果,以县级边界代替。
经济统计数据来源于《西藏统计年鉴》(2011)。为了匹配乡镇边界数据,进一步描述经济差异,将县级经济数据平均至对应的乡镇,得到乡镇尺度的农林牧渔业产值、工业总产值和GDP,并将其关联到对应的空间数据。
DEM数据来源于地理空间数据云网站(http://www.gscloud.cn/)SRTM数据集,空间分辨率为90 m;2010年夜间稳定灯光强度数据来源于NOAA网站(https://ngdc.noaa.gov/eog/dmsp/downloadV4composites.html),空间分辨率为30′′。
气象数据来源于国家生态系统观测研究网络科技资源服务系统(http://rs.cern.ac.cn/data/)2000-2012年全国1 km空间分辨率气温和降水栅格数据集[38]。该数据集采用日降雨和日均温两个要素,对其进行读取、合并、检查、统计、空间插值批处理代码的生成等操作,最后由ANUSPLINE软件插值生成1 km空间分辨率的年均气温和年降雨栅格数据。本文选取2001-2010年气温和降雨栅格数据并对其求平均,得到多年平均气温和多年平均降雨量。
NDVI数据(2010全年)来源于NASA官网(https://ladsweb.nascom.nasa.gov) MOD13A3数据集,空间分辨率为1 km,覆盖西藏全境。该数据集采用MVC方法得到的逐月NDVI能有效去除云雾的影响,广泛应用于植被覆盖、生态监测等领域[39,40]。运行MRT软件对NDVI数据进行批量重投影、重采样、裁剪,再计算NDVI年平均值。
2010年土地覆盖数据来源于全球地表覆盖产品GlobeLand 30(http://www.globallandcover.com),空间分辨率为30 m,覆盖西藏全境。该数据集是全球首套30 m全球地表覆盖数据,全球总体分类精度达80%以上[41,42,43],包括人造地表、耕地、林地等10大类型,在土地利用变化、人口密度估算、环境监测等领域拥有广阔的应用前景[44,45,46]

3.3 研究方法

3.3.1 人口分布格局分析方法 首先计算研究区各乡镇的人口密度,叠加河流、道路等空间信息对其进行人口密度分级制图,并统计不同人口密度等级的人口总数与面积,分析人口分布的疏密特征;再利用ArcGIS计算人口密度的莫兰指数(Moran′s I),分析人口分布的集聚特征。
莫兰指数是一个衡量空间相关性(集聚)的重要指标,包括全局性莫兰指数和局部莫兰指数,详细计算过程参考已有研究成果[47,48]。Moran′s I取值在-1~1之间,>0表示正自相关,即表示要素具有包含同样高或同样低的属性值的邻近要素;<0表示负自相关,即要素具有包含不同值的邻近要素;等于0则表示属性值是随机分布的。通过统计学上的显著性检验(P ≤ 0.05)的局部Moran′s I指数有4种输出模式:高值(H-H)聚类、低值(L-L)聚类、高值主要由低值围绕的异常值(H-L)以及低值主要由高值围绕的异常值(L-H)。全局莫兰指数用来判断是否存在空间集聚现象,而局部莫兰指数则可以探测集聚现象和异常值的空间分布。
3.3.2 影响因子提取 河流因子与道路因子。运行ArcGIS的Euclidean Distance工具,得到距河流距离与距道路距离;再根据公式(1)计算河网密度与路网密度。
RD=L/A(1)
式中:RD是河网密度或路网密度(km/km2);L是河流或道路的总长度(km);A为统计格网面积(km2),由Fishnet工具生成。
地形地貌因子。利用ArcGIS提取研究区的海拔、坡度、坡向和地形起伏度。其中,采用4 km2的普适性采样单元分别计算90 m空间分辨率DEM的最大值和最小值,再求两者的差值经重采样后得到地形起伏度[49]
土地利用指数因子。研究表明土地利用数据的面积信息在人口分布方面有很强的相关关系,在人口模拟估算方面得到广泛利用[28, 50-51]。本文采用格网统计的方法计算土地利用指数:首先生成拥有唯一识别字段的1 km2网格;再利用分区统计功能统计每一格网下30 m空间分辨率的各土地利用类型面积,并将其基于公共字段与网格进行属性连接;然后计算该土地利用类型面积占网格面积的比例;最后将网格数据转换成栅格数据。根据此方法,计算得到冰川和永久积雪指数(D1)、草地指数(D2)、耕地指数(D3)、灌木指数(D4)、裸地指数(D5)、人造地表指数(D6)、森林指数(D7)、湿地指数(D8)、水体指数(D9)和苔原指数(D10)。
运用ArcGIS的Zonal Statistics工具对夜间灯光指数、土地利用指数等22个栅格影响因子进行分区统计,得到乡镇尺度下各影响因子的平均值。
3.3.3 影响因素分析方法 以人口密度为因变量、影响因子为自变量,对比运用多元线性回归方法与随机森林回归方法进行拟合验证,探索研究区人口分布的影响因素。
首先利用SPSS 20.0计算人口密度与各影响因子(共计25个)的相关关系,再选择与人口分布相关关系较强的因子(r ≥ 0.6)作为自变量进行多元线性回归,采用标准化回归系数描述自变量对人口分布的影响程度。
随机森林(Random Forest)模型是由Breiman在2001年提出来的一种基于分类树的机器学习算法,该模型是利用bootsrap重抽样方法从原始样本中抽取多个样本,对每个bootsrap样本进行决策树建模,然后组合多棵决策树的预测,通过投票得出最终预测结 果[52,53]。随机森林模型由于本身在算法上具有明显而独特的优势,可以用来做聚类、判别、回归和生存分析,同时可以评估变量的重要性。本文是在R语言平台上进行的随机森林回归,参数设置如下:ntree = 5000,mtry = 3,其他默认。
由于缺少更大比例尺的人口统计数据,在使用人口密度统计实测值来验证多元线性回归和随机森林回归的精度时,一般进行必要性检验[50, 54],评价指标包括决定系数(R2)和平均绝对误差(MAE)。
R=i=1nPi-P?Oi-O?i=1nPi-P?2i=1nOi-O?2(2)
MAE=i=1nPi-Oin(3)
式中:Oi为第i个乡镇的统计实测人口密度;Pi为第i个乡镇的拟合人口密度; P?为所有乡镇拟合人口密度的平均值; O?为所有乡镇的统计实测人口密度的平均值。R2值越大,MAE值越小,模型解释精度越高。

4 结果与分析

4.1 人口分布格局

4.1.1 人口分布总体特征 利用ArcGIS对西藏乡镇尺度的人口密度进行分级(图1)。总体而言,西藏平均人口密度为2人/km2;人口分布呈现“东南—西北”模式,即东南部人口密度高于西北部;最高值出现在拉萨市的城关区街道(2928.8人/km2),最低值出现在山南地区的玉麦乡,仅为0.009人/km2。人口密度高值区主要分布在“一江两河”(雅鲁藏布江及其支流拉萨河与年楚河)的河谷平原区和怒江—澜沧江沿岸,大部分乡镇的人口密度介于10~50人/km2之间,且多条国道经过该地区;人口密度低值区位于研究区中部以北的藏北高原以及藏东南的中印边境地区,区域内的大河分布稀疏,主要的交通干线较少。表2统计了不同人口密度分级的乡镇人口总数与面积,并计算了它们的比例结构。结果显示,不同密度等级的人口和面积比例严重失衡:人口密度小于1人/km2的区域面积最大,比例高达63.82%,人口总量却只占西藏人口总数的7.86%;人口密度大于10人/km2的区域仅占总面积的4.48%,人口总量却超过了45%。
显示原图|下载原图ZIP|生成PPT
图12010年西藏乡镇尺度人口密度分布
-->Fig. 1The population density at township level in Tibet in 2010
-->

Tab. 2
表2
表2西藏不同人口密度分级的乡镇人口总数与面积
Tab. 2The total population and area of each population density range at township level in Tibet
人口密度分级(人/km2)统计单元个数(个)总人口(人)人口占比(%)总面积(km2)面积占比(%)
0~11022358807.8676847163.82
1~418955014918.3324466420.32
4~711548207016.06915167.60
7~107537828212.60456313.79
10~4012687034528.99519354.31
40~707439361.469180.08
70~100166210.22740.01
100~40061421814.747220.06
400~7002935423.121720.01
>70011991596.63680.01


新窗口打开
4.1.2 人口分布空间自相关分析 将各乡镇的人口密度值作为输入变量进行全局性莫兰指数的计算,得到Moran′s I = 0.112(Z = 29.803,P = 0),说明西藏的人口分布存在集聚现象,但集聚程度较低。为了检测人口集聚的空间分布状况,进行局部莫兰指数计算。初步的计算结果显示仅有极少数乡镇存在集聚现象,难以反映该地区的人口集聚状况,因此,有必要进行多次局部莫兰指数计算直至集聚状态稳定为止。本文进行了4次局部莫兰指数计算后结果趋于稳定(图2),需要指出的是,后一次局部莫兰指数计算的输入变量为前一次集聚结果中去除H-H模式后剩余的乡镇人口密度。
显示原图|下载原图ZIP|生成PPT
图2研究区人口分布的空间集聚特征
-->Fig. 2Spatial clustering characteristics of population distribution in the study area
-->

图2可知,西藏大致以波绒乡(聂拉木县)—岗尼乡(安多县)为人口分界线,该线东南部人口密度较大,西北部人口密度较小。形成了拉萨—乃东一级核心区、日喀则二级核心区、山南—昌都三级核心区与日喀则—昌都四级核心区(H-H模式):一级核心区主要位于拉萨市区与乃东县,是西藏人口分布最为密集的地区;二级核心区位于日喀则的雅鲁藏布江—年楚河沿岸地带,其人口密度为15.15~520.06人/km2,平均值为45.74人/km2,远大于全区的平均水平(2人/km2)且分布极不均衡;三级核心区主要位于雅鲁藏布江—拉萨河沿岸以及澜沧江及其支流沿岸,平均人口密度为20.61人/km2;四级核心区主要分布在三级核心区外围及317、318国道两侧,其人口密度最小值为6.54人/km2。在人口密度低值区出现了5处次一级的人口集聚中心,即H-L模式,均有河流或国道经过。另外,在人口集聚核心区外围出现了低值中心,即L-H模式。

4.2 人口分布的影响因素分析

4.2.1 多元线性回归与随机森林回归的人口密度验证 由表3可知,西藏人口分布与各影响因子的相关系数差异较大,且通过显著性检验的影响因子较少,与人口密度显著相关的仅有8个(与人口总数显著相关的有12个)。计算表3中与人口密度和与人口总数均通过显著性检验的相关系数平均值,可以发现:除海拔与人口分布呈负相关关系外,其他因子均呈正相关关系;人造地表指数、夜间灯光指数、路网密度与人口分布具有很强的相关性,均超过0.6;河网密度、工业总产值、GDP、多年平均气温对人口分布的影响较小。在相关性分析的基础之上,选择通过显著性检验且相关系数R ≥ 0.6的因子作为自变量进行多元线性回归,其拟合公式为:
y=0.778D6+0.142G1+0.081F1,(n=624,R2=0.69,P<0.001)(4)
Tab. 3
表3
表3人口分布与各影响因子的相关系数
Tab. 3The correlation coefficient between population distribution with each influencing factor
影响因子序号与人口密度相关系数与人口总数相关系数相关系数平均值
海拔A1-0.137**-0.172**-0.155
坡度A2-0.058-0.058-
坡向A30.0130.016-
地形起伏度A4-0.043-0.058-
多年平均降雨量B1-0.057-0.02-
多年平均气温B20.171**0.197**0.184
NDVIC-0.0010.047-
冰川和永久积雪指数D1-0.044-0.047-
草地指数D2-0.043-0.008-
耕地指数D30.0780.088*-
灌木指数D40.0670.049-
裸地指数D5-0.05-0.100*-
人造地表指数D60.942**0.810**0.876
森林指数D7-0.025-0.009-
湿地指数D8-0.015-0.02-
水体指数D9-0.023-0.021-
苔原指数D10-0.0050.072-
河网密度E10.498**0.437**0.468
距河流距离E2-0.045-0.071-
路网密度F10.664**0.630**0.647
距道路距离F2-0.048-0.089*-
夜间灯光指数G10.902**0.792**0.847
GDPG20.398**0.490**0.444
工业总产值G30.453**0.452**0.453
农林牧渔业产值G40.0360.327**-

注:*在0.05水平上显著相关,**在0.01水平上显著相关。
新窗口打开
式中:由于采用标准化回归系数,没有常数项;y为拟合人口密度;D6G1F1分别为人造地表指数、夜间灯光指数和路网密度。式(4)显示,人造地表指数、夜间灯光指数和路网密度与西藏地区的人口密度均呈正相关关系。人造地表指数的标准化回归系数最大,说明其对人口分布的影响程度最大,随后依次为夜间灯光指数和路网密度。
将全部影响因子作为自变量,对人口密度进行随机森林回归;分别计算经过两种回归方法得到的拟合值与统计实测人口密度值的R2与MAE(图3)。由图3可知,多元线性回归的R2为0.90,比随机森林回归小(R2 = 0.98);多元线性回归的MAE大于随机森林方法,说明随机森林的预测值偏离误差小于多元线性回归;另外,多元线性回归的人口密度预测值中存在1/3的负值,与人口密度的实际意义相悖,而随机森林的拟合值中并未发现负值。因此,随机森林的人口密度预测较多元线性回归拥有更大的R2,更小的偏离误差且具有实际意义,预测精度更高,可以用随机森林方法来分析人口分布的影响因素。
显示原图|下载原图ZIP|生成PPT
图3多元线性回归(a)与随机森林回归(b)人口密度验证散点图
注:为了展现更多的细节,只截取150人/ km2以下的区域进行显示。

-->Fig. 3Scatter plot of population density verification in Multiple Linear Regression (a) and Random Forest Regression (b)
-->

4.2.2 影响因素的重要性排序 图4显示了随机森林方法下影响因子的重要性排序情况,重要性排序靠前的因子与显著相关系数、多元线性标准化回归系数的排序趋于一致,但略有不同。以IncMSE方法为例,分析前6个影响因素对人口密度分布的作用(影响强度)。由图5可知,除多年平均气温(图5f)对人口密度的影响呈先升后降的趋势外,夜间灯光指数(图5a)、人造地表指数(图5b)、路网密度(图5c)、工业总产值(图5d)、GDP(图5e)对人口密度的影响均呈阶梯状上升的趋势:当夜间灯光指数≥ 42、人造地表指数≥ 0.38时,二者对人口密度的影响达到最大并保持不变;当路网密度在1.5~1.6 km/km2时,对人口密度分布的影响程度急剧增加,大于1.6 km/km2时,影响程度达到最大值并保持平稳不变;人口密度受GDP和工业总产值影响较大,且呈正相关关系,拉萨城关区所辖乡镇的GDP和工业总产值在西藏全区位居前列,其人口密度也最高正说明了这一点;对于气温条件(图5f),人口主要分布在年平均气温在7 ℃以上的地区,随着气温的升高,人口密度也随之增加,并在7.9 ℃时达到峰值。青藏高原地区的人口分布受地形限制较大,不可避免地要讨论该影响因素(海拔与坡度,地形地貌因素中IncMSE重要性排序前两位)对人口密度分布的作用。由图可知,海拔(图5g)和坡度(图5h)均与人口密度分布呈负相关关系,影响程度呈三级阶梯状下降的趋势:当海拔在2100~3800 m、坡度小于8°时,对人口密度分布的影响达到最大并保持不变;当海拔在3800~4100 m、坡度在8°~10°时,对人口密度分布的影响程度急剧下降;当海拔大于5100 m时、坡度大于28°时,对人口密度分布的影响程度达到最小并保持不变。
显示原图|下载原图ZIP|生成PPT
图4影响因子重要性排序
注:IncMSE为精度平均减少值,指将变量随机取值后进行随机森林模型估算误差相对于原来误差的升高幅度;IncMSE值越大,说明该变量越重要。IncNodePurity为节点不纯度平均减少值,是指该变量对各个决策树节点的影响程度;IncNodePurity值越大,说明该变量越重要。

-->Fig. 4The importance ranking of influencing factors
-->

显示原图|下载原图ZIP|生成PPT
图5夜间灯光指数(a)、人造地表指数(b)、路网密度(c)、工业总产值(d)、GDP(e)、多年平均气温(f)、海拔(g)、坡度(h)对人口密度的影响强度
-->Fig. 5Impact of the night light index (a), artificial surface index (b), road density (c), industrial output (d), GDP (e), annual average temperature (f), elevation (g) and slope (h) on population density
-->

4.2.3 影响因素的区域差异分析 为了探索人口密度影响因素的区域差异,对各地级市的因子进行随机森林回归拟合与验证,并列出重要性排序在前6位的影响因子(表4)。表4显示,各地级市人口密度拟合值的R2均大于0.85且偏离误差较小,说明该方法的预测精度较高,可以进行影响因子的重要性排序。夜间灯光指数和人造地表指数是影响拉萨、日喀则、林芝、阿里人口分布的主导因子,说明在这些地区,较高的区域发展水平对人口具有强大的吸引力,但在其他因素组成上略有差异:作为省会城市的拉萨,工业、农业的发展和基础设施的完善对人口集聚形成绝对引力;日喀则东部地区河谷农业发展迅速,人口规模较大;林芝地区旅游资源丰富且交通设施较为发达,对人口的吸引力较强;阿里地区平均海拔为西藏最高,气候寒冷干旱,人口分布极其稀疏。昌都地区贡献率第一的影响因素是海拔,其余因子与拉萨较为一致;地貌虽是山高谷深、起伏悬殊、藏东三江(金沙江、澜沧江、怒江)纵贯,但三江流域山间平原发育,农业气候资源丰富、雨热同季,又是“茶马古道”的一个重要枢纽,紧密勾连着西藏腹地与外界的交流,使之形成人口分布次级核心区。在山南地区,耕地指数和多年平均气温对于人口密度分布的影响显著高于其他因子;该区北部地处谷地,两河交汇处热量水平较高,为农业发展提供了良好条件;区域内耕地指数较高,乃东县、扎囊县、贡嘎县均是西藏非常重要的粮食生产基地,这就是山南地区北部成为人口分布核心区的主要原因。在那曲地区,自然因素对人口密度分布的影响程度显著高于社会经济因素,植被覆盖指数(NDVI)对人口密度分布的影响程度最高,其次为海拔;由于该区地处藏北高原,海拔高、热量不足、气候严寒干旱,人口分布较少(仅占15%);高原草地覆盖面积广大,丰富的草地资源为农牧民提供了集聚条件,该地区的农牧业总产值占GDP的90%以上说明了这一点。
Tab. 4
表4
表4西藏各地区人口密度拟合R2、MAE与影响因子排序
Tab. 4Population density fitting R2, MAE and their rankings of influencing factors among different regions in Tibet
地区R2MAE排序1排序2排序3排序4排序5排序6
拉萨市0.9850.84G1D6B2G3A1D2
昌都地区0.961.94A1D6G1B2G2D3
山南地区0.953.36D3B2A1D6G1D1
日喀则地区0.973.53D6G1D3F1B2A1
那曲地区0.920.60CA1B1B2F1D6
阿里地区0.980.30D6G1D3B2F1D1
林芝地区0.871.16G1D6F1F2D8A2

注:日喀则、昌都、林芝、山南先后于2014-2016年完成撤地设市。
新窗口打开
综合来看,河谷是西藏地区人口的集聚区,主要分布在拉萨河谷、年楚河谷以及三江河谷。土地是人口分布的载体,地势低平、相对开阔的河谷空间为人类活动的开展提供了最基础的土地条件。温和且雨热同期的气候特征以及邻近水源地使得区域内植被生长条件适宜,取用水方便且易于灌溉,农业发展条件较好,因此孕育了历史悠久的河谷农业,宜耕宜牧区人口集聚明显。交通网络体系的完善提高了区域交流沟通水平,城镇化进程的加快促使河谷区农业人口转化为非农业人口,较高的经济发展水平能进一步吸引人口的集聚,实现人口分布的再分配。

5 结论与讨论

5.1 结论

本文基于2010年西藏自治区的乡镇尺度人口普查数据,深化空间统计方法并引入了随机森林方法,精细而客观地刻画了该地区的人口分布格局,进一步厘清了人口分布影响因素及其区域差异。主要结论为:
(1)西藏乡镇人口密度在空间上表现出极强的非均衡性,其总体趋势是东南高西北低;高值区主要分布在“一江两河”的河谷平原区和怒江—澜沧江沿岸,低值区位于藏北高原以及藏东南的中印边境地区;大江大河与主要交通干线是人口分布的主要轴线。
(2)西藏的人口分布存在集聚现象,但集聚程度较低;大致以波绒乡(聂拉木县)—岗尼乡(安多县)为人口分界线,该线东南部人口密度较大,西北部人口密度较小;人口集聚的“核心—边缘”特征明显,形成了拉萨—乃东一级核心区、日喀则二级核心区、山南—昌都三级核心区与日喀则—昌都四级核心区,在人口集聚核心区外围出现了低值中心,在人口密度低值区出现了五处次一级的集聚中心。
(3)研究区人口分布与各影响因子的相关系数差异较大,通过显著性检验的影响因子较少;多元线性回归方法中,人造地表指数对人口分布的影响程度最大,随后依次为夜间灯光指数和路网密度。随机森林的人口密度预测较多元线性回归拥有更大的R2,更小的偏离误差且具有实际意义,预测精度更高,可以用来进行影响因子的重要性排序。重要性排序靠前的因子与显著相关系数、多元线性标准化回归系数的排序趋于一致,但略有不同,依次为夜间灯光指数、人造地表指数、路网密度、工业总产值、GDP、多年平均气温,这些因素与人口密度均呈正相关关系;地形地貌要素中以海拔和坡度的贡献率最大且与人口密度均呈负相关关系。
(4)西藏人口分布格局的影响因素及其相互作用呈现出明显的区域差异特征:夜间灯光指数和人造地表指数是影响拉萨、日喀则、林芝、阿里人口分布的主导因子,但在其他因素组成上略有差异;昌都地区贡献率第一的影响因素是海拔,其余因子与拉萨较为一致;山南地区的耕地指数和多年平均气温对人口密度分布的影响显著高于其他因子;那曲地区的NDVI对人口密度分布的影响程度最高,其次为海拔;综合来看,河谷是西藏地区人口的集聚区,主要分布在拉萨河谷、年楚河谷以及三江河谷。
(5)通过随机森林回归分析,可以利用概念模型来表达人口分布的影响因素,将主导因素概括为土地利用结构、道路通达度和城镇化水平,且三者相互影响、相互作用(图6)。区域内的地形、气候与植被组合条件不同引起土地利用结构各异,人口首先会在自然资源禀赋具有优势的地区产生集聚;道路通达度影响区域间的沟通交流水平,使包括人口在内的各资源要素产生流动,主要交通干道成为人口分布轴线;以城镇化水平(夜间稳定灯光强度)为代表的经济发展强度在资源禀赋和沟通交流水平基础上对人口分布进行再分配,形成“核心—边缘”效应。
显示原图|下载原图ZIP|生成PPT
图6人口分布概念模型
-->Fig. 6Conceptual model of population distribution
-->

本文通过多元线性回归与随机森林回归这两种方法对人口密度的拟合验证指标来评估它们对影响因素的解释精度,结果表明随机森林回归方法优于多元线性回归方法。然而,由于自然地理要素和社会经济要素对人口分布的影响是复杂非线性的,目前关于人口分布影响因素的研究还处于深入探索阶段,统计模型仍然是其主要研究方法[21, 55-57]。由于统计原理的差异,不同的统计模型对影响因素的解释存在差异,如本研究中夜间灯光指数、人造地表指数、工业总产值、GDP在不同统计方法中具有不同的重要性排序。明确并揭示这种差异的本质是非常重要的,但从目前已有的研究看,这是相当复杂的,甚至存在极大的不确定性[55, 58]。另外,对于可验证的自然科学研究,如增温效应估算、植被生物量模拟、土壤养分空间分布等领域[59,60,61],拟合预测的精度均可得到较满意的控制,从而使影响因素的解释精度较高;而对于以人类活动为主的社会科学研究领域,由于数据定量化的精度限制,目前对影响因素的解释仍处于“灰色”阶段,需要在以后的研究中深入探讨。
未来将在以下几个方面加强人口分布研究:① 对现有的人口普查乡镇数据进行系统处理,考虑从人口性质、人口迁移等不同侧面进行人口分布格局演变及其影响因素分析,并探讨不同归因方法对影响因素解释精度的差异;② 利用随机森林在分类、变量重要性排序方面的优越性,结合人口分布概念模型探索空间水平上的人口发展阶段及其类型;③ 基于人口分布概念模型,利用多种统计模型(地理加权回归、随机森林、神经网络等)进行人口空间定量化探索。
The authors have declared that no competing interests exist.

参考文献 原文顺序
文献年度倒序
文中引用次数倒序
被引期刊影响因子

[1]Jiang Dong, Yang Xiaohuan, Wang Naibin, et al.Study on spatial distribution of population based on remote sensing and GIS
. Advances in Earth Science, 2002, 17(5): 734-738.
https://doi.org/10.3321/j.issn:1001-8166.2002.05.016URLMagsci [本文引用: 1]摘要
<p>人口的空间分布问题涉及人口学、经济学、地理学等多个学科,统计型人口数据的空间化是&quot;数字地球&quot;的重要研究内容。阐述了人口地域分布的基本理论,回顾了人口空间分布的研究进展,结合研究实践,提出了在遥感、GIS技术支持下,统计型人口数据空间化的研究思路和技术流程,并对该方法的特点和应用前景做了展望。</p>
[江东, 杨小唤, 王乃斌, . 基于RS、GIS 的人口空间分布研究
. 地球科学进展, 2002,17(5): 734-738.]
https://doi.org/10.3321/j.issn:1001-8166.2002.05.016URLMagsci [本文引用: 1]摘要
<p>人口的空间分布问题涉及人口学、经济学、地理学等多个学科,统计型人口数据的空间化是&quot;数字地球&quot;的重要研究内容。阐述了人口地域分布的基本理论,回顾了人口空间分布的研究进展,结合研究实践,提出了在遥感、GIS技术支持下,统计型人口数据空间化的研究思路和技术流程,并对该方法的特点和应用前景做了展望。</p>
[2]Ferretti V, Pomarico S.Ecological land suitability analysis through spatial indicators: An application of the Analytic Network Process technique and Ordered Weighted Average approach
. Ecological Indicators, 2013, 34: 507-519.
https://doi.org/10.1016/j.ecolind.2013.06.005URL [本文引用: 1]
[3]Kleidon A.Climatic constraints on maximum levels of human metabolic activity and their relation to human evolution and global change
. Climatic Change, 2009, 95(3/4): 405-431.
https://doi.org/10.1007/s10584-008-9537-3URL [本文引用: 1]摘要
No matter what humans do, their levels of metabolic activity are linked to the climatic conditions of the land surface. On the one hand, the productivity of the terrestrial biosphere provides the source of chemical free energy to drive human metabolic activity. On the other hand, human metabolic activity results in the generation of heat within the body. The release of that heat to the surrounding environment is potentially constrained by the climatic conditions at the land surface. Both of these factors are intimately linked to climate: Climatic constraints act upon the productivity of the terrestrial biosphere and thereby the source of free energy, and the climatic conditions near the surface constrain the loss of heat from the human body to its surrounding environment. These two constraints are associated with a fundamental trade-off, which should result in a distinct maximum in possible levels of human metabolic activity for certain climatic conditions. For present-day conditions, tropical regions are highly productive and provide a high supply rate of free energy. But the tropics are also generally warm and humid, resulting in a low ability to loose heat, especially during daylight. Contrary, polar regions are much less productive, but allow for much higher levels of heat loss to the environment. This trade-off should therefore result in an optimum latitude (and altitude) at which the climatic environment allows humans to be metabolically most active and perform maximum levels of physical work. Both of these constraints are affected by the concentration of atmospheric carbon dioxide pCO 2 , but in contrary ways, so that I further hypothesize that an optimum concentration of pCO 2 exists and that the optimum latitude shifts with pCO 2 . I evaluate these three hypotheses with model simulations of an Earth system model of intermediate complexity which includes expressions for the two constraints on maximum possible levels of human metabolic activity. This model is used to perform model simulations for the present-day and sensitivity experiments to different levels of pCO 2 . The model simulations support the three hypotheses and quantify the conditions under which these apply. Although the quantification of these constraints on human metabolic activity is grossly simplified in the approach taken here, the predictions following from this approach are consistent with the geographic locations of where higher civilizations first emerged. Applied to past climatic changes, this perspective can explain why major evolutionary events in human evolutionary history took place at times of global cooling. I conclude that the quantification of these constraints on human metabolic activity is a meaningful and quantitative measure of the 鈥渉uman habitability鈥 of the Earth鈥檚 climate. When anthropogenic climate change is viewed from this perspective, an important implication is that global warming is likely to lead to environmental conditions less suitable for human metabolic activity in their natural environment (and for large mammals in general) due to a lower ability to loose heat.
[4]Yang Jun, Guan Xin, Li Xiangyun, et al.Study on the relations between the LUCC and demographic factors in the past 10 years of Tarim River Basin
. Journal of Arid Land Resources and Environment, 2006, 2(2): 114-117.
https://doi.org/10.3969/j.issn.1003-7578.2006.02.022URL [本文引用: 1]摘要
根据1990年、2000年两期土地利用现状图,运用地理信息系统软件ArcInfo、Arcview以及统计软件,提取、分析塔里木河流域41个县市1990-2000年土地利用/土地覆被的时空变化(LUCC)情况和土地利用程度综合指数。运用SPSS等统计软件,分析并建立土地利用程度人口分异模型,探讨了该研究区LUCC与人口因素的关系。此模型不仅可用于现阶段研究区LUCC分析,还可以根据人口变化趋势进行土地利用程度的变化趋势分析。这对塔河流域土地资源的有效利用和管理具有积极的意义。
[杨君, 关欣, 李香云, . 近10年塔里木河流域土地利用/土地覆被变化与人口因素关系研究
. 干旱区资源与环境, 2006, 2(2): 114-117.]
https://doi.org/10.3969/j.issn.1003-7578.2006.02.022URL [本文引用: 1]摘要
根据1990年、2000年两期土地利用现状图,运用地理信息系统软件ArcInfo、Arcview以及统计软件,提取、分析塔里木河流域41个县市1990-2000年土地利用/土地覆被的时空变化(LUCC)情况和土地利用程度综合指数。运用SPSS等统计软件,分析并建立土地利用程度人口分异模型,探讨了该研究区LUCC与人口因素的关系。此模型不仅可用于现阶段研究区LUCC分析,还可以根据人口变化趋势进行土地利用程度的变化趋势分析。这对塔河流域土地资源的有效利用和管理具有积极的意义。
[5]Feng Zhiming, Yang Yanzhao, You Zhen, et al.Research on the suitability of population distribution at the county level in China
. Acta Geographica Sinica, 2014, 59(6): 723-737.
https://doi.org/10.11821/dlxb201406001URL [本文引用: 1]摘要
以人口空间分布及其与资源环境和社会经济协调性评价为核心,提出了一整套人口与资源环境和经济社会发展协调水平评价的指标体系与模型方法;以分县为基本单元,定量评价了2010年中国人口与资源环境和社会经济发展的协调性和协调程度;根据人口分布适宜度高低和限制性差别,划分了中国分县人口分布适宜等级和限制类型,定量揭示了中国不同地区人口与资源环境和社会经济协调发展的时空格局和地域特征。研究表明:①2010年中国有3/5以上的县(市、区)人口分布与人居环境基本适宜,中国分县人口分布与人居环境自然适宜性保持了高度一致性;②2010年中国有1/2以上的县(市、区)人口发展基本不受水土资源约束,分县人口分布与水土资源适宜性处于中等水平;③2010年中国有超3/5的县(市、区)人口与社会经济发展基本协调,人口分布的社会经济协调性良好;④2010年中国近3/5的县(市、区)人口分布适宜度在60以上,人口资源环境与发展处于基本协调或相对协调状态;⑤2010年中国分县人口资源环境与发展的协调程度东部优于中部、中部优于西部;⑥2010年中国分县人口分布适宜度可划分为人口资源环境与发展基本协调、相对协调、有待协调和亟待协调4个适宜等级与10个限制类型。
[封志明, 杨艳昭, 游珍, . 基于分县尺度的中国人口分布适宜度研究
. 地理学报, 2014, 59(6): 723-737.]
https://doi.org/10.11821/dlxb201406001URL [本文引用: 1]摘要
以人口空间分布及其与资源环境和社会经济协调性评价为核心,提出了一整套人口与资源环境和经济社会发展协调水平评价的指标体系与模型方法;以分县为基本单元,定量评价了2010年中国人口与资源环境和社会经济发展的协调性和协调程度;根据人口分布适宜度高低和限制性差别,划分了中国分县人口分布适宜等级和限制类型,定量揭示了中国不同地区人口与资源环境和社会经济协调发展的时空格局和地域特征。研究表明:①2010年中国有3/5以上的县(市、区)人口分布与人居环境基本适宜,中国分县人口分布与人居环境自然适宜性保持了高度一致性;②2010年中国有1/2以上的县(市、区)人口发展基本不受水土资源约束,分县人口分布与水土资源适宜性处于中等水平;③2010年中国有超3/5的县(市、区)人口与社会经济发展基本协调,人口分布的社会经济协调性良好;④2010年中国近3/5的县(市、区)人口分布适宜度在60以上,人口资源环境与发展处于基本协调或相对协调状态;⑤2010年中国分县人口资源环境与发展的协调程度东部优于中部、中部优于西部;⑥2010年中国分县人口分布适宜度可划分为人口资源环境与发展基本协调、相对协调、有待协调和亟待协调4个适宜等级与10个限制类型。
[6]Li Jiaming, Lu Dadao, Xu Chengdong, et al.Spatial heterogeneity and its changes of population on the two sides of Hu Line
. Acta Geographica Sinica, 2017, 72(1): 148-160.
https://doi.org/10.11821/dlxb201701012URL [本文引用: 1]摘要
胡焕庸线作为人地关系的重要地理大发现之一,揭示了中国人口分布东密西疏的重要特征,是人文与经济地理学对社会的重要贡献之一。本文采用地理探测器等定量方法,以人口普查数据为基础,对胡焕庸线两侧人口分布的分异性特征进行了深入讨论,并尝试解释中国人口分布特征变化的原因及其机制。结果表明:1胡焕庸线作为中国最重要的人口分界线仍基本保持稳定,但从空间统计学分异特征来看该分界线仍可进一步优化调整;2胡焕庸线两侧内部人口集聚模式发生着明显变化,东南半壁人口分布由改革开放之前和初期的相对均衡状态,转变为以长三角、珠三角等少数区域为中心的集聚模式;而西北半壁人口分布的集聚程度则趋于下降;3从人口空间分布的影响因素看,尽管总体上,经济发展类因素对于人口空间分布影响不断增强,但三大阶梯等自然地理本底条件依然对中国人口分布有着重要影响。
[李佳洺, 陆大道, 徐成东, . 胡焕庸线两侧人口的空间分异性及其变化
. 地理学报, 2017, 72(1): 148-160.]
https://doi.org/10.11821/dlxb201701012URL [本文引用: 1]摘要
胡焕庸线作为人地关系的重要地理大发现之一,揭示了中国人口分布东密西疏的重要特征,是人文与经济地理学对社会的重要贡献之一。本文采用地理探测器等定量方法,以人口普查数据为基础,对胡焕庸线两侧人口分布的分异性特征进行了深入讨论,并尝试解释中国人口分布特征变化的原因及其机制。结果表明:1胡焕庸线作为中国最重要的人口分界线仍基本保持稳定,但从空间统计学分异特征来看该分界线仍可进一步优化调整;2胡焕庸线两侧内部人口集聚模式发生着明显变化,东南半壁人口分布由改革开放之前和初期的相对均衡状态,转变为以长三角、珠三角等少数区域为中心的集聚模式;而西北半壁人口分布的集聚程度则趋于下降;3从人口空间分布的影响因素看,尽管总体上,经济发展类因素对于人口空间分布影响不断增强,但三大阶梯等自然地理本底条件依然对中国人口分布有着重要影响。
[7]Mo Shenguo, Zhang Baiping, Cheng Weiming, et al.Major environmental effects of the Tibetan Plateau
. Progress in Geography, 2004, 23(2): 88-96.
https://doi.org/10.11820/dlkxjz.2004.02.011URLMagsci [本文引用: 1]摘要
<p>作为地球的&ldquo;第三极&rdquo;,青藏高原越来越受到世界的关注,本文就青藏高原的环境效应问题进行了研究和探讨。青藏高原的隆起和抬升,形成了其自身独特的自然环境特征,促成了独特的高原季风系统,造就了中国现代季风格局,影响着全球气候的变化和亚洲植被格局的分布,导致了亚洲干旱地带的北移和植被地带的不对称分布,形成了世界上著名的高原地带性植被格局。对中国东部、西北干旱区、亚洲的气候和植被格局乃至全球气候变化都具有深刻的影响。</p>
[莫申国, 张百平, 程维明, . 青藏高原的主要环境效应
. 地理科学进展, 2004, 23(2): 88-96.]
https://doi.org/10.11820/dlkxjz.2004.02.011URLMagsci [本文引用: 1]摘要
<p>作为地球的&ldquo;第三极&rdquo;,青藏高原越来越受到世界的关注,本文就青藏高原的环境效应问题进行了研究和探讨。青藏高原的隆起和抬升,形成了其自身独特的自然环境特征,促成了独特的高原季风系统,造就了中国现代季风格局,影响着全球气候的变化和亚洲植被格局的分布,导致了亚洲干旱地带的北移和植被地带的不对称分布,形成了世界上著名的高原地带性植被格局。对中国东部、西北干旱区、亚洲的气候和植被格局乃至全球气候变化都具有深刻的影响。</p>
[8]Cai Yunlong, Song Changqing, Leng Shuying.Future development trends and priority areas of physieal geography in China
. Scientia Geographica Sinica, 2009, 29(5): 619-626
URLMagsci [本文引用: 1]摘要
科学研究需要把握学科的发展趋势和优先领域。影响自然地理学发展的主要因素包括社会需求、学科自身性质和其他学科的影响。自然地理学当前发展态势包括积极参与多学科研究计划、新思维和新领域的出现、模式(model)作为重要手段、在认识自然演变机理的基础上解释空间格局、成果得到更广泛应用等。未来自然地理学将出现更加综合、在全球变化的高度上进行研究、更深入地揭示过程及其动态变化的机理机制、更多运用高新技术武装、更加密切地为实现区域可持续发展服务等趋势。中国自然地理学未来的优先领域是:人类活动对全球变化的影响及适应,土地变化过程及其生态环境效应与调控,城市化过程及其资源环境效应与调控,流域地表过程与综合管理,土壤演变过程及其对土壤质量的影响,资源与生态的可持续性,污染物的区域环境过程、健康风险与控制,灾害形成机制与综合风险管理,生态系统服务功能综合评估。要加强特殊自然地理区域的综合研究,包括区域综合理论研究,寒区现代地表过程对气候变化的响应,干旱化过程与人地关系演化,湿地生态过程、服务功能与恢复模式,风成环境与风成过程及其调控,喀斯特生态系统的演变过程与可持续性,青藏高原生态屏障作用及区域生态安全,山地灾害与环境相互作用及区域生态安全。
[蔡运龙, 宋长青, 冷疏影. 中国自然地理学的发展趋势与优先领域
. 地理科学, 2009, 29(5): 619-626.]
URLMagsci [本文引用: 1]摘要
科学研究需要把握学科的发展趋势和优先领域。影响自然地理学发展的主要因素包括社会需求、学科自身性质和其他学科的影响。自然地理学当前发展态势包括积极参与多学科研究计划、新思维和新领域的出现、模式(model)作为重要手段、在认识自然演变机理的基础上解释空间格局、成果得到更广泛应用等。未来自然地理学将出现更加综合、在全球变化的高度上进行研究、更深入地揭示过程及其动态变化的机理机制、更多运用高新技术武装、更加密切地为实现区域可持续发展服务等趋势。中国自然地理学未来的优先领域是:人类活动对全球变化的影响及适应,土地变化过程及其生态环境效应与调控,城市化过程及其资源环境效应与调控,流域地表过程与综合管理,土壤演变过程及其对土壤质量的影响,资源与生态的可持续性,污染物的区域环境过程、健康风险与控制,灾害形成机制与综合风险管理,生态系统服务功能综合评估。要加强特殊自然地理区域的综合研究,包括区域综合理论研究,寒区现代地表过程对气候变化的响应,干旱化过程与人地关系演化,湿地生态过程、服务功能与恢复模式,风成环境与风成过程及其调控,喀斯特生态系统的演变过程与可持续性,青藏高原生态屏障作用及区域生态安全,山地灾害与环境相互作用及区域生态安全。
[9]Luo Lifang, Zhang Keli, Kong Yaping, et al.Temporal and spatial distribution of soil loss on Tibet-Qing Plateau
. Journal of Soil and Water Conservation, 2004, 18(1): 58-62.
URL [本文引用: 1]

[罗利芳, 张科利, 孔亚平, . 青藏高原地区水土流失时空分异特征
. 水土保持学报, 2004, 18(1): 58-62.]
URL [本文引用: 1]
[10]Niu Yafei.The study of environment in the Plateau of Qing-Tibet
. Progress in Geography, 1999, 18(2): 69-77.
https://doi.org/10.3969/j.issn.1007-6301.1999.02.010URL [本文引用: 1]摘要
论述青藏高原生态环境现状和面临的严重问题,从人口、资源和环境角度阐述造成高原严重生态环境问题的自然和社会根源。分析解决高原生态环境问题所面临的巨大的自然和社会经济障碍,给出重新认识和评价高原资源优势的新视点,并提出适合于高原自然和社会经济环境的优先产业。
[牛亚菲. 青藏高原生态环境问题研究
. 地理科学进展, 1999, 18(2): 69-77.]
https://doi.org/10.3969/j.issn.1007-6301.1999.02.010URL [本文引用: 1]摘要
论述青藏高原生态环境现状和面临的严重问题,从人口、资源和环境角度阐述造成高原严重生态环境问题的自然和社会根源。分析解决高原生态环境问题所面临的巨大的自然和社会经济障碍,给出重新认识和评价高原资源优势的新视点,并提出适合于高原自然和社会经济环境的优先产业。
[11]Sun Honglie, Zheng Du, Yao Tandong, et al.Protection and construction of the national ecological security shelter zone on Tibetan Plateau
. Acta Geographica Sinica, 2012, 67(1): 3-12.
https://doi.org/10.11821/xb201201001URL [本文引用: 1]摘要
青藏高原对我国乃至亚洲生态安全具有重要的屏障作用。在全球变化和人类活动的综合影响下,青藏高原呈现出生态系统稳定性降低、资源环境压力增大等问题,突出表现为:冰川退缩显著、土地退化形势严峻、水土流失加剧、生物多样性威胁加大与珍稀生物资源减少、自然灾害增多等。这些问题严重影响了青藏高原区域生态安全屏障功能的发挥。针对当前高原生态安全状况,在总结相关研究成果和生态建设实践经验的基础上,提出了加强青藏高原国家生态安全屏障保护与建设的对策建议:加强气候变化对青藏高原生态屏障作用影响及区域生态安全调控作用的基础研究;系统开展高原生态安全屏障保护和建设关键技术研究与示范推广;部署建设生态屏障功能动态监测体系,加强生态安全屏障保护与建设成效评估,构建评估体系和标准,并凝练经验,以系统提升国家生态安全屏障的总体功能,在应对全球变化中占据主动地位。
[孙鸿烈, 郑度, 姚檀栋, . 青藏高原国家生态安全屏障保护与建设
. 地理学报, 2012, 67(1): 3-12.]
https://doi.org/10.11821/xb201201001URL [本文引用: 1]摘要
青藏高原对我国乃至亚洲生态安全具有重要的屏障作用。在全球变化和人类活动的综合影响下,青藏高原呈现出生态系统稳定性降低、资源环境压力增大等问题,突出表现为:冰川退缩显著、土地退化形势严峻、水土流失加剧、生物多样性威胁加大与珍稀生物资源减少、自然灾害增多等。这些问题严重影响了青藏高原区域生态安全屏障功能的发挥。针对当前高原生态安全状况,在总结相关研究成果和生态建设实践经验的基础上,提出了加强青藏高原国家生态安全屏障保护与建设的对策建议:加强气候变化对青藏高原生态屏障作用影响及区域生态安全调控作用的基础研究;系统开展高原生态安全屏障保护和建设关键技术研究与示范推广;部署建设生态屏障功能动态监测体系,加强生态安全屏障保护与建设成效评估,构建评估体系和标准,并凝练经验,以系统提升国家生态安全屏障的总体功能,在应对全球变化中占据主动地位。
[12]Gao Zhiqiang, Liu Jiyuan, Zhuang Dafang.The relations analysis between ecological environmental quality of Chinese land resources and population
. Journal of Remote Sensing, 1999, 3(1): 67-71.
https://doi.org/10.3321/j.issn:1007-4619.1999.01.011URL [本文引用: 1]摘要
基于用数字环境模型对中国土地资源生态环境质量评价的基础上,生成了中国土地资源生态环境综合评价图和人口密度分布图。首先分析了中国土地资源生态环境等级面积构成及分布状况,中国土地资源生态环境质量最好的地区全部分布在东南沿海和四川盆地地区,之后,用相关分析方法及关系曲线分析了中国土地资源生态环境质量同人口分布的关系,得出了土地资源生态环境质量指数同人口存在着实质性的相关关系,中国东南沿海和四川盆地地区是中国土地资源生态环境最好的地区,也是人口密度和土度资源利用程度最高的地区,而西北及青藏高原区是中国土地资源生态环境比较差的地区,也是人口密度比较低的地区。
[高志强, 刘纪远, 庄大方. 基于遥感和GIS的中国土地资源生态环境质量同人口分布的关系研究
. 遥感学报, 1999, 3(1): 67-71.]
https://doi.org/10.3321/j.issn:1007-4619.1999.01.011URL [本文引用: 1]摘要
基于用数字环境模型对中国土地资源生态环境质量评价的基础上,生成了中国土地资源生态环境综合评价图和人口密度分布图。首先分析了中国土地资源生态环境等级面积构成及分布状况,中国土地资源生态环境质量最好的地区全部分布在东南沿海和四川盆地地区,之后,用相关分析方法及关系曲线分析了中国土地资源生态环境质量同人口分布的关系,得出了土地资源生态环境质量指数同人口存在着实质性的相关关系,中国东南沿海和四川盆地地区是中国土地资源生态环境最好的地区,也是人口密度和土度资源利用程度最高的地区,而西北及青藏高原区是中国土地资源生态环境比较差的地区,也是人口密度比较低的地区。
[13]Liao Shunbao, Sun Jiulin.Quantitative analysis of relationship between population distribution and environmental factors in Qinghai-Tibet Plateau.
China Population, Resources and Environment, 2003, 13(3): 65-70.
https://doi.org/10.3969/j.issn.1002-2104.2003.03.014URL [本文引用: 1]摘要
本文利用GIS工具定量地分析了青藏高原地区人口分布与海拔高 度、土地利用、道路网、河流水系等环境因素的关系以及人口密度与居民点密度之间的关系,这些客观存在的关系是进行人口统计数据空间化的基础.在此基础上, 文章进一步分析和探讨了青藏高原人口分布与其它地区人口分布的差异性及其原因.
[廖顺宝, 孙九林. 青藏高原人口分布与环境关系的定量研究
. 中国人口·资源与环境, 2003, 13(3): 65-70.]
https://doi.org/10.3969/j.issn.1002-2104.2003.03.014URL [本文引用: 1]摘要
本文利用GIS工具定量地分析了青藏高原地区人口分布与海拔高 度、土地利用、道路网、河流水系等环境因素的关系以及人口密度与居民点密度之间的关系,这些客观存在的关系是进行人口统计数据空间化的基础.在此基础上, 文章进一步分析和探讨了青藏高原人口分布与其它地区人口分布的差异性及其原因.
[14]Qin Xiaojing.The spatial-temporal patterns and coupling relationship of animals husbandry and rural laborers across Tibet
[D]. Nanchong: China West Normal University, 2016.
[本文引用: 1]

[秦小静. 西藏自治区畜牧业与乡村人口的时空格局及耦合关系
[D]. 南充: 西华师范大学, 2016.]
[本文引用: 1]
[15]Wang Zhenbo, Xu Jiangang, Zhu Chuangeng, et al.The county accessibility divisions in China and its correlation with population distribution
. Acta Geographica Sinica, 2010, 65(4): 416-426.
https://doi.org/10.11821/xb201004004URL [本文引用: 2]摘要
可达性空间划分是交通地理学研究的重要领域。分析其与人口布局的关系,对当下中国的发展具有重要的理论与实践意义。借助GIS 软件平台,运用栅格成本加权距离算法,计算全国县 (市、区) 域单元的空间可达性并进行区域划分,进而探讨中国大区域交通可达性与人口分布的关系,揭示不同交通条件和不同区域类型中人口迁移与人口流动内在机制,为区域规划、交通规划和中国人口配置提供科学依据。研究表明,①栅格成本加权距离算法可以实现空间可达性概念从定性描述转向定量计算的精确转换;②中国县域可达性以低值为主,具有圈层状和"反自然梯度"空间结构,"黑河—腾冲"线为明显分界线;③中国大陆分为3大区:可达性高值区、可达性中值区、可达性低值区。可达性中值区又可分为东南诸省亚区、陕甘宁晋亚区、吉林亚区;可达性低值区分为云川渝亚区、蒙黑亚区、新疆亚区、青藏亚区;④国家区域范围内县域可达性与人口密度具有明显的相关性,2.5小时圈是目前中国可达性与人口集聚产生作用的最远距离;中国县域可达性越高的区域,可达性对人口集聚产生作用圈就越大,而可达性值与人口数量的相关性越小,说明交通条件对落后地区人口集聚所起到的作用远远大于发达地区。
[王振波, 徐建刚, 朱传耿, . 中国县域可达性区域划分及其与人口分布的关系
. 地理学报, 2010, 65(4): 416-426.]
https://doi.org/10.11821/xb201004004URL [本文引用: 2]摘要
可达性空间划分是交通地理学研究的重要领域。分析其与人口布局的关系,对当下中国的发展具有重要的理论与实践意义。借助GIS 软件平台,运用栅格成本加权距离算法,计算全国县 (市、区) 域单元的空间可达性并进行区域划分,进而探讨中国大区域交通可达性与人口分布的关系,揭示不同交通条件和不同区域类型中人口迁移与人口流动内在机制,为区域规划、交通规划和中国人口配置提供科学依据。研究表明,①栅格成本加权距离算法可以实现空间可达性概念从定性描述转向定量计算的精确转换;②中国县域可达性以低值为主,具有圈层状和"反自然梯度"空间结构,"黑河—腾冲"线为明显分界线;③中国大陆分为3大区:可达性高值区、可达性中值区、可达性低值区。可达性中值区又可分为东南诸省亚区、陕甘宁晋亚区、吉林亚区;可达性低值区分为云川渝亚区、蒙黑亚区、新疆亚区、青藏亚区;④国家区域范围内县域可达性与人口密度具有明显的相关性,2.5小时圈是目前中国可达性与人口集聚产生作用的最远距离;中国县域可达性越高的区域,可达性对人口集聚产生作用圈就越大,而可达性值与人口数量的相关性越小,说明交通条件对落后地区人口集聚所起到的作用远远大于发达地区。
[16]Liao Shunbao, Li Zehui.Study on spatialization of population census data based on relationship between population distribution and land use: Taking Tibet as an example
. Journal of Natural Resources, 2003, 18(6): 659-665.
https://doi.org/10.11849/zrzyxb.2003.06.003URLMagsci [本文引用: 1]摘要
土地是人与自然相互作用的产物,人口分布与土地利用具有非常密切的关系。根据1999年全国市县统计人口数据与各市县土地利用类型指数的相关性分析,发现各市县平均人口密度与各市县各类土地利用指数的复相关系数为0.82,在西藏、青海和海南3省区,复相关系数均达到0.99。以西藏自治区为例,根据市县人口密度与土地利用指数及数字高程的相关关系建立了人口数据空间化模型,并计算出西藏自治区1km&times;1km分辨率的栅格人口数据。在被选作验证区的3县37个乡镇中,用模型计算出的各乡镇人口密度与各乡镇的实际人口密度的相关系数为0.88。因此,土地利用信息是进行市县级人口统计数据空间化的重要参数,利用土地利用与人口分布之间客观存在的关系可以进行市县级人口统计数据的空间化。
[廖顺宝, 李泽辉. 基于人口分布与土地利用关系的人口数据空间化研究: 以西藏自治区为例
. 自然资源学报, 2003, 18(6): 659-665.]
https://doi.org/10.11849/zrzyxb.2003.06.003URLMagsci [本文引用: 1]摘要
土地是人与自然相互作用的产物,人口分布与土地利用具有非常密切的关系。根据1999年全国市县统计人口数据与各市县土地利用类型指数的相关性分析,发现各市县平均人口密度与各市县各类土地利用指数的复相关系数为0.82,在西藏、青海和海南3省区,复相关系数均达到0.99。以西藏自治区为例,根据市县人口密度与土地利用指数及数字高程的相关关系建立了人口数据空间化模型,并计算出西藏自治区1km&times;1km分辨率的栅格人口数据。在被选作验证区的3县37个乡镇中,用模型计算出的各乡镇人口密度与各乡镇的实际人口密度的相关系数为0.88。因此,土地利用信息是进行市县级人口统计数据空间化的重要参数,利用土地利用与人口分布之间客观存在的关系可以进行市县级人口统计数据的空间化。
[17]Liao Shunbao, Sun Jiulin.GIS based spatialization of population census data in Qinghai-Tibet Plateau
. Acta Geographica Sinica, 2003, 58(1): 25-33.
https://doi.org/10.3321/j.issn:0375-5444.2003.01.004URL [本文引用: 1]摘要
根据2000年第5次全国人口普查数据分析,西藏、青海2省区各市县平均人口密度与海拔高度、土地利用、主要道路有较强的相关关系,河流水系对居民点分布的影响较为明显,而居民点是人口分布的重要指示因子.以GIS软件为工具,通过较为客观的方式赋予各影响因子人口分布影响权重,运用多源数据融合技术进行了人口统计数据的空间化.结果显示,通过数据融合产生的人口密度与各市县实际人口密度的相关系数大于0.80,与试验区各乡镇的实际人口密度的相关系数大于 0.75.最终生成的栅格人口密度数据既与各市县统计型人口数据保持一致,又反映了各市县内部人口分布的空间变化.
[廖顺宝, 孙九林. 基于GIS的青藏高原人口统计数据空间化
. 地理学报, 2003, 58(1): 25-33.]
https://doi.org/10.3321/j.issn:0375-5444.2003.01.004URL [本文引用: 1]摘要
根据2000年第5次全国人口普查数据分析,西藏、青海2省区各市县平均人口密度与海拔高度、土地利用、主要道路有较强的相关关系,河流水系对居民点分布的影响较为明显,而居民点是人口分布的重要指示因子.以GIS软件为工具,通过较为客观的方式赋予各影响因子人口分布影响权重,运用多源数据融合技术进行了人口统计数据的空间化.结果显示,通过数据融合产生的人口密度与各市县实际人口密度的相关系数大于0.80,与试验区各乡镇的实际人口密度的相关系数大于 0.75.最终生成的栅格人口密度数据既与各市县统计型人口数据保持一致,又反映了各市县内部人口分布的空间变化.
[18]Luo Yong.Study on distribution of population and the sustainable development of ecological environment in Tibet
[D]. Chengdu: Chengdu University of Technology, 2010.
[本文引用: 1]

[罗永. 西藏人口分布与生态环境可持续发展研究
[D]. 成都: 成都理工大学, 2010.]
[本文引用: 1]
[19]Feng Zhiming, Tang Yan, Yang Yanzhao, et al.The relief degree of land surface in China and its correlation with population distribution
. Acta Geographica Sinica, 2007, 62(10): 1073-1082.
https://doi.org/10.3321/j.issn:0375-5444.2007.10.007URL [本文引用: 2]摘要
基于人居环境自然评价的需要,运用GIS技术,采用窗口分析等方法,提取了基于栅格尺度(10km×10km)的中国地形起伏度,并从比例结构、空间分布和高度特征3个方面系统分析了中国地形起伏度的分布规律及其与人口分布的相关性。研究表明:中国的地形起伏度以低值为主,63%的区域低于1(相对高差≤500m);空间分布呈现西高东低、南高北低的格局;随着经度和纬度增高,地形起伏度呈逐渐下降趋势,28oN、35oN、42oN纬线和85oE、102oE、115oE经线上的地形起伏度符合中国三大阶梯的地貌特征;随着海拔高度增加,地形起伏度呈现逐渐升高趋势。实证分析表明:中国的地形起伏度与人口密度有较好的对数拟合关系,拟合度高达0.91;全国85%以上的人口居住在地形起伏度小于1的地区,在地形起伏度大于3的地区居住的人口总数只占全国0.57%。中国地形起伏度与人口分布的相关性区域差异显著,东北、华北、华中和华南等地相关性显著,内蒙古与青藏地区几乎不存在相关性。
[封志明, 唐焰, 杨艳昭, . 中国地形起伏度及其与人口分布的相关性
. 地理学报, 2007, 62(10): 1073-1082.]
https://doi.org/10.3321/j.issn:0375-5444.2007.10.007URL [本文引用: 2]摘要
基于人居环境自然评价的需要,运用GIS技术,采用窗口分析等方法,提取了基于栅格尺度(10km×10km)的中国地形起伏度,并从比例结构、空间分布和高度特征3个方面系统分析了中国地形起伏度的分布规律及其与人口分布的相关性。研究表明:中国的地形起伏度以低值为主,63%的区域低于1(相对高差≤500m);空间分布呈现西高东低、南高北低的格局;随着经度和纬度增高,地形起伏度呈逐渐下降趋势,28oN、35oN、42oN纬线和85oE、102oE、115oE经线上的地形起伏度符合中国三大阶梯的地貌特征;随着海拔高度增加,地形起伏度呈现逐渐升高趋势。实证分析表明:中国的地形起伏度与人口密度有较好的对数拟合关系,拟合度高达0.91;全国85%以上的人口居住在地形起伏度小于1的地区,在地形起伏度大于3的地区居住的人口总数只占全国0.57%。中国地形起伏度与人口分布的相关性区域差异显著,东北、华北、华中和华南等地相关性显著,内蒙古与青藏地区几乎不存在相关性。
[20]Zhao Tongtong, Song Bangguo, Chen Yuansheng, et al.Analysis of population distribution and its spatial relationship with terrain elements in the Yarlung Zangbo River, Nyangqu River and Lhasa River Region, Tibet.
Journal of Geo-Information Science, 2017, 19(2): 225-237.
https://doi.org/10.3724/SP.J.1047.2017.00225URL [本文引用: 3]摘要
地形条件是影响区域人口分布的最基本的因素之一,本文基于1 km×1 km人口空间分布公里网格数据定量分析一江两河地区人口分布基本特征及其与高程、坡度、坡向、地形起伏度等地形要素之间的关系,有助于揭示西藏高原人口分布现状的本质、理解人口空间分布结构特征,对于今后宜居地选址、改善农牧民人居环境、制定区域经济发展政策,促进区域内人口、资源与环境可持续发展具有重要意义。研究结果表明:(1)一江两河地区90%的区域人口密度不足10人/km2,80%的人口分布在不足5%的土地上,人口分布比较集中。当前一江两河地区有2个主要的人口集中区,分别是拉萨市城关区和日喀则地区日喀则市,拉萨市城关区尤其显著。(2)一江两河地区人口沿河分布,80.46%的人口居住在距离河流10 km以内区域,人口总数、人口密度与距河流距离呈明显的指数关系,距离河流2 km以内的区域人口密度高于50人/km2;(3)近99%的人口分布在海拔4500 m以下,当高程超过3800 m时,人口密度随海拔升高呈下降趋势;(4)近70%的人口分布在坡度小于15°的区域,而且随着坡度越大,人口密度越小,人口分布受坡向的影响不明显;(5)地形起伏度对人口分布的影响显著,近85%的人口分布在地形起伏度小于800 m的区域,人口密度与地形起伏度之间为倒指数关系。
[赵彤彤, 宋邦国, 陈远生, . 西藏一江两河地区人口分布与地形要素关系分析
. 地球信息科学学报, 2017, 19(2): 225-237.]
https://doi.org/10.3724/SP.J.1047.2017.00225URL [本文引用: 3]摘要
地形条件是影响区域人口分布的最基本的因素之一,本文基于1 km×1 km人口空间分布公里网格数据定量分析一江两河地区人口分布基本特征及其与高程、坡度、坡向、地形起伏度等地形要素之间的关系,有助于揭示西藏高原人口分布现状的本质、理解人口空间分布结构特征,对于今后宜居地选址、改善农牧民人居环境、制定区域经济发展政策,促进区域内人口、资源与环境可持续发展具有重要意义。研究结果表明:(1)一江两河地区90%的区域人口密度不足10人/km2,80%的人口分布在不足5%的土地上,人口分布比较集中。当前一江两河地区有2个主要的人口集中区,分别是拉萨市城关区和日喀则地区日喀则市,拉萨市城关区尤其显著。(2)一江两河地区人口沿河分布,80.46%的人口居住在距离河流10 km以内区域,人口总数、人口密度与距河流距离呈明显的指数关系,距离河流2 km以内的区域人口密度高于50人/km2;(3)近99%的人口分布在海拔4500 m以下,当高程超过3800 m时,人口密度随海拔升高呈下降趋势;(4)近70%的人口分布在坡度小于15°的区域,而且随着坡度越大,人口密度越小,人口分布受坡向的影响不明显;(5)地形起伏度对人口分布的影响显著,近85%的人口分布在地形起伏度小于800 m的区域,人口密度与地形起伏度之间为倒指数关系。
[21]Bai Zhongqiang, Wang Juanle, Yang Yaping, et al.Characterizing spatial patterns of population distribution at township level across the 25 provinces in China
. Acta Geographica Sinica, 2015, 70(8): 1229-1242.
https://doi.org/10.11821/dlxb201508004URL [本文引用: 3]摘要
人口空间分布具有典型的尺度特征,精细尺度的人口分布是当前人口地理学研究的热点和难点。乡镇(街道)是中国人口普查数据公开发布的最小行政单元,乡镇级人口密度计算及其分布特征研究能够更客观、精细地刻画中国人口分布的空间格局和态势,为促进中国人口的合理优化布局提供科学依据和决策支持。本文收集处理了2000年中国25个省(直辖市、自治区)的乡镇(街道)级行政边界数据,基于第五次人口普查乡镇(街道)人口统计数据,计算了乡镇级平均人口密度。采用Lorenz曲线、空间分析及样带分析的方法,分析了研究区乡镇(街道)人口分布的疏密结构、空间集聚性、纬向和经向规律。利用相关分析和逐步回归分析,分省探究了地形起伏度、水网密度、路网密度及社会经济发展水平(利用夜间灯光指数表征)等4个因素对于乡镇级人口分布的影响。研究表明:1乡镇级平均人口密度能够有效区分出县域内部的人口密度高低差异,整体不均衡性高于基于县级平均人口密度的研究结果;2乡镇(街道)人口分布总体规律是西北稀疏东南密集,同时,东南密中有疏,西北疏中有密;3乡镇(街道)人口分布的经纬向规律变异较大,既受中国三级阶梯地貌大势的影响,也受局部微地形及区域中心城市的影响,并和海岸线、交通枢纽及大江大河的分布具有一定的空间耦合性。4乡镇级平均人口密度与地形起伏度、水网密度、路网密度及夜间灯光指数等显著相关,省级平均相关系数分别为-0.56、0.28、0.61、0.69。5在乡镇尺度上,地形条件及区域发展水平对辽、吉、京、津、沪、冀、豫、陕、晋、鲁、皖、苏、湘、鄂、赣、浙、闽、粤、琼等省份的人口分布具有较强的决定作用。6对于藏、青、蒙、滇、黔等5省或自治区,需要引入更多的自然环境及社会因素来解释其人口分布的特殊规律。本研究扩充了中国人口地理学的研究尺度和维度,并引入了新的定量分析和空间分析方法,所构建的覆盖中国25省(直辖市、自治区)的乡镇(街道)级人口分布科学数据集丰富了中国人口地理学的2000年本底数据资源。
[柏中强, 王卷乐, 杨雅萍, . 基于乡镇尺度的中国25省区人口分布特征及影响因素
. 地理学报, 2015, 70(8): 1229-1242.]
https://doi.org/10.11821/dlxb201508004URL [本文引用: 3]摘要
人口空间分布具有典型的尺度特征,精细尺度的人口分布是当前人口地理学研究的热点和难点。乡镇(街道)是中国人口普查数据公开发布的最小行政单元,乡镇级人口密度计算及其分布特征研究能够更客观、精细地刻画中国人口分布的空间格局和态势,为促进中国人口的合理优化布局提供科学依据和决策支持。本文收集处理了2000年中国25个省(直辖市、自治区)的乡镇(街道)级行政边界数据,基于第五次人口普查乡镇(街道)人口统计数据,计算了乡镇级平均人口密度。采用Lorenz曲线、空间分析及样带分析的方法,分析了研究区乡镇(街道)人口分布的疏密结构、空间集聚性、纬向和经向规律。利用相关分析和逐步回归分析,分省探究了地形起伏度、水网密度、路网密度及社会经济发展水平(利用夜间灯光指数表征)等4个因素对于乡镇级人口分布的影响。研究表明:1乡镇级平均人口密度能够有效区分出县域内部的人口密度高低差异,整体不均衡性高于基于县级平均人口密度的研究结果;2乡镇(街道)人口分布总体规律是西北稀疏东南密集,同时,东南密中有疏,西北疏中有密;3乡镇(街道)人口分布的经纬向规律变异较大,既受中国三级阶梯地貌大势的影响,也受局部微地形及区域中心城市的影响,并和海岸线、交通枢纽及大江大河的分布具有一定的空间耦合性。4乡镇级平均人口密度与地形起伏度、水网密度、路网密度及夜间灯光指数等显著相关,省级平均相关系数分别为-0.56、0.28、0.61、0.69。5在乡镇尺度上,地形条件及区域发展水平对辽、吉、京、津、沪、冀、豫、陕、晋、鲁、皖、苏、湘、鄂、赣、浙、闽、粤、琼等省份的人口分布具有较强的决定作用。6对于藏、青、蒙、滇、黔等5省或自治区,需要引入更多的自然环境及社会因素来解释其人口分布的特殊规律。本研究扩充了中国人口地理学的研究尺度和维度,并引入了新的定量分析和空间分析方法,所构建的覆盖中国25省(直辖市、自治区)的乡镇(街道)级人口分布科学数据集丰富了中国人口地理学的2000年本底数据资源。
[22]Dong Nan, Yang Xiaohuan, Cai Hongyan.Research progress and perspective on the spatialization of population data.
Journal of Geo-Information Science, 2016, 18(10): 1295-1304.
https://doi.org/10.3724/SP.J.1047.2016.01295URLMagsci [本文引用: 3]摘要
<p>人口数据空间化旨在揭示人口在地理空间上的分布位置及数量信息,展现人口统计数据的地理学含义,其研究已经成为人口学、地理学、GIS领域的研究热点。人口空间数据库在各级政府部门的规划和决策、灾害评估、资源配置等方面,具有重要的应用价值和科学意义。经过近30年的发展,人口数据空间化研究水平逐渐成熟,模型丰富多样,已获得众多成果。为把握人口空间化研究的研究现状,本文首先依据研究目的、建模思想及模型原理的异同,从3个方面对人口空间化研究进行梳理:(1)格网大小(尺度)的确定;(2)3种常用建模思想及6类主要模型的对比分析;(3)提高人口空间化精度的措施及其应用背景、优点。在此基础上,依据现阶段人口数据空间化的研究内容,从格网尺度适宜性研究、高时空分辨率人口空间分布模拟、引入新型数据源及多思想多模型综合应用等方面探讨了人口数据空间化的研究方向。</p>
[董南, 杨小唤, 蔡红艳. 人口数据空间化研究进展
. 地球信息科学学报, 2016, 18(10): 1295-1304.]
https://doi.org/10.3724/SP.J.1047.2016.01295URLMagsci [本文引用: 3]摘要
<p>人口数据空间化旨在揭示人口在地理空间上的分布位置及数量信息,展现人口统计数据的地理学含义,其研究已经成为人口学、地理学、GIS领域的研究热点。人口空间数据库在各级政府部门的规划和决策、灾害评估、资源配置等方面,具有重要的应用价值和科学意义。经过近30年的发展,人口数据空间化研究水平逐渐成熟,模型丰富多样,已获得众多成果。为把握人口空间化研究的研究现状,本文首先依据研究目的、建模思想及模型原理的异同,从3个方面对人口空间化研究进行梳理:(1)格网大小(尺度)的确定;(2)3种常用建模思想及6类主要模型的对比分析;(3)提高人口空间化精度的措施及其应用背景、优点。在此基础上,依据现阶段人口数据空间化的研究内容,从格网尺度适宜性研究、高时空分辨率人口空间分布模拟、引入新型数据源及多思想多模型综合应用等方面探讨了人口数据空间化的研究方向。</p>
[23]Song Guobao, Li Zhenghai, Bao Yajing, et al.Spatial distribution pattern of population density in vertical ridge valley region and its influencing factors
. Chinese Science Bulletin, 2007, 52(Suppl.2): 78-85.
URL [本文引用: 1]摘要
将GIS手段和统计方法相结合,选择地貌因子和气候因子,研究各类因子对人口分布的影响强度和函数形式,并通过人口分布影响因子法模拟西南纵向岭谷区的人口密度分布状况.研究结果表明:(1)各类自然地理要素对纵向岭谷区人口的空间格局均具有影响,但影响程度、影响形式存在差异.地貌因子和交通网密度对人口分布影响较为强烈,而温度和降水因子对研究区人口分布影响甚微;人口分布与海拔和交通网密度分别呈现负线性和正线性相关趋势,水网密度和坡度对人口分布分别表现为指数和对数的函数关系;(2)受自然条件影响,人口在纵向岭谷区的分布不均匀,具有整体零散,局部集中的特点,在纵向岭谷区中部形成人口高密度分布带,在东南部形成人口高密度片区;(3)西南纵向岭谷区的人口密度与土地利用的人为活动指数(HAI)具有很好的线性回归关系,人口密度可以反映人为活动对区域自然生态系统的干扰强度;(4)人口密度提高导致植被指数NDVI降低.
[宋国宝, 李政海, 鲍雅静, . 纵向岭谷区人口密度的空间分布规律及其影响因素
. 科学通报, 2007, 52(Suppl.2): 78-85.]
URL [本文引用: 1]摘要
将GIS手段和统计方法相结合,选择地貌因子和气候因子,研究各类因子对人口分布的影响强度和函数形式,并通过人口分布影响因子法模拟西南纵向岭谷区的人口密度分布状况.研究结果表明:(1)各类自然地理要素对纵向岭谷区人口的空间格局均具有影响,但影响程度、影响形式存在差异.地貌因子和交通网密度对人口分布影响较为强烈,而温度和降水因子对研究区人口分布影响甚微;人口分布与海拔和交通网密度分别呈现负线性和正线性相关趋势,水网密度和坡度对人口分布分别表现为指数和对数的函数关系;(2)受自然条件影响,人口在纵向岭谷区的分布不均匀,具有整体零散,局部集中的特点,在纵向岭谷区中部形成人口高密度分布带,在东南部形成人口高密度片区;(3)西南纵向岭谷区的人口密度与土地利用的人为活动指数(HAI)具有很好的线性回归关系,人口密度可以反映人为活动对区域自然生态系统的干扰强度;(4)人口密度提高导致植被指数NDVI降低.
[24]Tang Jiayun.The research of population distribution pattern of space and time in Gansu province and its influencing factors
[D]. Wuhan: Central China Normal University, 2015.
[本文引用: 1]

[唐嘉韵. 甘肃省人口分布的时空格局及其影响因素研究
[D]. 武汉: 华中师范大学, 2015.]
[本文引用: 1]
[25]Zhang Lei, Wang Linlin, Zhang Xudong, et al.The basic principle of random forest and its applications in ecology: A case study of Pinus yunnanensis
. Acta Ecologica Sinica, 2014, 34(3): 650-659.
https://doi.org/10.5846/stxb201306031292URLMagsci [本文引用: 1]摘要
通常来讲,生态****对于解释生态关系、描述格局和过程、进行空间或时间预测比较感兴趣。这些工作可以通过模拟输出值(响应)与一些特征值(即解释变量)的关系来实现。然而,生态数据模拟遇到了挑战,这是因为响应变量和预测变量可能是连续变量或离散变量。需要解释的生态关系通常是非线性的,并且解释变量之间具有复杂的相互作用关系。响应变量和解释变量存在缺失值并不是不常有的现象,奇异值也经常出现在生态数据中。此外,生态****通常希望生态模型即要易于建立又易要于解释。通常是利用多种统计方法来分析处理各种各样情景中出现的独特的生态问题,这些模型包括(多元)逻辑回归、线性模型、生存模型、方差分析等等。随机森林是一个可以处理所有这些问题的有效方法。随机森林可以用来做分类、聚类、回归和生存分析、评估变量的重要性、检测数据中的奇异值、对缺失数据进行插补等。鉴于随机森林本身在算法上的优势,将就随机森林在生态学中的应用进行总结,对建模过程进行概述,并以云南松分布模拟研究为例,对其主要功能特点进行案例展示。通过对随机森林的一般术语、概念和建模思想进行介绍,有利于读者掌握本方法的应用本质,可以预见随机森林在生态学研究中将得到更多的应用和发展。
[张雷, 王琳琳, 张旭东, . 随机森林算法基本思想及其在生态学中的应用: 以云南松分布模拟为例
. 生态学报, 2014, 34(3): 650-659.]
https://doi.org/10.5846/stxb201306031292URLMagsci [本文引用: 1]摘要
通常来讲,生态****对于解释生态关系、描述格局和过程、进行空间或时间预测比较感兴趣。这些工作可以通过模拟输出值(响应)与一些特征值(即解释变量)的关系来实现。然而,生态数据模拟遇到了挑战,这是因为响应变量和预测变量可能是连续变量或离散变量。需要解释的生态关系通常是非线性的,并且解释变量之间具有复杂的相互作用关系。响应变量和解释变量存在缺失值并不是不常有的现象,奇异值也经常出现在生态数据中。此外,生态****通常希望生态模型即要易于建立又易要于解释。通常是利用多种统计方法来分析处理各种各样情景中出现的独特的生态问题,这些模型包括(多元)逻辑回归、线性模型、生存模型、方差分析等等。随机森林是一个可以处理所有这些问题的有效方法。随机森林可以用来做分类、聚类、回归和生存分析、评估变量的重要性、检测数据中的奇异值、对缺失数据进行插补等。鉴于随机森林本身在算法上的优势,将就随机森林在生态学中的应用进行总结,对建模过程进行概述,并以云南松分布模拟研究为例,对其主要功能特点进行案例展示。通过对随机森林的一般术语、概念和建模思想进行介绍,有利于读者掌握本方法的应用本质,可以预见随机森林在生态学研究中将得到更多的应用和发展。
[26]Yu Bohua, Lv Changhe.Assessment of ecological vulnerability on the Tibetan Plateau
. Geographical Research, 2011, 30(12): 2289-2295.
https://doi.org/10.11821/yj2011120016URL [本文引用: 1]摘要
在分析青藏高原高寒生态系统形成机制的基础上,构筑了3个层次、10个指标的脆弱性评价指标体系,系统评估了青藏高原生态脆弱性及其区域差异。研究结果表明:青藏高原中、重度以上脆弱区的面积较大,占区域总面积的74.79%。微度、轻度脆弱区主要分布在雅鲁藏布江大拐弯处、藏东南海拔3000m以下的山地、祁连山南坡的西北段和昆仑山北坡、塔里木盆地南缘地带。重度和极度脆弱区集中分布的趋势明显,占全区面积的49.46%,主要分布在黄河源区、柴达木盆地和阿里高原往东32。N附近的带状区域(78。E~92。E)。研究结果有助于全面掌握青藏高原生态系统的脆弱程度及其空间分异特征,对识别高寒区关键脆弱环境因子、提高生态环境治理的针对性有重要意义。
[于伯华, 吕昌河. 青藏高原高寒区生态脆弱性评价
. 地理研究, 2011, 30(12): 2289-2295.]
https://doi.org/10.11821/yj2011120016URL [本文引用: 1]摘要
在分析青藏高原高寒生态系统形成机制的基础上,构筑了3个层次、10个指标的脆弱性评价指标体系,系统评估了青藏高原生态脆弱性及其区域差异。研究结果表明:青藏高原中、重度以上脆弱区的面积较大,占区域总面积的74.79%。微度、轻度脆弱区主要分布在雅鲁藏布江大拐弯处、藏东南海拔3000m以下的山地、祁连山南坡的西北段和昆仑山北坡、塔里木盆地南缘地带。重度和极度脆弱区集中分布的趋势明显,占全区面积的49.46%,主要分布在黄河源区、柴达木盆地和阿里高原往东32。N附近的带状区域(78。E~92。E)。研究结果有助于全面掌握青藏高原生态系统的脆弱程度及其空间分异特征,对识别高寒区关键脆弱环境因子、提高生态环境治理的针对性有重要意义。
[27]Hu Huanyong.Distribution of China's Population. Shanghai: East China Normal University Press, 1983. [本文引用: 1]

[胡焕庸. 论中国人口之分布. 上海: 华东师范大学出版社, 1983.] [本文引用: 1]
[28]Wang Lei, Cai Yunlong.Spatial down-scaling analysis and simulation of population density in Maotiaohe Basin, Guizhou Province
. Progress in Geography, 2011, 30(5): 635-640.
https://doi.org/10.11820/dlkxjz.2011.05.017URLMagsci [本文引用: 2]摘要
人口调查统计以行政区划为基本单元,数据精度不能满足较高分辨率的空间结构分析,也难以在地理综合研究中与自然地理要素数据相匹配。因此,人口密度空间化成为地理学的重要研究方向之一。本文基于贵州省猫跳河流域的乡镇人口数据,采用GIS空间分析技术与统计学方法,分析了人口密度与空间因子的关系;并采用多元回归的方法建立了人口密度数据空间化模型,在GIS平台中实现了人口密度的降尺度空间化模拟。建立的多元回归模型拟合精度达到0.577,且模拟结果与实际人口数据比较线性拟合斜率接近1,效果比较理想。研究结果表明:影响该地区人口密度的主导空间因子为建设用地指数、耕地指数与到道路的平均距离。
[王磊, 蔡运龙. 人口密度的空间降尺度分析与模拟: 以贵州猫跳河流域为例
. 地理科学进展, 2011, 30(5): 635-640.]
https://doi.org/10.11820/dlkxjz.2011.05.017URLMagsci [本文引用: 2]摘要
人口调查统计以行政区划为基本单元,数据精度不能满足较高分辨率的空间结构分析,也难以在地理综合研究中与自然地理要素数据相匹配。因此,人口密度空间化成为地理学的重要研究方向之一。本文基于贵州省猫跳河流域的乡镇人口数据,采用GIS空间分析技术与统计学方法,分析了人口密度与空间因子的关系;并采用多元回归的方法建立了人口密度数据空间化模型,在GIS平台中实现了人口密度的降尺度空间化模拟。建立的多元回归模型拟合精度达到0.577,且模拟结果与实际人口数据比较线性拟合斜率接近1,效果比较理想。研究结果表明:影响该地区人口密度的主导空间因子为建设用地指数、耕地指数与到道路的平均距离。
[29]Fang Yu, Ouyang Zhiyun, Zheng Hua, et al.Natural forming causes of China population distribution
. Chinese Journal of Applied Ecology, 2012, 23(12): 3488-3495.
URLMagsci [本文引用: 1]摘要
<p>中国多样化的自然环境造就了人口分布的区域差异性,明晰人口分布格局与自然环境的相互关系对于增进对人地关系的理解,实现人口、资源、环境的可持续管理具有重要作用.本文以人口密度为指标,采用洛伦兹曲线与空间统计相结合的方法,分析了中国人口分布状况,并探讨了自然因素组合对人口分布的影响以及人口分布与年均温度、年均降水量、干燥度、净初级生产力、地表粗糙度、距海岸线距离等16个指标的相互关系.结果表明: 中国人口分布集聚现象显著,东、中、西部地区分别以高、中、低人口密度为主,空间上呈现出明显的正空间关联特征;人口密度与河网密度、年均温度、年均降水量、净初级生产力、&ge;5 ℃积温、降水量变异、相对湿度、温暖指数呈极显著的正相关关系,与相对高差、平均高程、日照时数、地表粗糙度、距海岸线距离呈显著负相关;气候因子(年均温度、温暖指数、降水量变异、净初级生产力)、地形因子(地表粗糙度、相对高差)和水系因子(河网密度)为影响人口分布的主要自然因素.建议加强对东部高人口密度区的生态环境监控,避免因人口增长导致生态环境退化;同时,强调对中西部生态环境脆弱地区的生态环境保育,增强这些地区的人口承载能力,减缓东部地区高人口密度的生态环境压力.</p>
[方瑜, 欧阳志云, 郑华, . 中国人口分布的自然成因
. 应用生态学报, 2012, 23(12): 3488-3495.]
URLMagsci [本文引用: 1]摘要
<p>中国多样化的自然环境造就了人口分布的区域差异性,明晰人口分布格局与自然环境的相互关系对于增进对人地关系的理解,实现人口、资源、环境的可持续管理具有重要作用.本文以人口密度为指标,采用洛伦兹曲线与空间统计相结合的方法,分析了中国人口分布状况,并探讨了自然因素组合对人口分布的影响以及人口分布与年均温度、年均降水量、干燥度、净初级生产力、地表粗糙度、距海岸线距离等16个指标的相互关系.结果表明: 中国人口分布集聚现象显著,东、中、西部地区分别以高、中、低人口密度为主,空间上呈现出明显的正空间关联特征;人口密度与河网密度、年均温度、年均降水量、净初级生产力、&ge;5 ℃积温、降水量变异、相对湿度、温暖指数呈极显著的正相关关系,与相对高差、平均高程、日照时数、地表粗糙度、距海岸线距离呈显著负相关;气候因子(年均温度、温暖指数、降水量变异、净初级生产力)、地形因子(地表粗糙度、相对高差)和水系因子(河网密度)为影响人口分布的主要自然因素.建议加强对东部高人口密度区的生态环境监控,避免因人口增长导致生态环境退化;同时,强调对中西部生态环境脆弱地区的生态环境保育,增强这些地区的人口承载能力,减缓东部地区高人口密度的生态环境压力.</p>
[30]Zhuo L, Ichinose T, Zheng J, et al.Modelling the population density of China at the pixel level based on DMSP/OLS non-radiance-calibrated night-time light images
. International Journal of Remote Sensing, 2009, 30(4): 1003-1018.
https://doi.org/10.1080/01431160802430693URL [本文引用: 1]摘要
The spatial distribution of population density is crucial for analysing the relationships among economic growth, environmental protection and resource use. In this study we simulated China's population density in 1998 at 102km×102km resolution by integrating DMSP/OLS non‐radiance‐calibrated night‐time images, SPOT/VGT 10‐day maximum NDVI composite, population census data and vector county boundaries. Population density, both inside and outside of light patches, was estimated for four types of counties, which were classified according to their light characteristics. The model for estimating population density inside the light patches was developed based on a significant correlation between light intensity and population, while the model for estimating population density outside of light patches was constructed by combining Coulomb's law with electric field superposition principle. Our method was simpler and less expensive than existing methods for spatializing population density. The results were consistent with other estimates but exhibited more spatial heterogeneity and richer information.
[31]Sutton P, Roberts C, Elvidge C, et al.A comparison of nighttime satellite imagery and population density for the continental united states
. Photogrammetric Engineering and Remote Sensing, 1997, 63(11): 1303-1313.
[本文引用: 1]
[32]Ma T, Zhou C H, Pei T, et al.Quantitative estimation of urbanization dynamics using time series of DMSP/OLS nighttime light data: A comparative case study from China's cities
. Remote Sensing of Environment, 2012, 124(9): 99-107.
https://doi.org/10.1016/j.rse.2012.04.018URL [本文引用: 1]摘要
中国科学院机构知识库(CAS IR GRID)以发展机构知识能力和知识管理能力为目标,快速实现对本机构知识资产的收集、长期保存、合理传播利用,积极建设对知识内容进行捕获、转化、传播、利用和审计的能力,逐步建设包括知识内容分析、关系分析和能力审计在内的知识服务能力,开展综合知识管理。
[33]Wu J S, Wang Z, Li W F, et al.Exploring factors affecting the relationship between light consumption and GDP based on DMSP/OLS nighttime satellite imagery
. Remote Sensing of Environment, 2013, 134(7): 111-119.
https://doi.org/10.1016/j.rse.2013.03.001URL [本文引用: 1]
[34]Xie Y H, Weng Q H.World energy consumption pattern as revealed by DMSP-OLS nighttime light imagery
. Giscience and Remote Sensing, 2016, 53(2): 265-282.
https://doi.org/10.1080/15481603.2015.1124488URL [本文引用: 1]摘要
Remotely sensed nighttime light (NTL) from the Defense Meteorological Satellite Program (DMSP) Operational Linescan System (OLS) provides a spatially consistent and cost-effective mean to estimate energy consumption pattern. While previous researches have documented the application of NTL to predict electric power consumption (EPC) with varying degrees of success, few have systematically studied the possible factors affecting the EPC-NTL relationship. Moreover, no substantial research effort has been made to relate overall energy consumption (OEC) to NTL. This study investigated key factors governing the EPC/OEC-NTL relationship by examining the influences of affluence, urbanization, technology, temperature, and NTL pattern. Results show that EPC increased with higher per capital GDP, urbanization rate, and high-technology exports, and lower agricultural development, both globally and regionally. Meanwhile, EPC generally reduced with higher temperature and more agglomerate human activities. A strong OEC-NTL relationship was found; but the influencing factors to the OEC-NTL relationship varied across regions due to the natures of energy use. These factors must be considered especially for the studies of less-affluent regions where NTL was undetectable by the DMSP-OLS sensor.
[35]He C Y, Ma Q, Li T, et al.Spatiotemporal dynamics of electric power consumption in Chinese Mainland from 1995 to 2008 modeled using DMSP/OLS stable nighttime lights data
. Journal of Geographical Sciences, 2012, 22(1): 125-136.
https://doi.org/10.1007/s11442-012-0916-3URL [本文引用: 1]
[36]Jia Zhanhua, Gu Guofeng.Temporal-Spatial evolution characteristics and its influence factors about population distribution in Northeast China
. Economic Geography, 2016, 36(12): 60-68.
https://doi.org/10.15957/j.cnki.jjdl.2016.12.009URL [本文引用: 1]摘要
基于集中指数、人口重心迁移和ESDA分析方法,对2003--2014年东北三省36个地级市的人口分布的时空演化特征进行分析。结果表明:2003以来,东北地区人口密度增长速度大大减缓,多数地区年均增长量出现负值;人口重心由东北向西南方向移动;人口分布呈不均衡态势,且人口集中指数在不断增大;人口分布存在较强的正的空间关联性,但这种态势有所弱化。在研究人口分布的影响因素时,引入空间计量模型,经判别检验后,确立SLM为最优模型,SLM的计量分析结果显示:年平均气温,年降水量,第二、三产业比重,基础教育质量,医疗服务水平以及人均可支配收入水平对东北地区的人口分布产生正效应,人均固定资产投资产生负效应。因此,要想促进东北地区人口合理分布,必须合理调整产业结构,加快第二产业优化升级,大力培育配套的第三产业,实现就业需求大增;加大对基础教育与医疗卫生服务等领域的投资;在增加社会固定资产投资的同时,提升市场化程度,深化国有企业改革,提高企业创新能力。
[贾占华, 谷国锋. 东北地区人口分布的时空演变特征及影响因素
. 经济地理, 2016, 36(12): 60-68.]
https://doi.org/10.15957/j.cnki.jjdl.2016.12.009URL [本文引用: 1]摘要
基于集中指数、人口重心迁移和ESDA分析方法,对2003--2014年东北三省36个地级市的人口分布的时空演化特征进行分析。结果表明:2003以来,东北地区人口密度增长速度大大减缓,多数地区年均增长量出现负值;人口重心由东北向西南方向移动;人口分布呈不均衡态势,且人口集中指数在不断增大;人口分布存在较强的正的空间关联性,但这种态势有所弱化。在研究人口分布的影响因素时,引入空间计量模型,经判别检验后,确立SLM为最优模型,SLM的计量分析结果显示:年平均气温,年降水量,第二、三产业比重,基础教育质量,医疗服务水平以及人均可支配收入水平对东北地区的人口分布产生正效应,人均固定资产投资产生负效应。因此,要想促进东北地区人口合理分布,必须合理调整产业结构,加快第二产业优化升级,大力培育配套的第三产业,实现就业需求大增;加大对基础教育与医疗卫生服务等领域的投资;在增加社会固定资产投资的同时,提升市场化程度,深化国有企业改革,提高企业创新能力。
[37]Feng Zhiming, Liu Xiaona.Multi-scale studies on the space consistency between population distribution and economic development in China
. Population and Economics, 2013(2): 3-11.
https://doi.org/10.3969/j.issn.1000-4149.2013.02.001URL [本文引用: 1]摘要
人口分布与经济发展之间的关系长期以来备受瞩目。本文采用定性与定量分析相结合的方法,通过构建人口经济一致性系数和人口经济偏离度指数等指标,定量分析与评价了改革开放以来中国分县、分省、四大地区及全国,不同时空尺度的人口分布与经济发展的空间一致性。研究表明:2000~2010年,中国分县人口集聚程度高于经济集聚水平,人口集聚呈现出显著的经济导向性,人口集聚与经济集聚表现出向好趋势;2000~2010年,中国分省人口经济一致性程度呈增强趋势,受经济差距缩小影响,省际一致性差距在缩小;1978~2010年,东部地区人口经济一致性程度基本稳定,中部保持最优,西部呈减弱态势,东北呈增强特征,全国人口经济空间一致性程度总体呈减弱趋势。
[封志明, 刘晓娜. 中国人口分布与经济发展空间一致性研究
. 人口与经济, 2013(2): 3-11.]
https://doi.org/10.3969/j.issn.1000-4149.2013.02.001URL [本文引用: 1]摘要
人口分布与经济发展之间的关系长期以来备受瞩目。本文采用定性与定量分析相结合的方法,通过构建人口经济一致性系数和人口经济偏离度指数等指标,定量分析与评价了改革开放以来中国分县、分省、四大地区及全国,不同时空尺度的人口分布与经济发展的空间一致性。研究表明:2000~2010年,中国分县人口集聚程度高于经济集聚水平,人口集聚呈现出显著的经济导向性,人口集聚与经济集聚表现出向好趋势;2000~2010年,中国分省人口经济一致性程度呈增强趋势,受经济差距缩小影响,省际一致性差距在缩小;1978~2010年,东部地区人口经济一致性程度基本稳定,中部保持最优,西部呈减弱态势,东北呈增强特征,全国人口经济空间一致性程度总体呈减弱趋势。
[38]Wang Junbang, Ye Hui, Wang Juwu, et al.1 km spatial resolution of temperature and precipitation in China in 2000-2012 raster data set
. Science Data Bank, 2016.
[本文引用: 1]

[王军邦, 叶辉, 王居午, . 2000-2012年全国气温和降水1 km网格空间插值数据集
. Science Data Bank, 2016.]
[本文引用: 1]
[39]Nestola E, Calfapietra C, Emmerton C A, et al.Monitoring grassland seasonal carbon dynamics, by integrating MODIS NDVI, proximal optical sampling, and eddy covariance measurements
. Remote Sensing, 2016, 8(3): 260-285.
https://doi.org/10.3390/rs8030260URL [本文引用: 1]摘要
This study evaluated the seasonal productivity of a prairie grassland (Mattheis Ranch, in Alberta, Canada) using a combination of remote sensing, eddy covariance, and field sampling collected in 2012鈥2013. A primary objective was to evaluate different ways of parameterizing the light-use efficiency (LUE) model for assessing net ecosystem fluxes at two sites with contrasting productivity. Three variations on the NDVI (Normalized Difference Vegetation Index), differing by formula and footprint, were derived: (1) a narrow-band NDVI (NDVI680,800, derived from mobile field spectrometer readings); (2) a broad-band proxy NDVI (derived from an automated optical phenology station consisting of broad-band radiometers); and (3) a satellite NDVI (derived from MODIS AQUA and TERRA sensors). Harvested biomass, net CO2 flux, and NDVI values were compared to provide a basis for assessing seasonal ecosystem productivity and gap filling of tower flux data. All three NDVIs provided good estimates of dry green biomass and were able to clearly show seasonal changes in vegetation growth and senescence, confirming their utility as metrics of productivity. When relating fluxes and optical measurements, temporal aggregation periods were considered to determine the impact of aggregation on model accuracy. NDVI values from the different methods were also calibrated against fAPARgreen (the fraction of photosynthetically active radiation absorbed by green vegetation) values to parameterize the APARgreen (absorbed PAR) term of the LUE (light use efficiency) model for comparison with measured fluxes. While efficiency was assumed to be constant in the model, this analysis revealed hysteresis in the seasonal relationships between fluxes and optical measurements, suggesting a slight change in efficiency between the first and second half of the growing season. Consequently, the best results were obtained by splitting the data into two stages, a greening phase and a senescence phase, and applying separate fits to these two periods. By incorporating the dynamic irradiance regime, the model based on APARgreen rather than NDVI best captured the high variability of the fluxes and provided a more realistic depiction of missing fluxes. The strong correlations between these optical measurements and independently measured fluxes demonstrate the utility of integrating optical with flux measurements for gap filling, and provide a foundation for using remote sensing to extrapolate from the flux tower to larger regions (upscaling) for regional analysis of net carbon uptake by grassland ecosystems.
[40]Li Z, Huffman T, Mcconkey B, et al.Monitoring and modeling spatial and temporal patterns of grassland dynamics using time-series MODIS NDVI with climate and stocking data
. Remote Sensing of Environment, 2013, 138(11): 232-244.
https://doi.org/10.1016/j.rse.2013.07.020URL [本文引用: 1]
[41]Jun C, Ban Y F, Li S N.Open access to Earth land-cover map
. Nature, 2014, 514(7523): 434-434.
https://doi.org/10.1038/514434cURLPMID:25341776 [本文引用: 1]摘要
China : Open access to Earth land-cover map
[42]Brovelli M A, Molinari M E, Hussein E, et al.The first comprehensive accuracy assessment of GlobeLand30 at a national level: Methodology and results
. Remote Sensing, 2015, 7(4): 4191-4212.
https://doi.org/10.3390/rs70404191URL [本文引用: 1]
[43]Chen J, Chen J, Liao A P, et al.Global land cover mapping at 30 m resolution: A POK-based operational approach
. Isprs Journal of Photogrammetry and Remote Sensing, 2015, 103: 7-27.
https://doi.org/10.1016/j.isprsjprs.2014.09.002URL [本文引用: 1]摘要
Global Land Cover (GLC) information is fundamental for environmental change studies, land resource management, sustainable development, and many other societal benefits. Although GLC data exists at spatial resolutions of 300m and 1000m, a 30m resolution mapping approach is now a feasible option for the next generation of GLC products. Since most significant human impacts on the land system can be captured at this scale, a number of researchers are focusing on such products. This paper reports the operational approach used in such a project, which aims to deliver reliable data products. Over 10,000 Landsat-like satellite images are required to cover the entire Earth at 30m resolution. To derive a GLC map from such a large volume of data necessitates the development of effective, efficient, economic and operational approaches. Automated approaches usually provide higher efficiency and thus more economic solutions, yet existing automated classification has been deemed ineffective because of the low classification accuracy achievable (typically below 65%) at global scale at 30m resolution. As a result, an approach based on the integration of pixel- and object-based methods with knowledge (POK-based) has been developed. To handle the classification process of 10 land cover types, a split-and-merge strategy was employed, i.e. firstly each class identified in a prioritized sequence and then results are merged together. For the identification of each class, a robust integration of pixel-and object-based classification was developed. To improve the quality of the classification results, a knowledge-based interactive verification procedure was developed with the support of web service technology. The performance of the POK-based approach was tested using eight selected areas with differing landscapes from five different continents. An overall classification accuracy of over 80% was achieved. This indicates that the developed POK-based approach is effective and feasible for operational GLC mapping at 30m resolution.
[44]Kuang W H, Chen L J, Liu J Y, et al.Remote sensing-based artificial surface cover classification in Asia and spatial pattern analysis
. Science China-Earth Sciences, 2016, 59(9): 1720-1737.
https://doi.org/10.1007/s11430-016-5295-7URL [本文引用: 1]摘要
Abstract Artificial surfaces, characterized with intensive land-use changes and complex landscape structures, are important indicators of human impacts on terrestrial ecosystems. Without high-resolution land-cover data at continental scale, it is hard to evaluate the impacts of urbanization on regional climate, ecosystem processes and global environment. This study constructed a hierarchical classification system for artificial surfaces, promoted a remote sensing method to retrieve subpixel components of artificial surfaces from 30-m resolution satellite imageries (GlobeLand30) and developed a series of data products of high-precision urban built-up areas including impervious surface and vegetation cover in Asia in 2010. Our assessment, based on multisource data and expert knowledge, showed that the overall accuracy of classification was 90.79%. The mean relative error for the impervious surface components of cities was 0.87. The local error of the extracted information was closely related to the heterogeneity of urban buildings and vegetation in different climate zones. According to our results, the urban built-up area was 18.18脳104 km2, accounting for 0.59% of the total land surface areas in Asia; urban impervious surfaces were 11.65脳104 km2, accounting for 64.09% of the total urban built-up area in Asia. Vegetation and bare soils accounted for 34.56% of the urban built-up areas. There were three gradients: a concentrated distribution, a scattered distribution and an indeterminate distribution from east to west in terms of spatial pattern of urban impervious surfaces. China, India and Japan ranked as the top three countries with the largest impervious surface areas, which respectively accounted for 32.77%, 16.10% and 11.93% of the urban impervious surface area of Asia. We found the proportions of impervious surface and vegetation cover within urban built-up areas were closely related to the economic development degree of the country and regional climate environment. Built-up areas in developed countries had relatively low impervious surface and high public green vegetation cover, with 50鈥170% urban impervious surfaces in Japan, South Korea and Singapore. In comparison, the proportion of urban impervious surfaces in developing countries is approaching or exceeding 80% in Asia. In general, the composition and spatial patterns of built-up areas reflected population aggregation and economic development level as well as their impacts on the health of the environment in the sub-watershed.
[45]Lu Nan, Zhang Weiwei, Chen Lijun, et al.Estimation of large regional urban and rural population density based on the differences of population distribution between urban and rural: Take Shandong Province as example
. Geodaetica et Cartographica Sinica, 2015, 44(12): 1384-1391.
https://doi.org/10.11947/j.AGCS.2015.20150005URL [本文引用: 1]摘要
现有大区域人口密度估算结果大多是在千米级尺度上,仅能宏观地反映城乡人口分布的范围,无法准确地刻画城乡人口空间分布的细节特征。本文将首套30m全球地表覆盖数据(GlobeLand30)引入城乡人口密度估算中,基于实现城乡划分的GlobeLand30人造地表数据,在城镇区域运用夜间灯光强度与人口的相关性将城镇人口细划到30m尺度上来估算城镇人口密度;在乡村区域引入样方估算的方法修正乡村居民地面积以估算乡村人口密度。以山东省为试验区的研究表明,本文方法无论在城乡居民地刻画还是人口空间分布的表达上均优于参考数据,所使用的GlobeLand30的全球性也保证了该方法推广的可行性。
[鲁楠, 张委伟, 陈利军, . 顾及城乡差异的大区域人口密度估算: 以山东省为例
. 测绘学报, 2015,44(12): 1384-1391.]
https://doi.org/10.11947/j.AGCS.2015.20150005URL [本文引用: 1]摘要
现有大区域人口密度估算结果大多是在千米级尺度上,仅能宏观地反映城乡人口分布的范围,无法准确地刻画城乡人口空间分布的细节特征。本文将首套30m全球地表覆盖数据(GlobeLand30)引入城乡人口密度估算中,基于实现城乡划分的GlobeLand30人造地表数据,在城镇区域运用夜间灯光强度与人口的相关性将城镇人口细划到30m尺度上来估算城镇人口密度;在乡村区域引入样方估算的方法修正乡村居民地面积以估算乡村人口密度。以山东省为试验区的研究表明,本文方法无论在城乡居民地刻画还是人口空间分布的表达上均优于参考数据,所使用的GlobeLand30的全球性也保证了该方法推广的可行性。
[46]Xie H, Du L, Liu S C, et al.Dynamic monitoring of agricultural fires in China from 2010 to 2014 using MODIS and GlobeLand30 data.
ISPRS International Journal of Geo-Information, 2016, 5(10): 172.
https://doi.org/10.3390/ijgi5100172URL [本文引用: 1]
[47]Chen Peiyang, Zhu Xigang.Regional inequalities in China at different scales
. Acta Geographica Sinica, 2012, 67(8): 1085-1097.
https://doi.org/10.11821/xb201208007URL [本文引用: 1]摘要
采用变异系数、泰尔指数、空间自相关和尺度方差等统计方法从地带、省级、地级和县级4个尺度对1998-2009年中国区域经济差异进行测度和空间格局比较分析。①差异测度研究表明,自1998年以来,中国区域经济差异在4个尺度上均表现出扩大的趋势;省级、地级和县级单元人均GDP具有显著的空间自相关性,其中地级和县级人均GDP的空间自相关程度呈扩大趋势。②尺度方差及其分解研究表明,尺度方差及其构成大小依次排列均为县级、地级、省级、地带,即尺度越小,尺度方差越大,对区域经济差异的贡献份额也越大。③空间格局研究表明,不同尺度区域经济空间关联格局总体相对稳定,HH类型集聚区大多分布于东部沿海地区,LL类型在中西部地区的大规模集聚是不同尺度区域经济空间自相关性的主要原因;各尺度显著空间关联类型对总体空间自相关和区域经济差异的影响各不相同。
[陈培阳, 朱喜钢. 基于不同尺度的中国区域经济差异
. 地理学报, 2012, 67(8): 1085-1097.]
https://doi.org/10.11821/xb201208007URL [本文引用: 1]摘要
采用变异系数、泰尔指数、空间自相关和尺度方差等统计方法从地带、省级、地级和县级4个尺度对1998-2009年中国区域经济差异进行测度和空间格局比较分析。①差异测度研究表明,自1998年以来,中国区域经济差异在4个尺度上均表现出扩大的趋势;省级、地级和县级单元人均GDP具有显著的空间自相关性,其中地级和县级人均GDP的空间自相关程度呈扩大趋势。②尺度方差及其分解研究表明,尺度方差及其构成大小依次排列均为县级、地级、省级、地带,即尺度越小,尺度方差越大,对区域经济差异的贡献份额也越大。③空间格局研究表明,不同尺度区域经济空间关联格局总体相对稳定,HH类型集聚区大多分布于东部沿海地区,LL类型在中西部地区的大规模集聚是不同尺度区域经济空间自相关性的主要原因;各尺度显著空间关联类型对总体空间自相关和区域经济差异的影响各不相同。
[48]Ma Xiaodong, Ma Ronghua, Xu Jiangang.Spatial structure of cities and towns with ESDA-GIS framework
. Acta Geographica Sinica, 2004, 59(6): 1048-1057.
https://doi.org/10.3321/j.issn:0375-5444.2004.06.029URL [本文引用: 1]摘要
基于ESDA-GIS的空间分析框架,利用江苏省1346个小城镇的统计数据,对其城镇群体空间结构进行了研究。首先对统计数据进行了概括性因子分析,抽取的规模与经济因子值的频率分布都是偏态的,且两因子之间不存在规模-效益的正相关性。随后,对小城镇群体的空间结构进行了探索性分析,由密度图显示:小城镇空间分布不均衡,其密度由东南部的沿长江、环太湖地区向西和向北递减。通过空间自相关测度分析得出:小城镇的经济因子的空间分布具有正相关性,呈现出空间集聚的特征;规模因子的空间相关特征不明显。最后,将小城镇的局域空间自相关系数按县(市、区)行政单元进行聚类,利用方差图的结论修正聚类结果,得出江苏省小城镇经济发展类型分区:三区、一环(带)、一片,即苏北中部地区、苏中及宁镇区、苏锡常地区、苏北边缘环带、睢宁片区,对应的经济发展类型分别为:弥漫发展型、极核发展型、集群发展型、过渡发展型、持续贫困型。
[马晓冬, 马荣华, 徐建刚. 基于ESDA-GIS的城镇群体空间结构
. 地理学报, 2004, 59(6): 1048-1057.]
https://doi.org/10.3321/j.issn:0375-5444.2004.06.029URL [本文引用: 1]摘要
基于ESDA-GIS的空间分析框架,利用江苏省1346个小城镇的统计数据,对其城镇群体空间结构进行了研究。首先对统计数据进行了概括性因子分析,抽取的规模与经济因子值的频率分布都是偏态的,且两因子之间不存在规模-效益的正相关性。随后,对小城镇群体的空间结构进行了探索性分析,由密度图显示:小城镇空间分布不均衡,其密度由东南部的沿长江、环太湖地区向西和向北递减。通过空间自相关测度分析得出:小城镇的经济因子的空间分布具有正相关性,呈现出空间集聚的特征;规模因子的空间相关特征不明显。最后,将小城镇的局域空间自相关系数按县(市、区)行政单元进行聚类,利用方差图的结论修正聚类结果,得出江苏省小城镇经济发展类型分区:三区、一环(带)、一片,即苏北中部地区、苏中及宁镇区、苏锡常地区、苏北边缘环带、睢宁片区,对应的经济发展类型分别为:弥漫发展型、极核发展型、集群发展型、过渡发展型、持续贫困型。
[49]Cheng Weiming, Zhou Chenghu, Chai Huixia, et al.Quantitative extraction and analysis of basic morphological types of land morphology in China. Journal of Geo-information
Science, 2009, 11(6): 725-736.
https://doi.org/10.3969/j.issn.1560-8999.2009.06.007URLMagsci [本文引用: 1]摘要
中国陆地地貌基本形态类型由海拔和地势起伏度两个指标组合划分而成,其中海拔分4级,地势起伏度分7级,组合后的基本形态类型共25类。按照数字地貌分类体系,海拔和起伏度拥有全国普适性的分级指标,基于DEM数据可获得两指标的分级类型。试验表明,基于SRTM-DEM(水平分辨率90m,相当于1:25万比例尺)数据可得出全国普适性的采用单元为4km<sup>2</sup>,利用1:10万、1:400万等比例尺数据进行DEM试验,得出我国存在0.4、4、12、18、21km<sup>2</sup>五种不同规模的采样单元,并分别对应着不同的比例尺。因我国地貌复杂多样,仅利用DEM数据所获得的海拔和地势起伏度分级数据不能完全反映不同地域的地貌特征,故利用遥感等多源数据,综合多种信息获得的地貌类型,可很好地反映出我国的海拔4级分级特征和地势起伏度7级空间分布,进而获得全国陆地的25种基本形态类型的面积及空间分布格局。
[程维明, 周成虎, 柴慧霞, . 中国陆地地貌基本形态类型定量提取与分析
. 地球信息科学学报, 2009, 11(6): 725-736.]
https://doi.org/10.3969/j.issn.1560-8999.2009.06.007URLMagsci [本文引用: 1]摘要
中国陆地地貌基本形态类型由海拔和地势起伏度两个指标组合划分而成,其中海拔分4级,地势起伏度分7级,组合后的基本形态类型共25类。按照数字地貌分类体系,海拔和起伏度拥有全国普适性的分级指标,基于DEM数据可获得两指标的分级类型。试验表明,基于SRTM-DEM(水平分辨率90m,相当于1:25万比例尺)数据可得出全国普适性的采用单元为4km<sup>2</sup>,利用1:10万、1:400万等比例尺数据进行DEM试验,得出我国存在0.4、4、12、18、21km<sup>2</sup>五种不同规模的采样单元,并分别对应着不同的比例尺。因我国地貌复杂多样,仅利用DEM数据所获得的海拔和地势起伏度分级数据不能完全反映不同地域的地貌特征,故利用遥感等多源数据,综合多种信息获得的地貌类型,可很好地反映出我国的海拔4级分级特征和地势起伏度7级空间分布,进而获得全国陆地的25种基本形态类型的面积及空间分布格局。
[50]Wang Kejing, Cai Hongyan, Yang Xiaohuan.Multiple scale spatialization of demographic data with multi-factor linear regression and geographically weighted regression models
. Progress in Geography, 2016, 35(12): 1494-1505.
https://doi.org/10.18306/dlkxjz.2016.12.006URL [本文引用: 2]摘要
对统计型人口数据进行格网形式的空间化可更直观地展示人口的空间分布,但不同的人口空间化建模方法和不同的格网尺度在表达人口空间化结果方面存在差异.本文在人口特征分区的基础上,引入DMSP/OLS夜间灯光对城镇用地进行再分类,采用多元统计回归和地理加权回归方法(GWR),开展人口统计数据空间化多尺度模型研究,生成1km、5km和10km等3个尺度的2010年安徽省人口空间数据,并对3个尺度下2个模型结果进行精度评价与比较.结果表明:人口空间数据精度不仅与建模所用方法关系密切,还受到建模格网尺度大小的影响.基于多元统计回归方法的模型估计人口数与实际人口的平均相对误差值随着尺度的增加而降低,而基于GWR方法获得的人口空间数据误差值随着尺度的增加而升高.整体来看,基于GWR方法的1km研究尺度的人口空间数据平均相对误差最低(22.31%).区域地形地貌条件与人口空间数据误差有较强的关联,地貌类型复杂的山区人口空间数据误差较大.
[王珂靖, 蔡红艳, 杨小唤. 多元统计回归及地理加权回归方法在多尺度人口空间化研究中的应用
. 地理科学进展, 2016, 35(12): 1494-1505.]
https://doi.org/10.18306/dlkxjz.2016.12.006URL [本文引用: 2]摘要
对统计型人口数据进行格网形式的空间化可更直观地展示人口的空间分布,但不同的人口空间化建模方法和不同的格网尺度在表达人口空间化结果方面存在差异.本文在人口特征分区的基础上,引入DMSP/OLS夜间灯光对城镇用地进行再分类,采用多元统计回归和地理加权回归方法(GWR),开展人口统计数据空间化多尺度模型研究,生成1km、5km和10km等3个尺度的2010年安徽省人口空间数据,并对3个尺度下2个模型结果进行精度评价与比较.结果表明:人口空间数据精度不仅与建模所用方法关系密切,还受到建模格网尺度大小的影响.基于多元统计回归方法的模型估计人口数与实际人口的平均相对误差值随着尺度的增加而降低,而基于GWR方法获得的人口空间数据误差值随着尺度的增加而升高.整体来看,基于GWR方法的1km研究尺度的人口空间数据平均相对误差最低(22.31%).区域地形地貌条件与人口空间数据误差有较强的关联,地貌类型复杂的山区人口空间数据误差较大.
[51]Tian Yongzhong, Chen Shupeng, Yue Tianxiang, et al.Simulation of Chinese population density based on land use
. Acta Geographica Sinica, 2004, 59(2): 283-292.
https://doi.org/10.3321/j.issn:0375-5444.2004.02.015URL [本文引用: 1]摘要
= P×V/■V + P×V/■V. Linear weighted model is used to calculate rural population indices. It firstly picks out the indicators for the model which are correlated positively and remarkably with the population of counties in each of the 12 ecological regions, then stepwise regression is introduced to calculate the indices; and finally the weighted coefficients of various indices are determined in combination with the productivity of land and the relations between habitation and variant land. For the urban population indices, a power exponential model based on the scale of town and the distance from the center of town, rooted in distance decay function, is built as V = A×lnA×exp(-1.9874ri-0.6). The outcome of the simulation shows that 94.58% of the population inhabit in the southeast of Hu Huanyong population line, and its density is 21 times as that of the northwest. In the east, population is centralized in four regions and one zone. They are Huang-Huai-Hai plain, Sichuan basin, plains of the middle and lower Yangtze River, Northeast China plain and the zone of 100 km from coast. Moreover, a "points-axis" pattern of population distribution is discovered on the southeast coast. Because this paper has fully recognized the relation between land use and the population distribution, the outcome of the simulation proves to be highly credible. Compared with other models, this method is more efficient.
[田永中, 陈述彭, 岳天祥, . 基于土地利用的中国人口密度模拟
. 地理学报, 2004, 59(2): 283-292.]
https://doi.org/10.3321/j.issn:0375-5444.2004.02.015URL [本文引用: 1]摘要
= P×V/■V + P×V/■V. Linear weighted model is used to calculate rural population indices. It firstly picks out the indicators for the model which are correlated positively and remarkably with the population of counties in each of the 12 ecological regions, then stepwise regression is introduced to calculate the indices; and finally the weighted coefficients of various indices are determined in combination with the productivity of land and the relations between habitation and variant land. For the urban population indices, a power exponential model based on the scale of town and the distance from the center of town, rooted in distance decay function, is built as V = A×lnA×exp(-1.9874ri-0.6). The outcome of the simulation shows that 94.58% of the population inhabit in the southeast of Hu Huanyong population line, and its density is 21 times as that of the northwest. In the east, population is centralized in four regions and one zone. They are Huang-Huai-Hai plain, Sichuan basin, plains of the middle and lower Yangtze River, Northeast China plain and the zone of 100 km from coast. Moreover, a "points-axis" pattern of population distribution is discovered on the southeast coast. Because this paper has fully recognized the relation between land use and the population distribution, the outcome of the simulation proves to be highly credible. Compared with other models, this method is more efficient.
[52]Breiman L.Random forests
. Machine Learning, 2001, 45(1): 5-32.
https://doi.org/10.1023/A:1010933404324URL [本文引用: 1]
[53]Fang Kuangnan, Wu Jianbin, Zhu Jianping, et al.A review of technologies on random forests
. Statistics and Information Forum, 2011, 26(3): 32-38.
https://doi.org/10.3969/j.issn.1007-3116.2011.03.006URL [本文引用: 1]摘要
随机森林(RF)是一种统计学习理论,它是利用bootsrap重抽样方法从原始样本中抽取多个样本,对每个bootsrap样本进行决策树建模,然后组合多棵决策树的预测,通过投票得出最终预测结果。它具有很高的预测准确率,对异常值和噪声具有很好的容忍度,且不容易出现过拟合,在医学、生物信息、管理学等领域有着广泛的应用。为此,介绍了随机森林原理及其有关性质,讨论其最新的发展情况以及一些重要的应用领域。
[方匡南,吴见彬,朱建平,.随机森林方法研究综述
.统计与信息论坛,2011, 26(3): 32-38.]
https://doi.org/10.3969/j.issn.1007-3116.2011.03.006URL [本文引用: 1]摘要
随机森林(RF)是一种统计学习理论,它是利用bootsrap重抽样方法从原始样本中抽取多个样本,对每个bootsrap样本进行决策树建模,然后组合多棵决策树的预测,通过投票得出最终预测结果。它具有很高的预测准确率,对异常值和噪声具有很好的容忍度,且不容易出现过拟合,在医学、生物信息、管理学等领域有着广泛的应用。为此,介绍了随机森林原理及其有关性质,讨论其最新的发展情况以及一些重要的应用领域。
[54]Zeng C Q, Zhou Y, Wang S X, et al.Population spatialization in China based on night-time imagery and land use data
. International Journal of Remote Sensing, 2011, 32(24): 9599-9620.
https://doi.org/10.1080/01431161.2011.569581URL [本文引用: 1]
[55]Wang L, Feng Z M, Yang Y Z.The change in population density from 2000 to 2010 and its influencing factors in China at the county scale
. Journal of Geographical Sciences, 2015, 25(4): 485-496.
https://doi.org/10.1007/s11442-015-1181-zURL [本文引用: 2]摘要
在人口分发和密度学习变化能为地区性的开发提供重要基础并且计划。空间模式和在在中国的人口密度的变化的开车因素还不是清楚的。用在 2000 和 2010 的人口普查数据,因此,这研究第一在中国分析了人口密度的变化并且在所有 2353 个县把变化划分了成 4 种类型,由快速的增加,慢增加,慢减少和快速的减少组成。随后,基于部分最少的平方(请) 回归方法,我们认出了重要因素(在 11 个自然、社会经济的因素之中) 为有人口变化的不同类型的整个国家和县的影响人口密度变化。结果显示出那:( 1 )在 2010 ,与在 2000 的人口密度相比,在大多数县(超过60%)的人口密度每 km 由 21 个人增加了 2 平均,当在另外的县的人口密度每 km 由 13 个人减少了时 2 。所有 2353 个县,当 458 和 446 个县分别地在人口密度显示出慢、快速的减少时, 860 和 589 个县分别地在人口密度显示出快速、慢的增加。(2 ) 在 11 个因素之中,社会经济的因素比自然因素更显著地影响了人口密度变化。更高经济的发展水平,更好医药的条件和更强壮的通讯能力是人口增加的主要的拉因素。稠密的人口密度是人口减少的主要的推因素。这些结论在过去的 10 年在中国澄清了人口变化和它的影响因素的空间模式并且能为计划的未来人口提供有用参考。
[56]Liu Jinsong.A review of population geography research in China
. Acta Geographica Sinica, 2014, 69(8): 1177-1189.
https://doi.org/10.11821/dlxb201408012URL摘要
1978年以来是中国人口地理学复兴和发展时期。中国人口地理学工作者消化吸收西方经典人口学理论,讨论中国人口容量问题,认识到中国人口总量即将达到增长极限,强调控制人口总量、努力发展生产和转变生存方式是解决人口问题的关键。针对资源短缺和环境污染问题,提出了创建第四产业,实施环境抚育,推动劳动力就业,降低环境污染的策略。针对民生问题,提出深入开展微观社会调查,主动再造跨尺度的社区制度,推进对人口行为的尺度综合和文化自觉。针对中国人口快速转变和人口结构问题,提出了人口均衡发展理论。针对国土空间开发格局问题,提出了区域发展均衡模型,强调通过产业转移、人口流动、转移支付等手段,形成相对均衡的区域发展格局。针对区域人口发展不平衡问题,提出了人口发展功能分区指标和分区模型,初步实现了视野综合化、指标定量化、分析模型化,将人口地理学研究推向新高度。未来中国人口地理学研究,一要围绕人口普查和人口业务数据库,建设分布式人口地理信息系统,推动人口专题数据和人口计量模型共享,巩固和发展人-口地理学定量化研究之特色;二要加强不同尺度的社区微观调查,主动调控人口快速转变情景下的社区行为,提高对人口地理学定量研究结果的理解和解释;三要加强国际人口情报交流,把握各国人口演化趋势,从经济全球化的分工合作体系的视角,合理配置中国劳动力资源和人才资源。中国人口地理学应坚持走跨学科的发展道路,努力在世界人口之巅辛勤耕耘,为国家发展、学科建设做出应有的贡献。
[刘劲松. 中国人口地理研究进展
. 地理学报, 2014, 69(8): 1177-1189.]
https://doi.org/10.11821/dlxb201408012URL摘要
1978年以来是中国人口地理学复兴和发展时期。中国人口地理学工作者消化吸收西方经典人口学理论,讨论中国人口容量问题,认识到中国人口总量即将达到增长极限,强调控制人口总量、努力发展生产和转变生存方式是解决人口问题的关键。针对资源短缺和环境污染问题,提出了创建第四产业,实施环境抚育,推动劳动力就业,降低环境污染的策略。针对民生问题,提出深入开展微观社会调查,主动再造跨尺度的社区制度,推进对人口行为的尺度综合和文化自觉。针对中国人口快速转变和人口结构问题,提出了人口均衡发展理论。针对国土空间开发格局问题,提出了区域发展均衡模型,强调通过产业转移、人口流动、转移支付等手段,形成相对均衡的区域发展格局。针对区域人口发展不平衡问题,提出了人口发展功能分区指标和分区模型,初步实现了视野综合化、指标定量化、分析模型化,将人口地理学研究推向新高度。未来中国人口地理学研究,一要围绕人口普查和人口业务数据库,建设分布式人口地理信息系统,推动人口专题数据和人口计量模型共享,巩固和发展人-口地理学定量化研究之特色;二要加强不同尺度的社区微观调查,主动调控人口快速转变情景下的社区行为,提高对人口地理学定量研究结果的理解和解释;三要加强国际人口情报交流,把握各国人口演化趋势,从经济全球化的分工合作体系的视角,合理配置中国劳动力资源和人才资源。中国人口地理学应坚持走跨学科的发展道路,努力在世界人口之巅辛勤耕耘,为国家发展、学科建设做出应有的贡献。
[57]Shi X L, Wang W, Shi W J.Progress on quantitative assessment of the impacts of climate change and human activities on cropland change
. Journal of Geographical Sciences, 2016, 26(3): 339-354.
https://doi.org/10.1007/s11442-016-1272-5URL [本文引用: 1]摘要
It is important to study the contributions of climate change and human activities to cropland changes in the fields of both climate change and land use change. Relationships between cropland changes and driving forces were qualitatively studied in most of the previous researches. However, the quantitative assessments of the contributions of climate change and human activities to cropland changes are needed to be explored for a better understanding of the dynamics of land use changes. We systematically reviewed the methods of identifying the contributions of climate change and human activities to cropland changes at quantitative aspects, including model analysis, mathematical statistical method, framework analysis, index assessment and difference comparison. Progress of the previous researches on quantitative evaluation of the contributions was introduced. Then we discussed four defects in the assessment of the contributions of climate change and human activities. For example, the methods were lack of comprehensiveness, and the data need to be more accurate and abundant. In addition, the scale was single and the explanations were biased. Moreover, we concluded a clue about quantitative approach to assess the contributions from synthetically aspect to specific driving forces. Finally, the solutions of the future researches on data, scale and explanation were proposed.
[58]Yao Yonghui, Zhang Baiping.MODIS-based estimation of air temperature and heating-up effect of the Tibetan Plateau
. Acta Geographica Sinica, 2013, 68(1): 95-107.
https://doi.org/10.3969/j.issn.0375-5444.2013.01.011URL [本文引用: 1]摘要
利用2001-2007年MODIS地表温度数据、137个气象观测台站数据和ASTERGDEM数据,采用普通线性回归分析方法(OLS)及地理加权回归分析方法(GWR),研究了高原月均地表温度与气温的相关关系,最终选择精度较高的GWR分析方法,建立了高原气温与地表温度、海拔高度的回归模型。各月气温GWR回归模型的决定系数(AdjustedR2)都达到了0.91以上(0.91~0.95),标准误差(RMSE)介于1.16~1.58℃;约70%以上的台站各月残差介于-1.5~1.5℃之间,80%以上的台站的残差介于-2~2℃之间。根据该模型,估算了青藏高原气温,并在此基础上,将高原及周边地区7月份月均气温转换到4500m和5000m海拔高度上,对比分析高原内部相对于外围地区的增温效应。研究结果表明:(1)利用GWR方法,结合地面台站的观测数据和MODISTs、DEM等,对高原气温估算的精度高于以往普通回归分析模型估算的精度(RMSE=2~3℃),精度可以提高到1.58℃;(2)高原夏半年海拔5000m左右的高山区气温能达到0℃以上,尤其是7月份,海拔4000~5500m的高山区的气温仍能达到10℃左右,为山地森林的发育提供了温度条件,使高原成为北半球林线分布最高的地方;(3)高原的增温效应非常突出,初步估算,在相同的海拔高度上高原内部气温要比外围地区高6~10℃。
[姚永慧, 张百平. 基于MODIS数据的青藏高原气温与增温效应估算
. 地理学报, 2013, 68(1): 95-107.]
https://doi.org/10.3969/j.issn.0375-5444.2013.01.011URL [本文引用: 1]摘要
利用2001-2007年MODIS地表温度数据、137个气象观测台站数据和ASTERGDEM数据,采用普通线性回归分析方法(OLS)及地理加权回归分析方法(GWR),研究了高原月均地表温度与气温的相关关系,最终选择精度较高的GWR分析方法,建立了高原气温与地表温度、海拔高度的回归模型。各月气温GWR回归模型的决定系数(AdjustedR2)都达到了0.91以上(0.91~0.95),标准误差(RMSE)介于1.16~1.58℃;约70%以上的台站各月残差介于-1.5~1.5℃之间,80%以上的台站的残差介于-2~2℃之间。根据该模型,估算了青藏高原气温,并在此基础上,将高原及周边地区7月份月均气温转换到4500m和5000m海拔高度上,对比分析高原内部相对于外围地区的增温效应。研究结果表明:(1)利用GWR方法,结合地面台站的观测数据和MODISTs、DEM等,对高原气温估算的精度高于以往普通回归分析模型估算的精度(RMSE=2~3℃),精度可以提高到1.58℃;(2)高原夏半年海拔5000m左右的高山区气温能达到0℃以上,尤其是7月份,海拔4000~5500m的高山区的气温仍能达到10℃左右,为山地森林的发育提供了温度条件,使高原成为北半球林线分布最高的地方;(3)高原的增温效应非常突出,初步估算,在相同的海拔高度上高原内部气温要比外围地区高6~10℃。
[59]Zhou Qianqian, Ding Jianli, Tang Mengying, et al.Inversion of soil organic matter content in oasis typical of arid area and its influencing factors
. Acta Pedologica Sinica, 2018, 55(2): 313-324.
URL [本文引用: 1]

[周倩倩, 丁建丽, 唐梦迎, . 干旱区典型绿洲土壤有机质的反演及影响因素研究
. 土壤学报, 2018, 55(2): 313-324.]
URL [本文引用: 1]
[60]Liu Li, Han Mei, Liu Yubin, et al.Spatial distribution of wetland vegetation biomass and its influencing factors in the Yellow River Delta Nature Reserve
. Acta Ecologica Sinica, 2017, 37(13): 4346-4355.
https://doi.org/10.5846/stxb201508241763URL [本文引用: 1]摘要
以黄河三角洲自然保护区为研究区域,以野外实测湿地植被地上生物量数据、Landsat-8影像数据和土壤各因子检测数据为数据源,通过分析各遥感因子与实测植被生物量的相关关系,建立生物量模型,进行生物量的定量反演。通过研究生物量与土壤、水环境因子的关系,筛选影响生物量的关键因子,进而分析生物量的空间分布规律。结果表明:湿地植被地上生物量的干重与各遥感因子的相关性较高;以NDVI、EVI、MSAVI、DVI、RVI、Band1、Band2、Band3、Band4、Band6共10个因子作为自变量建立的反演模型最优;反演计算的生物量干重分为5个等级区,最低的1级区和最高的5级区面积较小,为82.23、72.16 km2,分别占研究区湿地植被总面积的13.35%、11.71%。生物量干重适中的2、3、4级区所占面积较大,为211.99、136.39、113.29 km2,分别占研究区湿地植被总面积的34.41%、22.14%、18.39%;在各环境因子中水深对芦苇生物量干重影响最大,土壤含水率对碱蓬生物量干重影响最大,水、盐条件是导致优势种植被生物量干重出现空间分异的主导因素;植被生物量干重呈现由陆向海减小,由黄河河道两岸向外递减的趋势。;The Yellow River Delta Nature Reserve is selected as the research area, and the wetland vegetation biomass data measured in the field, landsat-8 image data acquired from the United States Geological Survey (USGS), and soil factor test data obtained by laboratory test were used as the data sources. The wetland vegetation biomass model has been established, and the quantitative biomass inversion model has been conducted by analyzing the correlation coefficient between Landsat-8 images, vegetation indices, and biomass measured in the field. By studying the relationship between the wetland vegetation biomass and soil water environmental factors, the key factors affecting the vegetation biomass were selected, and the spatial distribution rules of wetland vegetation biomass were analyzed in the Yellow River Delta Nature Reserve. The results showed that the correlation between dry weight of wetland vegetation aboveground biomass and remote sensing factors (band and vegetation indices) is relatively higher. The optimal inversion model is established using 10 factors as independent variables, including 5 vegetation indices (normalized difference vegetation index, NDVI; environmental vulnerability index, EVI; modified soil-adjusted vegetation index, MSAVI; difference vegetation index, DVI; and ratio vegetation index, RVI) and 5 bands (Band1, Band2, Band3, Band4, and Band6). The dry weight of wetland vegetation biomass is obviously divided into five classes according to the inversion calculation in the Yellow River Delta Nature Reserve. The least dry weight of wetland vegetation biomass is categorized as Class 1, and the highest dry weight of wetland vegetation biomass is categorized as Class 5, both of which occupied small areas. Class 1 and Class 5 areas are 82.23 km2 accounting for 13.35% and 72.16 km2 accounting for 11.71% of the total area of wetland vegetation in the study area, respectively. Furthermore, the area of the other classes (Class 2, Class 3, and Class 4) is larger than Class 1 and Class 5, and their dry weight of wetland vegetation biomass is moderate. Moreover, Class 2, Class 3, and Class 4 areas are 211.99 km2 accounting for 34.41%, 136.39 km2 accounting for 22.14%, and 113.29 km2 accounting for 18.39% of the total area of wetland vegetation in the study area, respectively. Among the environmental factors that affect the wetland vegetation biomass in the Yellow River Delta Nature Reserve, water depth has the greatest effect on the dry weight of Phragmites australis biomass. In addition, soil water has the greatest effect on the dry weight of Suaeda glauca biomass. The complex interactions of river water, groundwater, and seawater led to the spatial variation of salinity. Water and salt conditions are the leading factors causing the spatial differences of the predominant dry weight of vegetation biomass in the Yellow River Delta Nature Reserve. The dry weight of vegetation biomass in the Yellow River Delta Nature Reserve tends to decrease from land to ocean from the river course of the Yellow River to both riverbanks.
[刘莉, 韩美, 刘玉斌, . 黄河三角洲自然保护区湿地植被生物量空间分布及其影响因素
. 生态学报, 2017, 37(13): 4346-4355.]
https://doi.org/10.5846/stxb201508241763URL [本文引用: 1]摘要
以黄河三角洲自然保护区为研究区域,以野外实测湿地植被地上生物量数据、Landsat-8影像数据和土壤各因子检测数据为数据源,通过分析各遥感因子与实测植被生物量的相关关系,建立生物量模型,进行生物量的定量反演。通过研究生物量与土壤、水环境因子的关系,筛选影响生物量的关键因子,进而分析生物量的空间分布规律。结果表明:湿地植被地上生物量的干重与各遥感因子的相关性较高;以NDVI、EVI、MSAVI、DVI、RVI、Band1、Band2、Band3、Band4、Band6共10个因子作为自变量建立的反演模型最优;反演计算的生物量干重分为5个等级区,最低的1级区和最高的5级区面积较小,为82.23、72.16 km2,分别占研究区湿地植被总面积的13.35%、11.71%。生物量干重适中的2、3、4级区所占面积较大,为211.99、136.39、113.29 km2,分别占研究区湿地植被总面积的34.41%、22.14%、18.39%;在各环境因子中水深对芦苇生物量干重影响最大,土壤含水率对碱蓬生物量干重影响最大,水、盐条件是导致优势种植被生物量干重出现空间分异的主导因素;植被生物量干重呈现由陆向海减小,由黄河河道两岸向外递减的趋势。;The Yellow River Delta Nature Reserve is selected as the research area, and the wetland vegetation biomass data measured in the field, landsat-8 image data acquired from the United States Geological Survey (USGS), and soil factor test data obtained by laboratory test were used as the data sources. The wetland vegetation biomass model has been established, and the quantitative biomass inversion model has been conducted by analyzing the correlation coefficient between Landsat-8 images, vegetation indices, and biomass measured in the field. By studying the relationship between the wetland vegetation biomass and soil water environmental factors, the key factors affecting the vegetation biomass were selected, and the spatial distribution rules of wetland vegetation biomass were analyzed in the Yellow River Delta Nature Reserve. The results showed that the correlation between dry weight of wetland vegetation aboveground biomass and remote sensing factors (band and vegetation indices) is relatively higher. The optimal inversion model is established using 10 factors as independent variables, including 5 vegetation indices (normalized difference vegetation index, NDVI; environmental vulnerability index, EVI; modified soil-adjusted vegetation index, MSAVI; difference vegetation index, DVI; and ratio vegetation index, RVI) and 5 bands (Band1, Band2, Band3, Band4, and Band6). The dry weight of wetland vegetation biomass is obviously divided into five classes according to the inversion calculation in the Yellow River Delta Nature Reserve. The least dry weight of wetland vegetation biomass is categorized as Class 1, and the highest dry weight of wetland vegetation biomass is categorized as Class 5, both of which occupied small areas. Class 1 and Class 5 areas are 82.23 km2 accounting for 13.35% and 72.16 km2 accounting for 11.71% of the total area of wetland vegetation in the study area, respectively. Furthermore, the area of the other classes (Class 2, Class 3, and Class 4) is larger than Class 1 and Class 5, and their dry weight of wetland vegetation biomass is moderate. Moreover, Class 2, Class 3, and Class 4 areas are 211.99 km2 accounting for 34.41%, 136.39 km2 accounting for 22.14%, and 113.29 km2 accounting for 18.39% of the total area of wetland vegetation in the study area, respectively. Among the environmental factors that affect the wetland vegetation biomass in the Yellow River Delta Nature Reserve, water depth has the greatest effect on the dry weight of Phragmites australis biomass. In addition, soil water has the greatest effect on the dry weight of Suaeda glauca biomass. The complex interactions of river water, groundwater, and seawater led to the spatial variation of salinity. Water and salt conditions are the leading factors causing the spatial differences of the predominant dry weight of vegetation biomass in the Yellow River Delta Nature Reserve. The dry weight of vegetation biomass in the Yellow River Delta Nature Reserve tends to decrease from land to ocean from the river course of the Yellow River to both riverbanks.
相关话题/人口 空间 数据 生态 统计