基于机器学习的历史气候重建论文智能识别与数据挖掘初探

删除或更新信息，请邮件至freekaoyan#163.com(#换成@)

本站小编 Free考研考试/2022-01-03

华萌萌^1,2,,
尹君¹,
胡召玲²,
张学珍^1,3,,
1. 中国科学院地理科学与资源研究所, 中国科学院陆地表层格局与模拟重点实验室, 北京 100101
2. 江苏师范大学, 江苏徐州 221116
3. 中国科学院大学, 北京 100049

基金项目: 国家重点研发计划项目（批准号：2017YFA0603301）和中国科学院（A类）战略性先导科技专项项目（批准号：XDA19040101）共同资助

详细信息

作者简介: 华萌萌, 女, 24岁, 硕士研究生, 主要从事数据挖掘研究, E-mail: meng970127@163.com

通讯作者: 张学珍, E-mail: xzzhang@igsnrr.ac.cn

中图分类号: P467;P468

收稿日期:2020-11-02
修回日期:2021-01-16
刊出日期:2021-03-30

Preliminary study on machine learning-based intelligent recognition of historical climate reconstruction papers and data mining

HUA Mengmeng^1,2,,
YIN Jun¹,
HU Zhaoling²,
ZHANG Xuezhen^1,3,,
1. Key Laboratory of Land Surface Pattern and Simulation, Institute of Geographical Sciences and Natural Resources Research, Chinese Academy of Sciences, Beijing 100101
2. Jiangsu Normal University, Xuzhou 221116, Jiangsu
3. University of Chinese Academy of Sciences, Beijing 100049

More Information

Corresponding author: ZHANG Xuezhen,E-mail:xzzhang@igsnrr.ac.cn

MSC: P467;P468

--> Received Date: 02 November 2020
Revised Date: 16 January 2021
Publish Date: 30 March 2021

摘要
摘要:本文基于机器学习方法开展了从海量的气候变化研究论文中智能识别历史气候重建论文，并提取关键信息的技术研究。首先以人工标注的1450篇古气候重建论文摘要作为样本数据，对机器学习中常见的9种分类模型进行训练和精度检验，发现极端随机树模型在此类文本中具有较高的分类精度；其次，利用这一模型对ResearchGate中70万余篇气候变化相关的论文摘要进行智能分类，从中筛选出6039篇千年尺度气候重建论文摘要，并根据词云图验证了分类结果的可靠性。在此基础上，采用命名实体识别技术对6039篇论文摘要，从重建气候要素、代用资料类型和目标地区（国家）这3个维度开展了文本数据挖掘。挖掘结果表明：温度和降水是两大主要的重建要素，树轮、历史文献、沉积（含孢粉）是位居前三位的主要代用资料，这与领域专家经验基本一致；同时，重建气候要素与代用资料类型及二者的组合规律呈现鲜明的地理差异，这与区域气候特征密切相关。
关键词: 历史气候/
气候重建/
文本分类/
数据挖掘/
机器学习

Abstract:It is a hot topic to carry out integrated reconstructions of historical climate changes using numerous existing single proxy-based reconstructions. To achieve the integrated reconstruction, there is a great demand to collect target papers of existing reconstructions. Taking this background, this study explored a machine learning-based technology of intelligently recognition of historical climate reconstruction papers and carried out key information mining from these papers. Firstly, we prepared a set of 1450 abstracts of published paleoclimate reconstruction papers and tagged one by one artificially with millennium-scale reconstruction and with other reconstruction. We used this set of abstracts as sample dataset to train and test nine machine learning-based classification models. We found that classification accuracy of Extra Trees model was higher than the other models. Then, we used the Extra Trees model on a set of more than 70×10⁴ abstracts of climate change research papers from the ResearchGate website. As a result, 6039 abstracts for the millennium-scale climate reconstruction were selected intelligently. The reliability of the 6039 abstracts were also confirmed by comparing its word cloud to that of sample dataset. Finally, using the technology of Named-entity recognition on the 6039 abstracts, three dimensions of information, including reconstructed climate elements, proxy data categories and target regions(countries), were mined intelligently. The frequencies of key words show that on the dimension of climate elements temperature and precipitation are the two most frequently climate elements for reconstruction. On the dimension of proxy data, tree ring, historical documents and sediments(including pollen) are the three most frequently proxy data. These results keep consistent with the experts' experience of this field. The results also show that frequencies of reconstructed climate elements, proxy data categories and their combination exhibit distinct geographical differences, which may be relevant to regional climatic characteristic.
Key words:historical climate/
climate reconstruction/
text classification/
data mining/
machine learning

PDF全文下载地址:

http://www.dsjyj.com.cn/data/article/export-pdf?id=60768b47c23e6710c26d5b5e

相关话题/论文 中国科学院 历史 北京 数据

领限时大额优惠券,享本站正版考研考试资料!
优惠券领取后72小时内有效，10万种最新考研考试考证类电子打印资料任你选。涵盖全国500余所院校考研专业课、200多种职业资格考试、1100多种经典教材，产品类型包含电子书、题库、全套资料以及视频，无论您是考研复习、考证刷题，还是考前冲刺等，不同类型的产品可满足您学习上的不同需求。 ...
考试优惠券本站小编 Free壹佰分学习网 2022-09-19
社会-生态弹性视角下的历史气候变化影响社会发展机制
方修琦北京师范大学地理科学学部地理学院,北京100875基金项目:中国科学院（A类）战略性先导科技专项项目（批准号：XDA19040101）资助详细信息作者简介:方修琦,男,59岁,教授,气候变化影响和适应研究,E-mail:xfang@bnu.edu.cn中图分类号:P467收稿日期:2020-1 ...
中科院地质与地球物理研究所本站小编 Free考研考试 2022-01-03
中亚地区过去2000年气候变化研究的数据挖掘
于听雷1,2,,张学珍1,2,郑景云1,2,,1.中国科学院地理科学与资源研究所,中国科学院陆地表层格局与模拟重点实验室,北京1001012.中国科学院大学,北京100049基金项目:国家重点研发计划项目（批准号：2017YFA0603301）资助详细信息作者简介:于听雷,25岁,男,博士研究生,主 ...
中科院地质与地球物理研究所本站小编 Free考研考试 2022-01-03
北疆阿尔泰哈拉沙子高山泥炭岩芯孢粉记录是否指示全新世温度变化历史？
饶志国,郭海春湖南师范大学资源与环境科学学院,湖南长沙410081基金项目:湖南省****基金项目（批准号：2018JJ1017）和国家自然科学基金项目（批准号：41772373和41372181）共同资助详细信息作者简介:饶志国,男,42岁,教授,自然地理专业,E-mail:raozhg@hunn ...
中科院地质与地球物理研究所本站小编 Free考研考试 2022-01-03
北京地区暴雨泥石流预警阈值研究
王海芝北京市地质研究所,北京100120基金项目:国家自然科学基金项目(批准号:41772182和41672181)、国家重点基础研究发展计划项目(批准号:2017YFA060340202)和中国科学院(B类)科技先导专项项目(批准号:XDB26020000)共同资助详细信息作者简介:王海芝,女,4 ...
中科院地质与地球物理研究所本站小编 Free考研考试 2022-01-03
轨道尺度亚洲气候演化机理的数值模拟:历史与展望
石正国1,2,3,,雷婧1,周朋4,任鑫11.中国科学院地球环境研究所,黄土与第四纪地质国家重点实验室,陕西西安7100612.中国科学院第四纪科学与全球变化卓越创新中心,陕西西安7100613.西安交通大学全球环境变化研究院,陕西西安7100494.北京师范大学地球科学前沿交叉研究中心,北京100 ...
中科院地质与地球物理研究所本站小编 Free考研考试 2022-01-03
新疆SCZ17剖面黑碳记录的16~12 ka火灾历史及其驱动因素探究
张曼1,,段阜涛1,李刚2,刘依1,王伟1,赵永涛1,3,安成邦1,,1.兰州大学资源环境学院,西部环境教育部重点实验室,甘肃兰州7300002.中国气象局兰州干旱气象研究所,甘肃省干旱气候变化与减灾重点实验室,中国气象局干旱气候变化与减灾重点开放实验室,甘肃兰州7300203.中国科学院西北生态环 ...
中科院地质与地球物理研究所本站小编 Free考研考试 2022-01-03
东北哈尼泥炭14 ka B.P.以来大气汞沉降历史记录
谢哲宇1,,裘冰倩1,肖河2,黄庭1,,,李亚静1,刘雅1,黄珊1,王香莲1,张湘文1,程胜高31.南昌大学资源环境与化工学院,鄱阳湖环境与资源利用教育部重点实验室,江西南昌3300312.桂林理工大学环境科学与工程学院,广西桂林5321003.中国地质大学(武汉)环境学院,湖北武汉430074基金 ...
中科院地质与地球物理研究所本站小编 Free考研考试 2022-01-03
基于ZY3 DEM和SRTM DEM的北京平原区地貌特征探析
王艳萍1,,DongPinliang2,廖顺宝11.防灾科技学院生态与环境学院,河北三河0652012.北德克萨斯大学地理与环境系,德克萨斯州76203,美国基金项目:中央高校基本科研业务费青年教师资助计划项目（批准号：ZY20160210）和地震科技青年骨干人才培养项目（批准号：201604190 ...
中科院地质与地球物理研究所本站小编 Free考研考试 2022-01-03
新生代增温情景下自然火历史的研究
刘恋中国地质科学院,北京100037基金项目:国家自然科学基金项目(批准号:41877431)资助详细信息作者简介:刘恋,女,36岁,博士/副研究员,第四纪地质与环境学专业,E-mail:liulian198394@163.com中图分类号:P534.6;P532收稿日期:2018-02-11修回日 ...
中科院地质与地球物理研究所本站小编 Free考研考试 2022-01-03
青莲岗遗址孢粉及硅藻记录的古环境变化历史
尹建吉1,,胡竹君1,2,,,吴小爽1,林留根3,甘恢元3,张驰4,萧家仪1,21.南京师范大学地理科学学院,江苏南京2100232.江苏省地理信息资源开发与利用协同创新中心,江苏南京2100233.南京博物院考古研究所,江苏南京2100184.淮安楚州博物馆,江苏淮安223200基金项目:国家重点 ...
中科院地质与地球物理研究所本站小编 Free考研考试 2022-01-03