基于集成学习的O3的质量浓度预测模型
彭岩(),冯婷婷,王洁*()首都师范大学管理学院,北京 100048
收稿日期:
2019-07-25出版日期:
2020-08-20发布日期:
2020-08-13通讯作者:
王洁E-mail:pengyan@cnu.edu.cn;wangjie@cnu.edu.cn作者简介:
彭岩(1967—),女,重庆人,教授,博士,主要研究方向为大数据分析与数据挖掘.E-mail:基金资助:
全国教育科学规划-教育部重点课题资助项目(DLA190426)An integrated learning approach for O3 mass concentration prediction model
Yan PENG(),Tingting FENG,Jie WANG*()School of Management, Captial Normal University, Beijing 100048, China
Received:
2019-07-25Online:
2020-08-20Published:
2020-08-13Contact:
Jie WANG E-mail:pengyan@cnu.edu.cn;wangjie@cnu.edu.cn摘要/Abstract
摘要: 为准确预测O3的质量浓度及其发展趋势,分析其诱发因素,提出一种基于集成学习的O3的质量浓度预测模型。以北京市2015—2016年O3污染物的质量浓度及气象因素数据为基础,提出并建立面向O3污染物的质量浓度预测的特征选择-集成学习多层预测模型,在对数据进行缺失值填补及异常值分析的基础上,利用Pearson相关分析和Lasso回归分析同时对清理后的气象资料数据进行特征选择,以消除数据冗余,提高预测精度;提出基于自组织映射神经网络self-organizing featuremap, SOFM和Elman神经网络Elman neural network, ENN的集成学习算法,利用SOFM对样本数据进行聚类以实现样本的合理分布后,使用ENN进行仿真训练来预测O3的质量浓度。试验结果表明:采用Pearson-Lasso特征选择和SOFM样本聚类对数据做前期处理后,ENN的预测精度由74.6%提高到82.1%,能够改善基于ENN的O3污染物的质量浓度的预测准确率。
PDF全文下载地址:
http://gxbwk.njournal.sdu.edu.cn/CN/article/downloadArticleFile.do?attachType=PDF&id=1949