删除或更新信息,请邮件至freekaoyan#163.com(#换成@)

基于数据挖掘算法和数值模拟技术的大气污染减排效果评估

本站小编 Free考研考试/2021-12-31

熊亚军1, 徐敬2, 孙兆彬2, 李梓铭1, 吴进1, 尹晓梅1, 乔林1, 赵秀娟2
1. 京津冀环境气象预报预警中心, 北京 100089;
2. 中国气象局北京城市气象研究所, 北京 100089
收稿日期: 2018-04-23; 修回日期: 2018-06-22; 录用日期: 2018-06-24
基金项目: 国家重点研发计划(No.2016YFC0202100);北京自然科学基金(No.8161004);国家自然科学基金(No.41575010);国家科技支撑计划(No.2014BAC16B04)
作者简介: 熊亚军(1979-), 男, E-mail:xyajun78@163.com
通讯作者(责任作者): 孙兆彬(1985—), 男, 副研究员, 研究领域为城市重污染形成机制及大气污染对人体健康影响评估, 发表中英文学术论文40多篇. E-mail:zbsun@ium.cn

摘要: 近年来,京津冀地区采取了大量污染减排措施进行大气污染治理,如何客观评估减排效果是目前大气环境领域的研究难点.为准确评估大气污染过程的减排效果,本文利用北京地区常规气象资料、国控站PM2.5浓度资料,遴选了北京地区2018年3月11—14日和2013年3月14—17日两次空气污染过程,计算了大气容量系数、静稳指数,并利用KNN数据挖掘算法和WRF-Chem模式,对比分析了有无减排条件下的PM2.5日均浓度.结果表明:两次空气污染过程的天气形势和局地气象条件较相似,就大气热力和动力的垂直结构来看,2018年空气污染过程比2013年空气污染过程的大气稳定性更强、边界层高度更低、环境容量更小,但PM2.5峰值浓度却显著下降,平均浓度明显降低,PM2.5小时浓度的增长趋势相对平缓,重污染持续时间缩短.KNN数据挖掘算法减排评估结果显示,该方法能够较好地预测PM2.5日均浓度的变化趋势,2018年3月11—14日,在减排和不减排情景下PM2.5日均值分别为171和229 μg·m-3,减排使得污染过程PM2.5平均浓度下降了25.3%.数值模拟结果与KNN数据分析结论吻合,进一步验证了减排措施的有效性.综合看来,2018年空气污染过程中PM2.5浓度相比历史相似气象条件下的污染过程显著降低,这是长期大力度减排效果的体现.
关键词:北京相似环流KNN数据挖掘算法数值模拟减排评估
Air pollution reduction effect evaluation based on data mining algorithm and numerical simulation technology
XIONG Yajun1, XU Jing2, SUN Zhaobin2 , LI Ziming1, WU Jin1, YIN Xiaomei1, QIAO Lin1, ZHAO Xiujuan2
1. Environment Meteorology Forecast Center of Beijing-Tianjin-Hebei, Beijing 100089;
2. Institute of Urban Meteorology, China Meteorological Administration, Beijing 100089
Received 23 April 2018; received in revised from 22 June 2018; accepted 24 June 2018
Abstract: Air pollution reduction measures have been recently adopted in the Beijing-Tianjin-Hebei region. Objectively assessing atmospheric pollution reductions is difficult in the atmospheric environment field. This study used meteorological data, the PM2.5 concentration data in Beijing, and two air pollution processes (March 11—14, 2018 and March 14—17, 2013) in the Beijing area to calculate the atmospheric capacity coefficient and static stability index for assessing the effects of the air pollution reduction measures. Average daily PM2.5 concentrations were analyzed under an emission reduction condition by using the KNN data mining algorithm and WRF-Chem mode. The results showed that the weather conditions and local meteorological conditions were similar for the two air pollution processes from the perspective of atmospheric thermal and dynamic vertical structures. For the 2018 process, the atmosphere was more stable, the boundary layer height was lower, and the environmental capacity was smaller than that of the 2013 process. Peak and average PM2.5 concentrations dropped sharply and the PM2.5 hourly concentration grew relatively slowly. Moreover, the duration of heavy pollution was shortened. Evaluating emission reduction results based on the KNN data mining algorithm showed that this method can reliably predict the changing tendency of daily average PM2.5 concentrations. The average PM2.5 concentration during March 11—14, 2018 was 171 and 229 μg·m-3 under the emission reduction and nonemission reduction conditions, respectively. The PM2.5 concentration decreased by approximately 25.3% because of the emission reduction measures. Moreover, numerical simulation results were consistent with those from the KNN data analysis, which further verified the effectiveness of the emission reduction measures. In summary, the PM2.5 concentration for the 2018 pollution process was significantly lower than that in similar meteorological conditions in history, which is a reflection of the long-term, large-scale emission reduction efforts.
Keywords: Beijingsimilar circulationKNN data mining algorithmnumerical simulationemissions assessment
1 引言(Introduction)空气重污染不但影响城市运行, 也会影响居民健康(孙兆彬等, 2012;Tao et al., 2012;Sun et al., 2013).北京既是中国的政治和文化中心, 也是高速发展的环首都经济圈中心, 因此, 北京地区的空气重污染事件往往受到社会各界的广泛关注.从1980年至今, 北京地区大气对污染物的容纳能力逐渐下降, 不利于污染扩散的气象条件出现的频率在增加(郭淳薇等, 2017), 且地形的背风侧具有“避风港”效应(徐祥德等, 2015), 在华北太行山、燕山沿山地区常形成地形辐合线(苏福庆, 2004a2004b刘树华等, 2009Miao et al., 2018), 伴随着大气层结长时间稳定, 沿山地区气团长期滞留(吴兑等, 2014), 配合垂直方向逆温, 近地层的小风、高湿的气象条件, 导致空气重污染事件频发(孙兆彬等, 2017Ge et al., 2018), 而PM2.5浓度受气象条件影响具有日变化、Rossby波尺度、准双周尺度等多时间尺度的周期变化(李梓铭等, 2017).在污染物传输阶段, 北京市PM2.5小时浓度往往在短时内呈爆发式增长, 地面辐合线、逆温等气象条件是造成PM2.5浓度爆发性增长及维持的重要原因(吴进等, 2017).研究表明, 污染源排放是空气重污染形成的根本原因, 不利气象条件是辅助条件, 在关键地区科学地进行大气污染过程前期和同期减排工作, 有利于空气污染程度(Zhai et al., 2016Wang et al., 2016王占山等, 2017)及居民健康风险(孙兆彬等, 2015)的降低.
2018年全国“两会”于3月在北京市召开, 因此, 北京地区3月的大气重污染事件受到社会各界的广泛关注.2018年3月11—14日, 北京地区出现了一次重污染天气.3月10日22:00北京发布空气重污染橙色预警, 此次污染过程期间, 京津冀及周边地区各城市均按照当地重污染天气应急预案, 及时启动相应级别应急响应, 实施区域应急联动.此次过程中, 虽然也出现了强逆温、静稳、高湿等极端不利的气象条件, 但北京市的PM2.5日均浓度并未达到严重污染级别, 而且没有出现PM2.5小时浓度爆发性增长现象.假如同等或相似气象条件发生在未执行减排限排措施时, 北京的污染程度与现在相比是否会存在明显差异?如能回答这一问题, 不仅对提高减排条件下环境气象预报准确率具有重要意义, 同时也能为相关部门提供决策依据.基于上述设想, 本研究从大气环流形势相似角度出发, 选择京津冀地区未执行任何减排措施的2013年作为备选年份, 并分析2013年PM2.5浓度达到重度污染级别的个例, 以自由大气的形势场相似、边界层内大气环流形势场相似、局地气象要素相似、海平面气压场相似、污染起始时间长度相似作为标准, 遴选2013年3月14—17日北京地区发生的一次重污染天气过程作为比照对象, 与本轮重污染天气过程开展对比分析, 并利用静稳指数、大气容量系数、KNN数据挖掘算法、空气质量模拟技术客观评估在未减排情境下本次空气污染过程PM2.5浓度可达到的数值, 并估算2018年减排措施对PM2.5浓度的削减比例.
2 数据与方法(Data and methods)2.1 气象和气溶胶数据气象数据为2013年3月14—17日和2018年3月11—14日Micaps资料及2013年全年和2018年3月11—14日北京观象台气温、露点、相对湿度、风速、能见度小时观测数据, PM2.5数据为相同时段国控站小时观测数据(http://106.37.208.228:8082/).
2.2 静稳指数、大气容量指数静稳天气与大气重污染的发生有紧密联系, 为定量描述大气的静稳程度, 国家气象中心研发了静稳天气综合指数.通过客观方法挑选出发生大气污染的气象要素及其阈值条件, 通过权重求和构建了静稳天气指数(SWI), 静稳天气指数和PM2.5浓度有较好的相关性, 并对静稳指数在北京地区进行了本地化改进, 能够在一定程度上指示大气污染扩散条件的变化(张恒德等, 20162017马学款等, 2017).建立静稳天气指数的具体方法有4步:①根据文献调研和预报经验挑选静稳天气相关气象因子;②确定各气象因子的阈值, 如果因子落在阈值范围内则表示该因子支持静稳天气的形成;③根据各因子在不同阈值范围内对经稳天气形成作用的大小分配权重, 作用越大给予越高的权重;④对所有落在阈值范围内的因子权重求和, 得到静稳天气指数(SWI), 具体见式(1).本研究涉及的静稳天气指数的气象要素、阈值及权重见表 1.
表 1(Table 1)
表 1 计算静稳天气指数的气象要素、阈值及权重 Table 1 Meteorological fcator, threhold value and weight for SWI
表 1 计算静稳天气指数的气象要素、阈值及权重 Table 1 Meteorological fcator, threhold value and weight for SWI
因子(i) 阈值 权重(W)
地表 24 h变温 <3 ℃ 2
海平面气压 1010~1030 hPa 1
24 h变压 <3 hPa 1
2 m相对湿度 40%~60% 1
2 m相对湿度 60%~70% 2
2 m相对湿度 70%~80% 3
2 m相对湿度 80%~90% 4
2 m相对湿度 >90% 5
850 hPa散度绝对值 <2×10-5 s-1 1
10 m水平风速 3~4 m·s-1 1
10 m水平风速 2~3 m·s-1 3
10 m水平风速 <2 m·s-1 4
850 hPa垂直速度 <0.2 hPa·s-1 2
混合层高度 800~1500 m 1
混合层高度 300~800 m 2
混合层高度 <300 m 4
逆温层 850~925、925~1000和850~1000 hPa 3层中只要存在一层逆温 3


(1)
式中, n为静稳天气相关的气象因子个数, Wi为各因子在不同阈值范围内给予的权重.
大气容量系数是表征大气对污染物容纳能力的重要指标, 计算方法依据GB/T3840—91算法(徐大海等, 1993a; 1993b;2016), 具体公式如下:
(2)
(3)
式中, A为大气容量系数;VE为通风量(m2·s);H代表混合层厚度(m);z代表混合层内距离地面的高度(m);u表示混合层内z高度上的风速(m·s-1);Wr代表清洗比;R代表降水量(mm·d-1);S代表单位面积(km2).
2.3 KNN数据挖掘算法KNN(K-nearest neighbor)是Cover和Hart(1967)提出的一种非参数化监督算法, 也是经典数据挖掘技术之一, 其在统计学领域通常译作“K近邻算法”.KNN是一种通过计算对象间不同特征值距离来进行分类的非参数估计技术, 也是近年来发展较快的一种实用数据挖掘技术.该算法的优点是精度高、对异常值不敏感、不需要数据输入假定, 其缺点是计算复杂、内存空间开销较大, 但随着计算机硬件技术的不断发展, 这些缺点变得越来越容易解决.
具体步骤如下:假设有一组历史天气个例样本集合定义为S, 其中, Si个天气样本组成, 而每个天气样本由m个属性变量及1个标志量构成.其数学表示式为:
(4)
本文的属性变量Xij分别代表观象台日均相对湿度、日均风速、日均能见度、日均变温、日均变压及国控站日均PM2.5浓度这6个要素, 最后一个要素Li称为标志量(label).利用KNN算法进行PM2.5日均浓度预测, 可以描述为如下数学模型:假设预报日均相对湿度、日均风速、日均能见度、日均变温、日均变压及国控站日均PM2.5浓度6个要素的集合为Yi={y1, y2, …, ym}, 称为预测样本;预测时, 首先在训练样本集S集合中找到与预测样本Yi最相似的K个近邻(经测算, K=16时准确率最高);然后找出这K个标志量集合L={L1, L2, …, Lk};最后, 按照投票多数原则, 选取最多的标志量Li作为预测样本Yi预测结果.本文的K近邻采用欧氏距离法进行判定.因此, 从本质上说, KNN算法是一种相似算法, 并在前期研究工作中取得了较好的效果, 对于有霾或者无霾的预报准确率高达91.8%(熊亚军等, 2015).本研究使用2013年一年中11个月(除3月外)观象台日均气象要素及国控站PM2.5浓度数据作为训练测试数据, 使用2013年3月数据验证模型的准确性, 在确定基于KNN算法构建的大数据预报模型对PM2.5日均浓度的预报能力后, 利用未减排情景下的预报模型对2018年3月PM2.5日均浓度进行预报, 对比分析未减排情景条件下的预报结果与真实减排下的预报结果, 评估2018年3月大气污染物的减排效果.
2.4 空气质量模拟空气质量模拟选用区域化学传输模式WRF-Chem, 该模式采用气象模式(WRF)和大气化学模式(Chem)在线耦合方式同步计算物理、化学过程, 可有效减少离线计算由于时间、空间差值带来的误差, 同时实现气象-化学反馈效应的研究.此外, 就研究真实大气而言, 模式考虑了较为详尽的物理、化学过程, 已被广泛应用于区域污染成因及改善效果研究中(徐敬等, 2015赵秀娟等, 2016).本研究模拟选用的主要物理、化学过程方案设置参见文献(赵秀娟等, 2016).
模式气象场输入采用北京市气象局基于WRF模式和WRFDA三维变分同化模块构建的中尺度气象数值预报系统的模拟结果, 该系统同化了大量常规气象资料、GPS水汽、飞机观测及天气雷达资料等, 准确的气象场输入显著提高了区域化学模式的模拟能力(赵秀娟等, 2016).
模式输入的初始排放源来自清华大学创建的MEIC排放清单(Hong et al., 2017), 该清单的代表年份为2012年, 水平分辨率为0.1°×0.1°, 初始清单反映了未减排情况下污染源的排放状况;以初始清单为基础, 依据“重污染天气应急预案”创建了减排清单, 该清单反映了减排情况下接近污染源“真值”的排放状况.
2.5 交叉检验交叉验证(Cross validation)主要用于防止模型过于复杂而引起的过拟合, 有时亦称循环估计, 是一种统计学上将数据样本切割成较小子集的实用方法.具体操作时可以先在一个子集上做分析, 而其它子集则用于后续对此分析的确认及验证, 一开始的子集被称为训练集, 而其它子集则被称为验证集或测试集.交叉验证是一种评估统计分析、机器学习算法对独立于训练数据的数据集的泛化能力方法.
3 结果(Results)3.1 大气污染气象条件分析3.1.1 大气环流条件分析为了分析方便, 本文将2013年3月14—17日空气污染过程称为2013年过程, 将2018年3月11—14日空气污染过程称为2018年过程.图 1图 2分别为两次重污染过程的大气环流形势, 由图可知, 2013年过程京津冀地区500 hPa高空维持西北偏西气流, 地面由高压后部逐渐转入低压弱辐合区控制, 气压值最低为997 hPa.2018年过程的500 hPa高空也以西北气流为主, 地面由高压后部逐渐转入低压弱辐合区中, 气压值最低为1002 hPa, 京津冀及山东西部地区均受相同的低压辐合区影响.可见, 两次空气污染过程的地面和高空环流形势基本相似, 高空受偏西气流影响, 地面受辐合区控制.
图 1(Fig. 1)
图 1 两次重污染天气过程的500 hPa高度场 (a.2013年3月17日8:00, b. 2018年3月13日8:00) Fig. 1The 500 hPa height field for two heavy pollution processes (a.8:00 on 17 March 2013, b. 8:00 on 13 March 2018)


图 2(Fig. 2)
图 2 两次重污染天气过程的海平面气压场 (a.2013年3月17日8:00, b. 2018年3月13日8:00) Fig. 2The sea level pressure field for two heavy pollution processes (a.8:00 on 17 March 2013, b.8:00 on 13 March 2018)

3.1.2 大气温度垂直结构图 3给出了两次重污染天气过程大气温度垂直结构演变.由图 3可知, 2013年过程中第1天(3月14日)早晨无辐射逆温, 2018年过程第1天(3月11日)早晨已经形成了双层逆温, 两层逆温分别位于850 hPa和1000 hPa高度, 说明2018年过程大气稳定层结的建立要早于2013年过程;2013年过程在第1天(3月14日)夜间才形成双层逆温, 而2018年过程在第1天(3月11日)夜里850 hPa大气逆温强度进一步增大, 大气层结的稳定性进一步增强;继续分析两个过程后两天的平均逆温强度, 均会发现2018年过程逆温强度强于2013年过程.2013年过程最强逆温出现在3月15日, 逆温强度为5 ℃;2018年过程的最强逆温出现在3月12日, 逆温强度高达12 ℃.总体从逆温强度、逆温垂直结构、逆温维持时间来看, 2018年过程的大气污染垂直扩散条件较2013年过程更为不利.
图 3(Fig. 3)
图 3 两次重污染天气过程的探空曲线演变 (a.2013年3月14—17日垂直逆温, b.2018年3月11—14日垂直逆温) Fig. 3The evolution of the sounding curve during two heavy pollution weather processes (a.vertical inversion on March 14—17, 2013, b.vertical inversion on March 11—14, 2018)

3.1.3 地面气象条件由图 4可知, 2013年过程期间, 北京大部分时段风速较小, 其中, 小于3级(3.4 m·s-1)时次占总时次的92.6%, 小于2级(1.6 m·s-1)时次占总时次的44.2%;相对湿度有显著日变化特征, 白天最小相对湿度在40%左右, 夜间最大相对湿度在80%以上, 平均相对湿度为60%.2018年过程期间, 风速小于3级(3.4 m·s-1)时次占总时次的97.8%, 小于2级(1.6 m·s-1)时次占总时次的6.5%;相对湿度亦呈现显著日变化特征, 白天最小相对湿度为30%~40%, 夜间最大相对湿度在90%以上, 平均相对湿度为55%.总体看来, 两次重污染天气过程均呈现出近地面水平风速小、湿度大、空气饱和程度高的特征, 气象条件特征基本一致.
图 4(Fig. 4)
图 4 两次重污染天气过程的逐时风速、露点、相对湿度 (a.2013年过程, b.2018年过程) Fig. 4Wind speed, dew point and relative humidity during two heavy pollution processes (a.2013 process, b. 2018 process)

3.2 表征大气污染扩散条件的综合指数静稳指数、边界层高度和大气环境容量系数是衡量大气扩散条件的3个综合性指标, 静稳指数越高、边界层高度越低、环境容量系数越小, 代表大气扩散条件越差;反之, 代表扩散条件越好.表 2给出了两次重污染天气过程的综合指数.由表 2可知, 2018年过程的静稳指数平均值为17, 2013年过程的静稳指数平均值为13, 2018年过程的静稳程度更强.2018年过程的平均边界层高度为690 m, 明显低于2013年过程的896 m.2018年过程环境容量系数为0.49, 2013年过程为0.86.总之, 从综合指数的表现来看, 2018年过程较2013年过程的气象条件更不利于污染物扩散.上述现象的发生主要是强逆温所致, 2018年过程中, 北京地区中层回暖显著, 850 hPa(约距地面1500 m高度)温度明显偏高, 导致北京地区强逆温层的发展, 严重抑制了大气污染物的垂直扩散能力.与2013年过程相比, 2018年过程的大气稳定性更强、边界层高度更低、环境容量更小, 气象条件更不利于污染物扩散.
表 2(Table 2)
表 2 2018和2013年两次重污染天气过程的综合指数 Table 2 Comprehensive index of the two heavy pollution processes in 2018 and 2013
表 2 2018和2013年两次重污染天气过程的综合指数 Table 2 Comprehensive index of the two heavy pollution processes in 2018 and 2013
日期(年-月-日) 静稳指数 边界高度/m 环境容量系数 日期(年-月-日) 静稳指数 边界高度/m 环境容量系数
2018-03-11 15 781 0.51 2013-03-14 13 1200 1.30
2018-03-12 19 594 0.51 2013-03-15 15 1002 0.76
2018-03-13 17 702 0.29 2013-03-16 12 757 0.60
2018-03-14 18 684 0.65 2013-03-17 13 624 0.83
平均值 17 690 0.49 平均值 13 896 0.86


3.3 两次空气污染过程的PM2.5浓度对比气象条件对比分析表明, 2018年过程较2013年过程更不利于污染物的扩散.由此推测, 空气污染物排放量不变的情况下, 2018年过程的污染程度可能比2013年过程更重.
选取环保局国控站农展馆(朝阳)作为代表, 对两次重污染过程PM2.5小时浓度变化趋势进行分析(图 5), 结果发现存在如下4个主要特征:①2018年过程的PM2.5峰值浓度较2013年过程显著下降.2013年过程朝阳农展馆站PM2.5峰值浓度出现在3月17日23:00, 浓度值高达515 μg·m-3;2018年过程朝阳农展馆站PM2.5峰值浓度出现3月14日3:00, 为384 μg·m-3;2018年过程的PM2.5峰值浓度较2013年过程降低131 μg·m-3, 下降幅度为25.4%.②2018年过程的PM2.5平均浓度较2013年过程明显降低.2013年过程的PM2.5平均浓度为213.7 μg·m-3, 2018年过程的PM2.5平均浓度为173.9 μg·m-3, 2018年过程的平均浓度较2013年过程降低39.8 μg·m-3, 下降幅度为18.6%.③2018年过程的重污染持续时间较2013年过程大幅缩短.2018年过程轻度以上污染(PM2.5小时浓度≥75 μg·m-3)持续时间为82 h, 较2013年过程减少9.9%;重度以上污染(PM2.5小时浓度≥150 μg·m-3)持续时间为61 h, 较2013年过程减少16.4%.④2018年过程的PM2.5浓度增长趋势较2013年平缓, 未出现爆发性增长现象, 2013年过程出现了PM2.5爆发性增长现象.2013年3月17日20:00的PM2.5小时浓度仅为371 μg·m-3, 23:00飙升到515 μg·m-3, 3 h内增加了144 μg·m-3.2018年3月13日20:00的PM2.5小时浓度为297 μg·m-3, 14日3:00上升到384 μg·m-3, 7 h内增加了87 μg·m-3, 增长幅度小于2013年过程, 爆发性增长不显著.
图 5(Fig. 5)
图 5 两次重污染天气过程的朝阳农展馆的PM2.5小时浓度变化(横线代表平均浓度) Fig. 5PM2.5 hourly concentrations in Chaoyang Agricultural Pavilion during two heavy pollution events

3.4 KNN算法交叉检验本文选择常用的k折交叉验证(k-fold cross Validation)方法, 结合本文研究对象的实际情况, 将2013年12个月分别作为一个子集, 即k=12.每次将其中一个子集作为测试集, 剩下的k-1个子集作为训练集进行训练, 得到的结果的平均相关系数和RMSE分别为0.78和46.8 μg·m-3, 说明KNN数据挖掘算法对不同月份PM2.5浓度的预测具有较好的稳定性.
表 3(Table 3)
表 3 2013年KNN算法交叉检验结果 Table 3 Cross-check results of KNN algorithm in 2013
表 3 2013年KNN算法交叉检验结果 Table 3 Cross-check results of KNN algorithm in 2013
月份
(测试子集)
相关系数 RMSE/
(μg·m-3)
1 0.69 104.1
2 0.82 40.4
3 0.87 49.6
4 0.87 21.3
5 0.72 30.4
6 0.71 43.5
7 0.68 53.1
8 0.82 52.2
9 0.73 63.3
10 0.79 46.0
11 0.89 28.4
12 0.88 30.1
平均 0.87 49.6


本文利用KNN数据挖掘算法、大气静稳指数、大气容量系数及空气质量模拟技术定量评估了2013年和2018年两次空气污染过程及减排效果.利用KNN数据挖掘算法对2013年3月PM2.5浓度进行预报, 预报结果总体低于实际观测, 尤其是在PM2.5日均浓度超过100 μg·m-3的低估条件下, 低估得更为明显.这主要与KNN数据挖掘算法本身的计算特性有关, KNN数据挖掘算法本质上是寻找历史数据库中与未来所要发生情景下局地气象要素最为相似的多个样本, 对多个个例依据与未来情景相似程度进行排序, 并依据排序结果客观地赋予不同样本不同的权重, 最后对这些不同权重下的历史样本求取平均值得到预报结果.多样本计算的优势类似于数值天气预报中的集合预报方法, 通过初始值扰动或多模式集合, 提高预报的准确度, 最大程度地降低单一结果带来的较大误差.但KNN算法也会带来不确定性, 多样本结果虽降低了单一结果的不确定性, 但另一面也降低了对极端事件的预报能力.本研究中则体现为虽能较好地预报出重污染过程, 但对PM2.5高污染日极端污染程度的预报能力不足.此外, 对KNN算法进行训练的历史数据库更多的由气象信息组成, 虽能在一定程度上间接包含历史上非均相反应等复杂的大气化学过程信息, 但仍不完备, 这可能是KNN算法对高PM2.5浓度日预报偏小的另一个原因.最后, KNN算法本身也需要进一步完善, 包括历史数据库中应建立大气水平和垂直结构三维空间相似和过程累积时间相似的信息, 尝试将大气化学过程以某种简洁的方式进行综合考虑, 此外, 还要深刻研究极端污染条件下PM2.5浓度预报不确定的问题.
基于KNN算法的减排效果评估结果显示, 2018年3月11—14日在减排和不减排情景下PM2.5日均值分别为171和229 μg·m-3.计算得出减排使污染物浓度下降了58 μg·m-3, KNN算法的均方根误差(RMSE)为45 μg·m-3.一般来讲, KNN算法容易使空气污染过程中PM2.5浓度预报结果偏低, 即便以最极端的情况考虑, 减排使污染物浓度下降了58 μg·m-3中有45 μg·m-3(RMSE)为预报的偏差, 那么仍然有13 μg·m-3为减排的贡献.KNN数据挖掘算法有其固有的优点和劣势, 我们将在后期的工作中不断完善数据算法, 提高其对空气污染减排过程的评估和预报能力.
3.5 减排效果评估3.5.1 基于KNN算法的减排效果评估采用2013年全年日均相对湿度、日均风速、日均能见度、日均变温、日均变压、国控12站PM2.5浓度监测数据作为KNN算法的训练数据, 利用2013年3月的PM2.5日均浓度作为预报对象, 用其检验KNN算法的预报效果.由图 6可知, 2013年3月PM2.5国控12站日均预报浓度与真实监测浓度有较好的相关性, 相关系数达到0.86, 并通过显著性检验, 均方根误差(RMSE)为45 μg·m-3, 说明KNN方法能较好地预报日均PM2.5浓度.
图 6(Fig. 6)
图 6 2013年3月国控站PM2.5日均预报浓度和监测浓度 Fig. 6The daily average predicted concentration and monitored concentration of PM2.5 at the state control station in March 2013

图 7所示为2018年3月国控站PM2.5日均预报浓度(未减排情景)和监测浓度(减排情景).PM2.5日均预报浓度为使用KNN算法的预报浓度, 即在2013年未减排情景下, 寻找与2018年3月每日气象条件最相似的2013年的16个样本, 并对找到的样本依据气象件相似程度给出不同的权重系数, 相似程度越高, 此样本权重系数越大, 以此计算每日的PM2.5日均浓度.而监测浓度则为2018年3月政府采取的真实减排措施情景下国控站监测到的PM2.5日均浓度.
图 7(Fig. 7)
图 7 2018年3月国控站PM2.5日均预报浓度(未减排情景)和监测浓度(减排情景) Fig. 7National control station daily PM2.5 forecast concentration in March 2018 (no reduction scenario) and monitoring concentration (emission reduction scenario)

图 7可知, 2018年3月减排情景和未减排情景下PM2.5日均浓度变化趋势较一致, 两者的相关系数为0.72, 通过了显著性检验.两情景下PM2.5日均件是影响北京地区PM2.5浓度的重要因素, 但大部分空气污染过程中, 减排情景下的PM2.5日均浓度低于未减排情景, 在减排和未减排情景下, 2018年3月的PM2.5平均浓度分别为90和112 μg·m-3.就具体空气污染过程来看, 2018年3月11—14日, 在减排和未减排情景下PM2.5日均值分别为171和229 μg·m-3, 可见2018年3月11—14日空气重污染过程是长期大力减排政策下一次减排效果的具体体现.上述分析表明, 在相似的气象条件下, 由于减排因素影响, 本轮重污染天气过程的PM2.5峰值浓度显著下降, 平均浓度明显降低, 重污染持续时间缩短.
3.5.2 基于数值模式的减排效果评估利用WRF-Chem模式, 分别采用未减排的初始清单(方案1)和实施减排后的减排清单(方案2), 对2018年污染过程进行数值模拟对比试验.结果表明(表 4), 就整个过程而言, 方案1模拟的北京地区PM2.5平均浓度为211 μg·m-3, 方案2模拟的北京地区PM2.5平均浓度为180 μg·m-3, 即减排措施使北京地区本次污染过程PM2.5浓度下降了31 μg·m-3, 下降比例为14.6%.
表 4(Table 4)
表 4 不同试验方案的模拟结果 Table 4 Simulation results of different test schemes
表 4 不同试验方案的模拟结果 Table 4 Simulation results of different test schemes
方案 排放源 PM2.5平均浓度/(μg·m-3)
方案1 未减排初始清单 211
方案2 减排清单 180


实施减排后京津冀区域PM2.5浓度整体呈下降趋势, 但下降比例空间分布不均.图 8给出了具体的PM2.5浓度下降比例的空间分布, 由图可知, 京津冀中南部的大部分地区下降比例在5%~20%之间, 河北中部至北京南部的狭窄带状区域内下降比例在20%以上, 河北西北部局地下降比例超过40%, 其余地区的下降比例低于2%.
图 8(Fig. 8)
图 8 地面PM2.5过程平均浓度(a)及浓度下降比例(b)空间分布 Fig. 8The average concentration of ground PM2.5 (a) and its decreasing proportion (b) distributed in space

4 结论(Conclusions)1) 北京地区2013年3月和2018年3月的两次重污染天气过程发生在相似的环流形势和近地层气象要素的背景下, 但边界层垂直结构有所差异, 与2013年过程相比, 2018年过程的气象条件更不利于污染物扩散, 主要表现在逆温强度更大、大气稳定性更强、边界层高度更低、环境容量更小.
2) 基于KNN数据挖掘算法的结果表明, 减排情景下, 2018年过程的污染程度相对较轻, 主要表现在PM2.5日均峰值浓度显著下降, 平均浓度明显降低, 重污染持续时间大幅缩短, PM2.5浓度无爆发性增长, 且增长趋势较为平缓, 减排和不减排情景下PM2.5日均值分别为171和229 μg·m-3, 即减排措施使北京地区本轮污染过程PM2.5浓度下降了58 μg·m-3, 下降比例为25.3%.
3) WRF-Chem数值模式排放源对比试验模拟结果显示, 减排与不减排情景下北京地区PM2.5平均浓度分别为180和211 μg·m-3, 即减排措施使北京地区本轮污染过程PM2.5浓度下降了31 μg·m-3, 下降比例为14.7%.

参考文献
Cover T M, Hart P E. 1967. Nearest neighbor pattern classification[J]. IEEE Transactions on Information Theory, 13(1): 21–27.DOI:10.1109/TIT.1967.1053964
Ge B, Wang Z, Lin W, et al. 2018. Air pollution over the North China Plain and its implication of regional transport: A new sight from the observed evidences[J]. International Journal of Molecular Sciences, 18(10): 29–38.
郭淳薇, 孙兆彬, 李梓铭, 等. 2017. 北京地区近35年大气污染扩散条件变化[J]. 环境科学, 2017, 38(6): 2202–2210.
Hong C, Zhang Q, He K, et al. 2017. Variations of china's emission estimates: response to uncertainties in energy statistics[J]. Atmospheric Chemistry & Physics, 17(2): 1–23.
李梓铭, 孙兆彬, 邵勰, 等. 2017. 北京城区PM2.5不同时间尺度周期性研究[J]. 中国环境科学, 2017, 37(2): 407–415.
刘树华, 刘振鑫, 李炬, 等. 2009. 京津冀地区大气局地环流耦合效应的数值模拟[J]. 中国科学, 2009, 39(1): 88–98.
马学款, 张碧辉, 桂海林, 等. 2017. APEC前后北京几次静稳天气边界层特征对比分析[J]. 气象, 2017, 43(11): 1364–1373.
Miao Y, Guo J, Liu S, et al. 2018. Impacts of synoptic condition and planetary boundary layer structure on the trans-boundary aerosol transport from Beijing-Tianjin-Hebei region to northeast China[J]. Atmospheric Environment, 181: 1–11.DOI:10.1016/j.atmosenv.2018.03.005
苏福庆, 任阵海, 高庆先, 等. 2004a. 北京及华北平原边界层大气中污染物的汇聚系统——边界层输送汇[J]. 环境科学研究, 2004a, 17(1): 21–25.
苏福庆, 高庆先, 张志刚, 等. 2004b. 北京边界层外来污染物输送通道[J]. 环境科学研究, 2004b, 17(1): 26–29.
孙兆彬, 安兴琴, 陶燕, 等. 2012. 基于GIS和大气数值模拟技术评估兰州市PM10的人群暴露水平[J]. 中国环境科学, 2012, 32(10): 1753–1757.DOI:10.3969/j.issn.1000-6923.2012.10.004
孙兆彬, 李梓铭, 廖晓农, 等. 2017. 北京大气热力和动力结构对污染物输送和扩散条件的影响[J]. 中国环境科学, 2017, 37(5): 1693–1705.DOI:10.3969/j.issn.1000-6923.2017.05.012
孙兆彬, 陶燕, 崔甍甍, 等. 2015. 北京地区奥运会期间PM2.5对心脑血管疾病的影响[J]. 中国环境科学, 2015, 35(11): 3481–3488.DOI:10.3969/j.issn.1000-6923.2015.11.037
Sun Z, An X, Tao Y, et al. 2013. Assessment of population exposure to PM10 for respiratory disease in Lanzhou (China) and its health-related economic costs based on GIS[J]. Bmc Public Health, 13(1): 1–9.
王占山, 李云婷, 张大伟, 等. 2017. 2015年"九三阅兵"期间北京市空气质量分析[J]. 中国环境科学, 2017, 37(5): 1628–1636.DOI:10.3969/j.issn.1000-6923.2017.05.004
Wang Z, Li Y, Chen T, et al. 2016. Science-policy interplay: Improvement of air quality from 2008 to 2014 in Beijing and the scientific approach to achieve APEC Blue[J]. Bulletin of the American Meteorological Society, 97(4): 553–559.DOI:10.1175/BAMS-D-15-00095.1
吴兑, 廖碧婷, 吴蒙, 等. 2014. 环首都圈霾和雾的长期变化特征与典型个例的近地层输送条件[J]. 环境科学学报, 2014, 34(1): 1–11.
吴进, 李琛, 孙兆彬, 等. 2017. 北京地区两次重污染过程中PM2.5浓度爆发性增长及维持的气象条件[J]. 干旱气象, 2017, 35(5): 830–838.
熊亚军, 廖晓农, 李梓铭, 等. 2015. KNN数据挖掘算法在北京地区霾等级预报中的应用[J]. 气象, 2015, 41(1): 98–104.
徐大海, 王郁, 朱蓉. 2016. 大气环境容量系数A值频率曲线拟合及其应用[J]. 中国环境科学, 2016, 36(10): 2913–2922.DOI:10.3969/j.issn.1000-6923.2016.10.006
徐大海, 朱蓉. 1993. 国家标准GB/T3840-91中城市大气污染物总量控制A-P值法的应用[J]. 城市环境与城市生态, 1993, 6(2): 36–41.
徐大海, 李宗恺. 1993. 城市大气污染物排放总量控制中多源模拟法与国家准GB/T3840-91中A-P值方法的关系[J]. 气象科学, 1993, 13(2): 146–156.
徐敬, 马志强, 赵秀娟, 等. 2015. 边界层方案对华北低层O3垂直分布模拟的影响[J]. 应用气象学报, 2015, 26(5): 567–577.
徐祥德, 王寅钧, 赵天良, 等. 2015. 中国大地形东侧霾空间分布"避风港"效应及其"气候调节"影响下的年代际变异[J]. 科学通报, 2015(12): 1132–1143.
Yan T, An X, Sun Z, et al. 2012. Association between dust weather and number of admissions for patients with respiratory diseases in spring in Lanzhou[J]. Science of the Total Environment, 423(8): 8–11.
张恒德, 张碧辉, 吕梦瑶, 等. 2017. 北京地区静稳天气综合指数的初步构建及其在环境气象中的应用[J]. 气象, 2017, 43(8): 998–1004.
张恒德, 吕梦瑶, 张碧辉, 等. 2016. 2014年2月下旬京津冀持续重污染过程的静稳天气及传输条件分析[J]. 环境科学学报, 2016, 36(12): 4340–4351.
赵秀娟, 徐敬, 张自银, 等. 2016. 北京区域环境气象数值预报系统及PM2.5预报检验[J]. 应用气象学报, 2016, 27(2): 160–172.
Zhai S, An X, Zhao T, et al. 2016. Detecting critical PM2.5 emission sources and their contributions to a heavy haze episode in Beijing, China by using an adjoint model[J]. Atmospheric Chemistry & Physics, 16: 1–20.




相关话题/过程 污染 大气 气象 数据