删除或更新信息,请邮件至freekaoyan#163.com(#换成@)

污水处理出水BOD区间预测建模

本站小编 哈尔滨工业大学/2019-10-24

污水处理出水BOD区间预测建模

柴伟1,2,3,纪镐南1,2,3

(1.北京工业大学 信息学部自动化学院,北京 100124;2.计算智能与智能系统北京市重点实验室(北京工业大学), 北京 100124;3.数字社区教育部工程研究中心(北京工业大学),北京 100124)



摘要:

生化需氧量(BOD)是评价水质的重要指标,也是污水处理过程中直接控制的参数.为了提高污水处理质量,需要寻找BOD的有效测量方法.本文给出一种新的BOD软测量方法,可以实现其保证估计.采用主元分析方法选取BOD预测的主要辅助变量.利用径向基函数神经网络的逼近能力,将其用于污水处理出水BOD软测量建模.径向基函数神经网络的中心被确定之后,考虑到建模误差有界,使用参数线性集员辨识算法得到网络输出权值的集合描述.在污水处理系统运行过程中,所建立好的软测量模型可以预测出水BOD的上下界.此外,建立多个软测量模型,并将多模型测量结果进行融合以降低单一模型所给结果的保守性.实验结果表明本文方法的有效性.

关键词:  软测量  污水处理  径向基函数神经网络  集员辨识  区间预测

DOI:10.11918/j.issn.0367-6234.201701033

分类号:TP273

文献标识码:A

基金项目:北京市自然科学基金(4144067)



Interval predictor models for effluent BOD of wastewater treatment

CHAI Wei1,2,3,JI Haonan1,2,3

(1.Faculty of Information Technology, School of Automation, Beijing University of Technology, Beijing 100124, China; 2.Beijing Key Laboratory of Computational Intelligence and Intelligent Systems (Beijing University of Technology), Beijing 100124, China; 3.Engineering Research Center of Digital Community (Beijing University of Technology), Ministry of Education, Beijing 100124, China)

Abstract:

Biochemical oxygen demand (BOD) is an important index for evaluating water quality, and a variable directly controlled in the wastewater treatment process. To improve the performance of wastewater treatment, it is necessary to find out an effective method for measuring BOD. This paper presents a new soft measurement which can provide guaranteed estimation of the effluent BOD. The principal component analysis is utilized to select the secondary variables for the soft sensor. In virtue of its simple topological structure and universal approximation ability, the radial basic function neural network (RBFNN) is utilized in the soft sensor modeling. Considering the bounded modeling error, linear-in-parameters set membership identification algorithm is used to obtain a description of the uncertain set of the output weights after the determination of centers of the RBFNN. The RBFNN model with uncertain output weights can predict the upper and lower bounds of the effluent BOD during the wastewater treatment. Besides, a bundle of soft sensors is constructed and the intersection of the results given by the soft sensors is used to lower the conservatism by using a single sensor. Experiment results show the satisfying performance of the proposed method.

Key words:  soft measurement  wastewater treatment  radial basic function neural network  set membership identification  interval prediction


柴伟, 纪镐南. 污水处理出水BOD区间预测建模[J]. 哈尔滨工业大学学报, 2018, 50(2): 71-76. DOI: 10.11918/j.issn.0367-6234.201701033.
CHAI Wei, JI Haonan. Interval predictor models for effluent BOD of wastewater treatment[J]. Journal of Harbin Institute of Technology, 2018, 50(2): 71-76. DOI: 10.11918/j.issn.0367-6234.201701033.
基金项目 北京市自然科学基金(4144067) 作者简介 柴伟(1981—),男,讲师,硕士生导师 通信作者 柴伟,chaiwei@bjut.edu.cn 文章历史 收稿日期: 2017-01-10



Contents            -->Abstract            Full text            Figures/Tables            PDF


污水处理出水BOD区间预测建模
柴伟1,2,3, 纪镐南1,2,3    
1. 北京工业大学 信息学部自动化学院,北京 100124;
2. 计算智能与智能系统北京市重点实验室(北京工业大学),北京 100124;
3. 数字社区教育部工程研究中心(北京工业大学),北京 100124

收稿日期: 2017-01-10
基金项目: 北京市自然科学基金(4144067)
作者简介: 柴伟(1981—),男,讲师,硕士生导师
通信作者: 柴伟,chaiwei@bjut.edu.cn


摘要: 生化需氧量(BOD)是评价水质的重要指标,也是污水处理过程中直接控制的参数.为了提高污水处理质量,需要寻找BOD的有效测量方法.本文给出一种新的BOD软测量方法,可以实现其保证估计.采用主元分析方法选取BOD预测的主要辅助变量.利用径向基函数神经网络的逼近能力,将其用于污水处理出水BOD软测量建模.径向基函数神经网络的中心被确定之后,考虑到建模误差有界,使用参数线性集员辨识算法得到网络输出权值的集合描述.在污水处理系统运行过程中,所建立好的软测量模型可以预测出水BOD的上下界.此外,建立多个软测量模型,并将多模型测量结果进行融合以降低单一模型所给结果的保守性.实验结果表明本文方法的有效性.
关键词: 软测量    污水处理    径向基函数神经网络    集员辨识    区间预测    
Interval predictor models for effluent BOD of wastewater treatment
CHAI Wei1,2,3, JI Haonan1,2,3    
1. Faculty of Information Technology, School of Automation, Beijing University of Technology, Beijing 100124, China;
2. Beijing Key Laboratory of Computational Intelligence and Intelligent Systems (Beijing University of Technology), Beijing 100124, China;
3. Engineering Research Center of Digital Community (Beijing University of Technology), Ministry of Education, Beijing 100124, China


Abstract: Biochemical oxygen demand (BOD) is an important index for evaluating water quality, and a variable directly controlled in the wastewater treatment process. To improve the performance of wastewater treatment, it is necessary to find out an effective method for measuring BOD. This paper presents a new soft measurement which can provide guaranteed estimation of the effluent BOD. The principal component analysis is utilized to select the secondary variables for the soft sensor. In virtue of its simple topological structure and universal approximation ability, the radial basic function neural network (RBFNN) is utilized in the soft sensor modeling. Considering the bounded modeling error, linear-in-parameters set membership identification algorithm is used to obtain a description of the uncertain set of the output weights after the determination of centers of the RBFNN. The RBFNN model with uncertain output weights can predict the upper and lower bounds of the effluent BOD during the wastewater treatment. Besides, a bundle of soft sensors is constructed and the intersection of the results given by the soft sensors is used to lower the conservatism by using a single sensor. Experiment results show the satisfying performance of the proposed method.
Key words: soft measurement    wastewater treatment    radial basic function neural network    set membership identification    interval prediction    
随着中国水环境问题的日益突出,污水处理作为保护环境的重要措施,受到全社会越来越多的关注.生化需氧量(BOD)反映污水中生物可降解有机物含量.是评价水质的重要指标,也是污水处理过程中直接控制的参数,能否对BOD进行实时监测已成为提高治污质量的关键.由于仪器水平或成本方面的原因,目前,污水处理厂多采用离线人工化验的方法:BOD5离线分析测定周期为5 d,检测存在滞后,直接影响污水处理过程的实时控制和优化操作.实现BOD的高品质在线实时监测是个难题.软测量技术具有成本低、时效性好和准确度高等优点,被引入到污水处理过程中,为出水BOD高品质实时监测提供一个有效途径[1].

污水处理过程具有机理复杂、强非线性和高度不确定性等特点,因而基于生化反应机理建立软测量模型的传统方法效果欠佳.而神经网络凭借其优良的逼近能力被广泛应用于污水处理出水BOD软测量建模中.祁国强等[2]提出基于径向基函数(RBF)神经网络的软测量方法,运用大量实测数据对RBF神经网络进行训练和仿真,通过实验证明基于RBF神经网络的软测量模型的有效性.Huang等[3]建立基于粒子群的改进最小二乘支持向量机回归模型,实现出水BOD、化学需氧量(COD)、总氮(TN)、氨氮(NH4-N)、总固体悬浮物(TSS)等浓度的预测,取得较精确的结果.王树东等[4]提出基于混合递阶遗传算法优化RBF神经网络的BOD软测量方法,并通过实验证明此方法具有较好的实时性、稳定性和较高的预测精度.许玉格等[5]提出一种基于快速相关向量机(Fast-RVM)的在线软测量回归模型来实时预测出水BOD,并对比支持向量机和相关向量机在离线和在线情况下的预测效果,通过实验证明基于Fast-RVM的在线软测量回归模型能取得更好的预测效果.Qiao等[6]将COD、固体悬浮物(SS)、pH、溶解氧(DO)作为输入变量,利用改进的T-S模糊神经网络模型实现出水BOD的预测,取得较好的结果.当前工作多是获得一个单一值预测出水BOD浓度,而未曾给出评估真实值和预测值之间偏差(即预测误差)的有效方法.即使已采用均方根误差(RMSE)来评估神经网络建模精度,但通过此指标不易直接导出各时刻预测误差的计算公式.目前,围绕污水处理区间预测模型开展研究的工作尚不多见[7-8].

系统辨识理论中的区间预测方法有很多[9-16],基本上可以分为两大类.一类方法基于随机误差假设,如最小二乘法或极大似然法,要求误差的统计特性已知或部分已知,然后通过概率论给出被估计量的置信区间[9-10].另一类方法基于有界误差假设,如集员辨识,只要求误差有界而不需要知道其统计特性,然后通过集理论给出被估计量的置信区间[11-16].文献[7-8]提出的污水处理软测量方法即属于第一类.而在实际应用中误差的统计特性可能难以获得,此时第一类方法给出的置信区间不一定可靠.为此,给出一种新的BOD软测量方法,可以实现其保证估计.利用径向基函数神经网络的逼近能力,将其用于污水处理出水BOD软测量建模.径向基函数神经网络的中心被确定之后,考虑到建模误差有界,使用参数线性集员辨识算法得到网络输出权值的集合描述.在污水处理系统运行过程中,所建立好的软测量模型可以预测出水BOD的上下界.此外,本文建立多个软测量模型,并将多模型测量结果进行融合以降低单一模型所给结果的保守性.

1 BOD软测量模型 1.1 软测量模型整体结构神经网络软测量模型的一般设计步骤为:辅助变量的初选、现场(原始)数据采集、数据预处理、软测量模型搭建.辅助变量的初选是在可测变量集中初步选择与被估计变量有关的原始辅助变量,这些变量中部分可能是相关变量.数据预处理利用现场的历史数据作统计分析计算,将原始辅助变量化成少数几个互不相关的变量作为神经网络模型的输入.这里现场数据指某污水处理厂记录的历史数据及实际运行数据.本文设计污水处理出水BOD软测量模型整体结构如图 1所示.

Figure 1
图 1 BOD软测量模型整体结构 Figure 1 Structure of the soft sensor for BOD


1.2 数据预处理数据预处理主要是去除冗余信息,选取BOD预测的主要辅助变量.由于取自污水处理现场的参数不是全部有助于出水水质参数BOD的预测,在预测前首先需要确定选择哪些变量作为软测量模型的输入.筛选辅助变量的主要目的是:简化神经网络模型的输入,提高网络的预测精度与计算效率.主元分析(PCA)是最常见的方法[17],该方法通过正交变换将一组可能存在相关性的变量转换为一组线性不相关的变量,转换后的这组变量叫主成分.限于篇幅和突出重点,PCA的具体计算公式参考文献[17].

1.3 RBF神经网络模型RBF神经网络因为其简单的拓扑结构和强大的逼近能力,在软测量建模中得到广泛的应用.RBF神经网络是典型的三层前馈网络,包括输入层、非线性隐含层和线性输出层,可以表示为

$y = \sum\limits_{i = 1}^p {{w_i}{g_i}\left( {x, \sigma, {c_i}} \right).} $ (1)

式中:yRxRQ分别为网络的输出和输入,在软测量模型中分别代表出水BOD和辅助变量,Q表示辅助变量的个数;gi(x, σ, ci)为神经网络第i个隐含层节点的输出,ciRQσR分别为中心和宽度;wiR为线性输出权值; p为隐含层节点个数.RBF神经网络的隐单元基函数

${g_i}\left( {x, \sigma, {c_i}} \right) = \exp \left( {-\frac{{{{\left\| {x-{c_i}} \right\|}^2}}}{{{\sigma ^2}}}} \right), $ (2)

式中$\left\| \cdot \right\| $表示欧式范数.从式(1)可以看出,RBF神经网络从隐含层到输出层是线性传递.

将降维后的数据分成两部分.一份用于神经网络模型建立,表示为D1={xk, yk}k=1N;另一份用于模型预测,表示为D2={xk, yk}k=N+1L.软测量模型建立好后,预测出水BOD的过程可以表示为

${\hat y_k} = \sum\limits_{i = 1}^p {{{\hat w}_i}{g_i}\left( {{x_k}, \sigma, {c_i}} \right)}, N + 1 \le k \le L.$ (3)

式中:${\hat y_k} \in {\bf{R}} $为神经网络的预测输出,${\hat w_i} \in {\bf{R}} $为神经网络输出权值的估计.

如果采用集员辨识算法估计RBF神经网络输出权值wi,则可以预测出水BOD的上下界.

2 BOD置信区间计算 2.1 置信区间的基本计算采用聚类算法[18]确定RBF神经网络的中心ci和宽度σ.此算法的优点在于不需要知道数据集的任何先验知识,一旦神经网络隐含层中心和宽度被确定,就可以得到关于输出权值wi的线性方程

${y_k} = \mathit{\boldsymbol{\phi}} _k^{\rm{T}}\mathit{\boldsymbol{\theta }} + {e_k} = \sum\limits_{i = 1}^p {{w_i}{g_i}\left( {{x_k}, \sigma, {c_i}} \right)} + {e_k}.$ (4)

式中

${\mathit{\boldsymbol{\phi}} _k} = {\left[{{g_1}\left( {{x_k}, \sigma, {c_1}} \right), {g_2}\left( {{x_k}, \sigma, {c_2}} \right), \cdots, {g_p}\left( {{x_k}, \sigma, {c_p}} \right)} \right]^{\rm{T}}}, $ (5)

$\boldsymbol{\theta} = {\left[{{w_1}, {w_2}, \cdots, {w_p}} \right]^{\rm{T}}}.$ (6)

ek包含RBF神经网络中心、宽度和输出权值的选择带来的建模误差,而建模误差是与神经网络逼近能力有关的有界量,则可认为ek为有界误差,即|ek|≤ε.

集员辨识是一种有效的可以替代随机参数估计(如最小二乘和极大似然估计)的方法,因为其在应用时只需要知道误差的上下界.这里采用集员辨识方法估计神经网络的输出权值.一方面是因为这里的估计问题符合集员辨识的应用条件,另一方面以集员辨识的估计结果为基础可以给出BOD的置信区间.

由样本数据D1={xk, yk}k=1N、误差的有界假设|ek|≤ε以及式(4)可以得到

${S_k} = \left\{ {\theta \in {{\bf{R}}^p}:\left| {{y_k}-\mathit{\boldsymbol{\phi}} _k^{\rm{T}}\mathit{\boldsymbol{\theta }}} \right| \le \varepsilon } \right\}, k = 1, 2, \cdots, N.$ (7)

NSk的交集可得到一个凸多面体ΘN?Rp,即${\mathit{\Theta} _N} = \bigcap\nolimits_{k = 1}^N {{S_k}} $.这里ΘN称为权值向量θ的不确定集.权值不确定性θΘN使模型输出为区间$\left[{\hat y_k^{\rm{m}}, \hat y_k^{\rm{M}}} \right] $kN+1.式中

$\hat y_k^{\rm{m}} = \mathop {\min }\limits_{\theta \in {\mathit{\Theta} _N}} \mathit{\boldsymbol{\phi}} _k^{\rm{T}}\mathit{\boldsymbol{\theta }}, \hat y_k^{\rm{M}} = \mathop {\max }\limits_{\mathit{\boldsymbol{\theta }} \in {\mathit{\Theta} _N}} \phi _k^{\rm{T}}\mathit{\boldsymbol{\theta }}.$ (8)

这个区间表示出神经网络模型输出${\hat y_k} $的不确定性,即${\hat y_k} \in \left[{\hat y_k^{\rm{m}}, \hat y_k^{\rm{M}}} \right] $kN+1.此区间称为神经网络输出的置信区间.根据θΘN、式(4)和误差有界假设|ek|≤ε,可得到出水BOD的置信区间

${y_k} \in \left[{\hat y_k^{\rm{m}}-\varepsilon, \hat y_k^{\rm{M}} + \varepsilon } \right], k \ge N + 1.$ (9)

出水BOD的置信区间式(8)和(9)可通过线性规划的方法得到,但是当隐含层节点数太多和/或样本数据量很大时,该方法计算成本过重.为了降低计算成本,采用集员辨识中的椭球外界算法给出一个包含权值不确定性集ΘN的椭球

${E_N} = \left\{ {\theta \in {{\bf{R}}^p}:{{\left( {\theta-{{\hat \theta }_N}} \right)}^{\rm{T}}}\mathit{\boldsymbol{P}}_N^{-1}\left( {\theta-{{\hat \theta }_N}} \right) \le 1} \right\}.$ (10)

式中:${\hat \theta _N} \in {{\bf{R}}^p} $为椭球EN的中心,PNRp×p是一个表征椭球形状和大小的正定矩阵.椭球EN的计算过程如下[19-20].

算法1

初始化.置${\hat \theta _0} = 0, {\mathit{\boldsymbol{P}}_0} = {\delta ^{-1}}\mathit{\boldsymbol{I}}$I为单位阵,δ取小的正数,如10-5.

递推:对k=1, 2, …, N.

步骤1(a) ?计算

${\beta _k} = \boldsymbol{\phi} _k^{\rm{T}}{P_{k-1}}{\boldsymbol{\phi} _k}, $ (11)

${v_k} = {y_k}-\boldsymbol{\phi} _k^{\rm{T}}{\mathit{\boldsymbol{\hat \theta }}_{k-1}}.$ (12)

步骤1(b) ?如果$\varepsilon \ge \sqrt {{\beta _k}} + \left| {{v_k}} \right| $,置${\hat \theta _k} = {\hat \theta _{k-1}} $Pk=Pk-1,转步骤3.

步骤1(c) ?如果$p\left( {\varepsilon + {v_k}} \right) < \sqrt {{\beta _k}} < \varepsilon-{v_k} $,则由式(13)和(14)计算ε′和vk的值,并由式(15)求得qk,将ε′和vk的值分别赋给εvk之后,转步骤2.

$\varepsilon ' = \frac{{{v_k} + \varepsilon + \sqrt {{\beta _k}} }}{2}, $ (13)

${v'_k} = \frac{{{v_k} + \varepsilon-\sqrt {{\beta _k}} }}{2}, $ (14)

${q_k} = \left\{ \begin{array}{l}\frac{{\varepsilon '\left( {\sqrt {{\beta _k}}-p\left( {\varepsilon + {v_k}} \right)} \right)}}{{\left( {p-1} \right){\beta _k}}}, 当\sqrt {{\beta _k}} > p\left( {\varepsilon + {v_k}} \right);\\\;\;\;\;\;\;\;\;\;\;\;\;0, \;\;\;\;\;\;\;\;\;\;\;\;\;\;\;\;\;\;\;\;其他.\end{array} \right.$ (15)

如果$\sqrt {{\beta _k}} < \varepsilon-{v_k} $$ \sqrt {{\beta _k}} \le p\left( {\varepsilon + {v_k}} \right)$,则置${\hat \theta _k} = {\hat \theta _{k-1}} $Pk=Pk-1,转步骤3.

步骤1(d) ?如果$p\left( {\varepsilon-{v_k}} \right) < \sqrt {{\beta _k}} < \varepsilon + {v_k} $,则由式(16)和(17)计算ε′和vk的值,并由式(18)求得qk,将ε′和vk的值分别赋给εvk之后,转步骤2.

$\varepsilon ' = \frac{{-{v_k} + \varepsilon + \sqrt {{\beta _k}} }}{2}, $ (16)

${v'_k} = \frac{{{v_k}-\varepsilon + \sqrt {{\beta _k}} }}{2}, $ (17)

${q_k} = \left\{ {\begin{array}{*{20}{l}}{\frac{{\varepsilon '\left( {\sqrt {{\beta _k}}-p\left( {\varepsilon - {v_k}} \right)} \right)}}{{\left( {p-1} \right){\beta _k}}}, 当\sqrt {{\beta _k}} > p\left( {\varepsilon - {v_k}} \right);}\\{\;\;\;\;\;\;\;\;\;\;\;\;0, \;\;\;\;\;\;\;\;\;\;\;\;\;\;\;\;\;\;\;\;\;\;其他.}\end{array}} \right.$ (18)

如果$\sqrt {{\beta _k}} < \varepsilon + {v_k} $$\sqrt {{\beta _k}} \le p\left( {\varepsilon-{v_k}} \right) $,则置${\hat \theta _k} = {\hat \theta _{k-1}}, $Pk=Pk-1,转步骤3.

步骤1(e) ?如果βkp(ε2vk2),则置${\hat \theta _k} = {\hat \theta _{k-1}}, $Pk=Pk-1,转步骤3.否则,解方程(19),求其正实根qk,转步骤2.

$\begin{array}{l}\left( {p-1} \right)\beta _k^2q_k^2 + \left( {\left( {2p-1} \right){\varepsilon ^2}-{\beta _k} + v_k^2} \right){\beta _k}{q_k} + \\\;\;\;\;\;\;\;\;\;\;\;\;\;{\varepsilon ^2}\left( {p\left( {{\varepsilon ^2} - v_k^2} \right) - {\beta _k}} \right) = 0.\end{array}$ (19)

步骤2 ?将qk代入式(20)~(22)中,计算${\hat \theta _k} $Pk.

${P_k} = \left( {1 + {q_k}-\frac{{{q_k}v_k^2}}{{{\varepsilon ^2} + {q_k}{\beta _k}}}} \right){P'_{k-1}}, $ (20)

${\hat \theta _k} = {\hat \theta _{k-1}} + \frac{{{q_k}{v_k}}}{{{\varepsilon ^2} + {q_k}{\beta _k}}}{P_{k-1}}{\phi _k}, $ (21)

式中

${P'_{k-1}} = {P_{k-1}}-\frac{{{q_k}}}{{{\varepsilon ^2} + {q_k}{\beta _k}}}{P_{k - 1}}{\boldsymbol{\phi} _k}\boldsymbol{\phi} _k^{\rm{T}}{P_{k - 1}}.$ (22)

步骤3 ?如果k < N,则k增1并返回步骤1.

由于有ΘN?EN,所以得$\left[{\hat y_k^{\rm{m}}, \hat y_k^{\rm{M}}} \right] \subseteq \left[{\bar {\hat {y}}_k^{\rm{m}}, \bar {\hat y}_k^{\rm{M}}} \right] $.式中

${\bar {\hat y}}_k^{\rm{m}} = \mathop {\min }\limits_{\theta \in {E_N}} \boldsymbol{\phi} _k^{\rm{T}}\mathit{\boldsymbol{\theta }}, \bar {\hat y}_k^{\rm{M}} = \mathop {\max }\limits_{\theta \in {E_N}} \boldsymbol{\phi} _k^{\rm{T}}\mathit{\boldsymbol{\theta }}.$ (23)

可以推导出

$\bar {\hat y}_k^{\rm{m}} = \boldsymbol{\phi} _k^{\rm{T}}{{\mathit{\boldsymbol{\hat \theta }}}_N}-\sqrt {\boldsymbol{\phi} _k^{\rm{T}}{P_N}{\boldsymbol{\phi} _k}}, $ (24)

$\bar {\hat y}_k^{\rm{M}} = \boldsymbol{\phi} _k^{\rm{T}}{{\mathit{\boldsymbol{\hat \theta }}}_N} + \sqrt {\boldsymbol{\phi} _k^{\rm{T}}{P_N}{\boldsymbol{\phi} _k}} .$ (25)

替换式(9),出水BOD的置信区间可以表示为

${y_k} \in \left[{{\bar {\hat y}}_k^{\rm{m}}-\varepsilon, \bar {\hat y}_k^{\rm{M}} + \varepsilon } \right], k \ge N + 1.$ (26)

2.2 置信区间的保守性降低借鉴集员估计文献[21]的思想,设计多个BOD神经网络软测量模型(对于这些神经网络模型,隐含层节点个数、中心、宽度以及建模误差界设不同值),并将多模型测量结果进行融合以降低单一模型所给结果的保守性.设软测量模型个数为M,第i个软测量模型的输出为置信区间I(i).可以得到关于实际出水BOD yk的如下关系式

${y_k} \in I_k^{\left( i \right)}, i = 1, \cdots, M.$ (27)

因而有${y_k} \in \bigcap\nolimits_{i = 1}^M {I_k^{\left( i \right)}} $,并且有

$\forall i, \;\;\bigcap\nolimits_{i = 1}^M {I_k^{\left( i \right)}} \subseteq I_k^{\left( i \right)}.$ (28)

即将各模型输出的交集作为最终结果,并且最终结果比任意单一模型的输出具有更低的保守性.该方法如图 2所示.另外,有

Figure 2
图 2 置信区间的保守性降低方案 Figure 2 Scheme for reducing the conservatism of the confidence interval


$\forall \Sigma \subseteq \left\{ {1, 2, \cdots, M} \right\}, \bigcap\nolimits_{i = 1}^M {I_k^{\left( i \right)}} \subseteq \bigcap\nolimits_{i \in \Sigma } {I_k^{\left( i \right)}} .$ (29)

由上式可以看出:子模型个数越多,所得结果的保守性越低.因此,在时间允许的前提下,可建立更多的模型以进一步降低保守性.

3 BOD置信区间的使用所计算出的置信区间描述了出水BOD真实值yk的存在范围,即yk∈[ykm, ykM].式中:ykMykm分别表示置信区间的上下界.通过此置信区间可给出一个点估计[22]

$y_k^{\rm{e}} = \arg, \mathop {\min }\limits_{y \in {\bf{R}}} \mathop {\max }\limits_{{y_k} \in \left[{y_k^{\rm{m}}, y_k^{\rm{M}}} \right]} \left| {{y_k} -y} \right| = \left( {y_k^{\rm{M}} + y_k^{\rm{m}}} \right)/2.$ (30)

可以作为BOD真实值yk的一个预测.而且,不难推导出|ykyke|≤(ykMykm)/2.即BOD真实值yk与预测值yke之间的偏差小于置信区间的半径.因此,置信区间的保守性越低,预测误差的最大值就越小.可以看出,通过出水BOD置信区间不仅可给出BOD真实值的一个预测, 还可以评估预测误差.现有工作多是获得一个BOD预测值,而未曾给出评估各时刻预测误差的有效方法.关于水质参数BOD是否达标或满足运行调控要求,直接使用预测值而不参考预测误差(预测精度没有保证)可能会导致错误的分析和判断.

4 实验实验数据共200组,即L=200,来源于北京市某污水处理厂.使用PCA方法选取辅助变量.在累计方差贡献率大于90%的前提下,出水BOD软测量模型的辅助变量选取为COD、SS、pH和DO.将降维后的数据分成两部分,一份用于神经网络模型建立,共150组,即N=150;另一份用于模型预测,共50组.

实验建立3个软测量模型,然后将各模型输出的交集作为最终结果.在神经网络建模之前,先对数据进行归一化处理,即式(4)中的xkyk都是归一化后的数据.试凑隐节点数使建模误差界尽可能小.对于模型1,神经网络隐节点数p、宽度σ以及建模误差界ε分别为50、0.9和0.477 5;对于模型2,3个参数分别为55、1和0.442 5;对于模型3,3个参数分别为60、0.7和0.395 3.在权值估计过程中,集员辨识重复处理所有数据200次以进一步降低椭球描述的保守性.

图 3~5分别为已建立好的模型1~3给出的出水BOD置信区间.图 6是模型1、2以及3所给结果的交集.图中实线为测量值yk,虚线和点线分别为反归一化后的区间上下界ykMykm.可以看出,出水BOD实测值完全落入3个模型所给出的置信区间中,以及其进一步完全落入3个模型所给结果的交集中,并且融合后的结果比单一结果保守性更低.不难看出,在时间允许的前提下,可建立更多的模型以进一步降低保守性.第3节已指出,置信区间的保守性越低,预测误差的最大值就越小,从而结果就越能反映真实值.

Figure 3
图 3 模型1给出的出水BOD置信区间 Figure 3 Confidence interval of the effluent BOD given by Model 1


Figure 4
图 4 模型2给出的出水BOD置信区间 Figure 4 Confidence interval of the effluent BOD given by Model 2


Figure 5
图 5 模型3给出的出水BOD置信区间 Figure 5 Confidence interval of the effluent BOD given by Model 3


Figure 6
图 6 3个模型给出结果的交集 Figure 6 Intersection of the results given by the three models


此外,本实验还与传统的神经网络软测量建模方法进行对比.该方法采用最小二乘法确定RBF神经网络输出权值,并且试凑中心和宽度使建模误差尽可能小.神经网络隐节点数p和宽度σ分别为60和0.7.针对归一化后的数据,最终RSME为0.227 5.置信区间计算公式见文献[16].图 7给出该方法的结果.图中实线为测量值yk,点划线为单点估计yke,虚线和点线分别为反归一化后的区间上下界ykMykm.可以看出,点估计不能保证预测效果始终可靠,尽管建模误差已被降低,比如在时刻165出现较大预测误差.并且,该方法基于随机误差假设计算置信区间,而这里误差的统计特性难以获得,因而所计算出的置信区间并不理想,其保守性大于本文方法所得结果.

Figure 7
图 7 采用最小二乘法所建模型给出的结果 Figure 7 Results given by the model built by the least squares


5 结语污水处理过程要求实时监测出水水质指标,以防止超标造成环境污染.本文给出一种新的软测量方法,可以计算出水BOD的置信区间,从而实现水质指标的可靠监测.该方法通过PCA选取辅助变量;采用RBF神经网络建立软测量模型;使用参数线性集员辨识算法给出网络输出权值的不确定集合描述.此外,本文借鉴集员估计文献[21]的思想,设计多个BOD神经网络软测量模型,并将多模型测量结果进行融合以降低单一模型所给结果的保守性.


参考文献
[1]HAIMI H, MULAS M, CORONA F, et al. Data-derived soft-sensors for biological wastewater treatment plants: An overview[J].Environmental Modelling & Software, 2013, 47: 88-107.DOI: 10.1016/j.envsoft.2013.05.009


[2]祁国强, 刘载文, 崔莉凤. 基于RBF人工神经网络的生活污水处理软测量方法[J].北京工商大学学报(自然科学版), 2004, 22(3): 36-38.
QI Guoqiang, LIU Zaiwen, CUI Lifeng. The soft measuring method based on RBF neural network for municipal wastewater treatment[J].Journal of Beijing Technology and Business University (Natural Science Edition), 2004, 22(3): 36-38.DOI: 10.3969/j.issn.1671-1513.2004.03.010


[3] HUANG Zhiqing, LUO Jianxu, LI Xiongjun, et al. Prediction of effluent parameters of wastewater treatment plant based on improved least square support vector machine with PSO[C]//Proceedings of the 1st International Conference on Information Science and Engineering. Piscataway, NJ: IEEE Press, 2009: 4058-4061. DOI: 10.1109/ICISE.2009.846.


[4]王树东, 葛珉昊, 陈明明. 基于混合递阶遗传算法优化RBF神经网络的BOD5软测量方法[J].给水排水, 2014, 40(3): 149-153.
WANG Shudong, GE Minhao, CHEN Mingming. Soft measuring method for BOD5 based on RBF neural network optimized by hybrid hierarchy genetic algorithm[J].Water Supply and Drainage, 2014, 40(3): 149-153.DOI: 10.3969/j.issn.1002-8471.2014.03.036


[5]许玉格, 刘莉, 曹涛. 基于Fast-RVM的在线软测量预测模型[J].化工学报, 2015, 66(11): 4540-4545.
XU Yuge, LIU Li, CAO Tao. On-line soft measuring model based on Fast-RVM[J].CIESC Jorunal, 2015, 66(11): 4540-4545.DOI: 10.11949/j.issn.0438-1157.20150566


[6]QIAO Junfei, LI Wei, HAN Honggui. Soft computing of biochemical oxygen demand using an improved T-S fuzzy neural network[J].Chinese Journal of Chemical Engineering, 2014, 22(11/12): 1254-1259.DOI: 10.1016/j.cjche.2014.09.023


[7]LIU Yiqi, HUANG Daoping, LI Yan. Development of interval soft sensors using enhanced just-in-time learning and inductive confidence predictor[J].Industrial and Engineering Chemistry, 2012, 51(8): 3356-3367.DOI: 10.1021/ie201053j


[8]?KRJANCI. Confidence interval of fuzzy models: An example using a waste-water treatment plant[J].Chemometrics and Intelligent Laboratory Systems, 2009, 96(2): 182-187.DOI: 10.1016/j.chemolab.2009.01.009


[9]LJUNG L. System identification-theory for the user[M]. 2nd ed. Englewood-Cliffs, NJ: Prentice-Hall, 1999.


[10]NINNESS B, GOODWIN G. Estimation of model quality[J].Automatica, 1995, 31(12): 1771-1797.DOI: 10.1016/0005-1098(95)00108-7


[11]MRUGALSKI M, WITCZAK M, KORBICZ J. Confidence estimation of the multi-layer perceptron and its application in fault detection systems[J].Engineering Applications of Artificial Intelligence, 2008, 21(6): 895-906.DOI: 10.1016/j.engappai.2007.09.008


[12]FáBREGA A J S, CARO J M B, HERRERA P J A, et al. Data-driven bounded-error fault detection[J].International Journal of Adaptive Control and Signal Processing, 2014, 28(12): 1299-1324.DOI: 10.1002/acs.2443


[13]FáBREGA A J S, CARO J M B, HERRERA P J A, et al. Fault detection method based on bounded error and dynamic threshold techniques[J].International Journal of Adaptive Control and Signal Processing, 2016, 30(2): 256-270.DOI: 10.1002/acs.2558


[14]柴伟, 孙先仿. 一种非线性系统集员辨识算法[J].北京航空航天大学学报, 2005, 31(11): 1237-1241.
CHAI Wei, SUN Xianfang. Set membership identification algorithm of nonlinear systems[J].Journal of Beijing University of Aeronautics and Astronautics, 2005, 31(11): 1237-1241.DOI: 10.3969/j.issn.1001-5965.2005.11.018


[15]CHAI Wei, QIAO Junfei. Non-linear system identification and fault detection method using RBF neural networks with set membership estimation[J].International Journal of Modelling, Identification and Control, 2013, 20(2): 114-120.DOI: 10.1504/IJMIC.2013.056183


[16]CHAI Wei, QIAO Junfei. Passive robust fault detection using RBF neural modeling based on set membership identification[J].Engineering Applications of Artificial Intelligence, 2014, 28: 1-12.DOI: 10.1016/j.engappai.2013.10.005


[17]杨斌, 田永青, 朱仲英. 智能建模方法中的数据预处理[J].信息与控制, 2002, 31(4): 380-384.
YANG Bin, TIAN Yongqing, ZHU Zhongying. Data pretreatment in intelligent modeling methods[J].Information and Control, 2002, 31(4): 380-384.DOI: 10.3969/j.issn.1002-0411.2002.04.019


[18]BEZDEK J C. Pattern recognition with fuzzy objective function algorithms[M]. New York: Plenum Press, 1981.


[19]FOGEL E, HUANG Y F. On the value of information in system identification-bounded noise case[J].Automatica, 1982, 18(2): 229-238.DOI: 10.1016/0005-1098(82)90110-8


[20] BELFORTE G, BONA B. An improved parameter identification algorithm for signals with unknown but bounded errors[C]//Proceedings of the 7th IFAC/IFORS Symposium on Identification and System Parameter Estimation. Oxford: Pergamon Press, 1985: 1507-1511.


[21]MOISAN M, BERNARD O, GOUZE J L. Near optimal interval observers bundle for uncertain bioreactors[J].Automatica, 2009, 45(1): 291-295.DOI: 10.1016/j.automatica.2008.07.006


[22]MILANESE M, VICINO A. Optimal estimation theory for dynamic systems with set membership uncertainty: An overview[J].Automatica, 1991, 27(6): 997-1009.DOI: 10.1016/0005-1098(91)90134-N



相关话题/测量 北京工业大学 北京 系统 智能

  • 领限时大额优惠券,享本站正版考研考试资料!
    大额优惠券
    优惠券领取后72小时内有效,10万种最新考研考试考证类电子打印资料任你选。涵盖全国500余所院校考研专业课、200多种职业资格考试、1100多种经典教材,产品类型包含电子书、题库、全套资料以及视频,无论您是考研复习、考证刷题,还是考前冲刺等,不同类型的产品可满足您学习上的不同需求。 ...
    本站小编 Free壹佰分学习网 2022-09-19
  • 液压轮毂马达辅助驱动系统控制策略实车验证
    液压轮毂马达辅助驱动系统控制策略实车验证曾小华,崔臣,张轩铭,宋大凤,李立鑫(汽车仿真与控制国家重点实验室(吉林大学),长春130025)摘要:为充分提升重型牵引车辆通过不良路面的能力,对国内某款重型牵引车在传统结构的基础上加装了前轴液压轮毂马达辅助驱动系统,并针对该混合动力系统,开发了工程化的控制 ...
    本站小编 哈尔滨工业大学 2020-12-05
  • 铁锰复合阴极MFC-EF耦合系统产电及降解RhB效能
    铁锰复合阴极MFC-EF耦合系统产电及降解RhB效能史珂1,2,赵庆良1,2,王维业2,王琨1,2(1.城市水资源与水环境国家重点实验室(哈尔滨工业大学),哈尔滨150090;2.哈尔滨工业大学环境学院,哈尔滨150090)摘要:为实现微生物燃料电池(MFC)微电的原位利用,结合电芬顿(EF)技术的 ...
    本站小编 哈尔滨工业大学 2020-12-05
  • 偏最小二乘法在系统故障诊断中的应用
    偏最小二乘法在系统故障诊断中的应用梁北辰,戴景民(哈尔滨工业大学仪器科学与工程学院,哈尔滨150001)摘要:为研究结合关键性能指标(KPI)的偏最小二乘法(PLS)在系统故障诊断中的作用和应用,通过活性污泥数学模型(BSM1),结合偏最小二乘算法,建立了可以模拟污水处理的仿真模型.通过收集系统在正 ...
    本站小编 哈尔滨工业大学 2020-12-05
  • 改进极限学习机的真空绝热板导热系数测量方法
    改进极限学习机的真空绝热板导热系数测量方法夏荣菲,陈宜飞,冯勇建䥺Symbol`@@(厦门大学航空航天学院,福建厦门361005)摘要:针对目前真空绝热板导热系数测量时间较长、成本昂贵等问题,提出一种埋入热流计快速测量真空绝热板(VIP)导热系数的方法.首先应用ANSYS仿真证明了测量原理的可行 ...
    本站小编 哈尔滨工业大学 2020-12-05
  • 椭圆轨道绳系卫星系统释放的类反步法控制
    椭圆轨道绳系卫星系统释放的类反步法控制仲小清1,金雪松2,王敏1,李晓磊3,孙光辉3(1.中国空间技术研究院通信卫星事业部,北京100094;2.中国航天科技集团宇航部,北京100048;3.哈尔滨工业大学航天学院,哈尔滨150001)摘要:为解决椭圆轨道上绳系卫星系统的稳定和快速释放问题,在传统反 ...
    本站小编 哈尔滨工业大学 2020-12-05
  • 船用极区格网惯性导航系统综合校正方法
    船用极区格网惯性导航系统综合校正方法方涛,黄卫权,王宗义(哈尔滨工程大学自动化学院,哈尔滨150001)摘要:为抑制适用于极区的船用格网惯性导航系统随时间积累的导航误差,提出一种基于格网坐标系的综合校正方法对陀螺常值漂移进行估计和补偿.该方法首先基于格网坐标系推导了P方程,该方程建立起位置误差、格网 ...
    本站小编 哈尔滨工业大学 2020-12-05
  • 星载固态存储系统自适应闪存转换层设计
    星载固态存储系统自适应闪存转换层设计张伟东1,2,董振兴1,朱岩1,安军社1(1.中国科学院复杂航天系统电子信息技术重点实验室(中国科学院国家空间科学中心),北京100190;2.中国科学院大学,北京100190)摘要:传统星载存储系统闪存转换层(FlashTranslationLayer,FTL) ...
    本站小编 哈尔滨工业大学 2020-12-05
  • 多种多翼吸引子共存的新型三维分数阶混沌系统
    多种多翼吸引子共存的新型三维分数阶混沌系统徐昌彪1,2,何颖辉1,吴霞2,莫运辉2(1.重庆邮电大学光电工程学院,重庆400065;2.重庆邮电大学通信与信息工程学院,重庆400065)摘要:自然界的物理现象大多以分数阶的形式存在,整数阶微分方程正好是分数阶微分方程的特例.与整数阶模型相比,分数阶模 ...
    本站小编 哈尔滨工业大学 2020-12-05
  • 航姿参考系统的改进杆臂效应补偿方法
    航姿参考系统的改进杆臂效应补偿方法谭强俊,程永生,唐彬,刘显学,周浩,李寅鑫(中国工程物理研究院电子工程研究所,四川绵阳621000)摘要:振动环境下叠加在航姿参考系统(AHRS)加速度计敏感轴上的杆臂效应会对加速度计测姿精度造成极大的影响.本文对杆臂效应处理算法中的低通滤波法和力学补偿法进行分析. ...
    本站小编 哈尔滨工业大学 2020-12-05
  • 一种四进制Duffing混沌数字通信系统
    一种四进制Duffing混沌数字通信系统李雅楠,付永庆(哈尔滨工程大学信息与通信工程学院,哈尔滨150001)摘要:为提高多进制混沌通信系统的性能,解决Duffing混沌系统受混沌同步技术限制的问题,本文设计了基于Duffing振子的四进制混沌数字通信系统.利用二进制Duffing混沌调制方法与正交 ...
    本站小编 哈尔滨工业大学 2020-12-05