基于数据特征的加热炉钢温预报模型

删除或更新信息，请邮件至freekaoyan#163.com(#换成@)

本站小编 Free考研考试/2020-03-23

杨英华, 石翔, 李鸿儒
东北大学?信息科学与工程学院, 辽宁沈阳 110819
收稿日期：2017-12-27
基金项目：国家重点研发计划项目(2017YFB0306405)。
作者简介：杨英华(1970-), 男, 辽宁辽阳人, 东北大学副教授;
李鸿儒(1968-), 男, 内蒙古赤峰人, 东北大学教授，博士生导师。

摘要：针对加热炉工业过程具有复杂、非线性、时滞性的特点和钢坯出炉温度预报问题, 提出了一种基于数据特征的改进主元回归(PCR)加热炉钢温预报模型的建立方法.首先通过对原始数据进行同步化处理来解决各数据变量间存在的时间滞后问题; 然后提取生产过程中各批次钢坯的统计特征和熵特征, 并依据一定顺序将这些特征排列组合, 构造等长的数据特征向量; 最后通过PCR方法建立过程变量的数据特征和钢坯出炉温度之间的回归预报模型.本文以某钢厂加热炉工业过程为背景进行实验仿真, 采用实际生产数据求取建模参数, 并对钢坯出炉温度预报进行了测试.实验的校验与误差分析表明, 该方法在预测钢坯出炉温度方面具有更好的性能, 且预测误差满足工业应用的精度要求.
关键词：数据特征主元回归加热炉钢温预报熵
Billet Temperature Predication Model of Reheating Furnace Based on Data Features
YANG Ying-hua, SHI Xiang, LI Hong-ru
School of Information Science & Engineering, Northeastern University, Shenyang 110819, China
Corresponding author: YANG Ying-hua, E-mail:yhyang@mail.neu.edu.cn
Abstract: Considering that the industrial process of reheating furnace is with the characteristics of complexity, non-linearity and time delay, and the prediction of billet temperature is difficult to achieve, an improved principal component regression(PCR)and prediction method based on data features is proposed in this paper. The time-delay among different variables is solved at first by synchronization of the original data. Then statistic and entropy features are extracted from each billet of reheating furnace and these data features consist of a data feature vector orderly. Lastly, the prediction model between billet outlet temperature and data features of process variable is established by PCR. The proposed method is applied in the reheating furnace of a real steel factory, and the model parameter is reckoned based on actual operational data. The experiment results and error analysis indicate that this model is able to predict the billet steel outlet temperature, and the prediction error can satisfy the demands of industrial application.
Key words: data featuresprincipal component regression(PCR)reheating furnaceprediction of billet temperatureentropy
加热炉作为钢铁工业过程中的重要设备, 经过加热炉加热后进入热轧机的钢坯加热情况对最终的钢材质量有直接影响.实际中也通常以出炉钢温作为钢坯加热过程效能的判断标准.因此, 为了保证钢坯质量并实现节能环保, 必须对其出口钢温进行准确控制.
由于检测技术的限制, 很难直接在炉内对钢坯温度进行测量.红外线技术只能测得钢坯出口表面温度, 黑箱实验方法会直接破坏钢坯结构.目前较为常用的方法是建立加热炉的钢温预报模型对出炉钢坯温度进行预测.在这一方面很多学者都做了大量研究, 并使用各种方法建立了钢温预报模型.文献[1-2]通过分析加热炉的生产工艺和机理, 推导并得出了钢坯温度的预报模型.由于加热炉的加热过程十分复杂, 而且该方法需要对传热过程设定许多假设条件, 因此该方法的模型求解过程较为复杂, 难以运用于实际的生产过程中.文献[3-4]采用基于数据驱动的方法, 寻找钢坯的出炉温度与生产过程中其他变量间的关系并建立回归预报模型.上述方法一般将加热炉生产过程视为连续的工业过程来进行研究, 采用人工神经网络和多元统计分析等方法建立回归模型, 最终实现钢温预报.但是在实际加热过程中, 对于钢坯而言, 在炉内所经历的加热过程对其最终出炉的温度影响极大, 不同种类钢坯的轧制节奏和在炉时间等生产状态有很大差异, 这与间歇过程的模式相契合, 因此将加热炉生产过程作为间歇的工业过程来分析研究更合适.目前针对间歇工业过程质量回归预测的方法主要有基于时段划分的算法^[5]和多向偏最小二乘(MPLS)方法^[6]等, 这些方法在应用时大多要求批次间数据长度相等.由于加热炉生产节奏处于变化状态, 采集到的各批次数据长度通常不相等, 因此需要进行数据的等长预处理后才能应用.常见的数据等长处理方法如指示变量法等在实际应用时很难达到预期效果, 常鹏^[7]通过AT展开方法和滑动窗技术解决了数据不等长问题, 同时也忽略了间歇过程数据原有的批次特性.另外, 加热炉工业过程变量具有采样数据多、非线性和非高斯分布等多种特性, 而且变量之间存在一定的时滞性, 这些都增加了回归建模时的复杂程度和计算量.
本文提出了一种基于数据特征的改进主元回归(principal component regression, PCR)钢温建模回归预报方法.首先对采集的数据进行信息同步的处理, 解决原始数据各变量之间存在的时间滞后问题, 然后进行数据特征提取, 得到特征向量后再通过主元回归方法建立钢坯出炉温度预测模型.本文的方法不仅延续了传统PCR方法模型的优点, 还在数据等长处理、变量的复杂特性处理、缩短建模周期及减小计算量方面都有了很好的性能改善.同时, 这种基于数据特征的方法可推广应用于其他工业过程的数据分析中.
1 加热炉背景介绍加热炉是轧钢过程中的主要设备^[8], 其主要用途是将钢坯加热至一定的温度, 以便轧机进一步轧制.本文将提出的基于数据特征的改进主元回归方法应用于国内某钢厂的步进式加热炉, 建立其钢坯出炉温度的回归预报模型.
1.1 加热炉工艺流程简介加热炉结构示意图如图 1所示, 钢坯加热分为预热段和3个燃烧段(加热一段、加热二段和均热段), 其中每个燃烧段又分为上层、下层两个区域.
图 1(Fig. 1)

图 1 加热炉结构示意图Fig.1 Structural schematic diagram of reheating furnace

加热炉的预热段没有安装烧嘴, 钢坯在通过预热段时充分利用了燃烧段的烟温来实现预热和升温; 在3个燃烧段的上下两层都装有烧嘴, 通过调整烧嘴燃气和空气的流量, 自动调节加热炉的炉温.
1.2 加热炉工业过程中的数据变量加热炉可采集的过程变量和质量变量如表 1所示, 其中过程变量可分为八组:x01~x06表示各燃烧段上下两层的燃气流量; x07~x12表示各燃烧段上下两层的空气流量; x13~x18表示各燃烧段上下两层的炉温; x19表示燃气压力; x20表示空气压力.质量变量只有1个, 即Y表示出炉钢坯的温度.
表 1(Table 1)

表 1 加热炉变量描述Table 1 Variables description

序号	过程变量名	变量描述
1, 3, 5	x01, x03, x05	3个燃烧段的上烧嘴燃气流量
2, 4, 6	x02, x04, x06	3个燃烧段的下烧嘴燃气流量
7, 9, 11	x07, x09, x11	3个燃烧段的上烧嘴空气流量
8, 10, 12	x08, x10, x12	3个燃烧段的下烧嘴空气流量
13, 15, 17	x13, x15, x17	3个燃烧段的上层炉温
14, 16, 18	x14, x16, x18	3个燃烧段的下层炉温
19	x19	加热炉燃气压力
20	x20	加热炉空气压力

序号	质量变量名	变量描述
1	Y	出炉钢坯温度

表 1 加热炉变量描述 Table 1 Variables description

由表 1可以看出, 加热炉工业过程的变量数量众多, 且加热炉复杂的机理特性和燃烧特性导致了变量间存在非线性和时滞性以及数据中包含非高斯分布的情况.
另一方面, 在实际生产中, 由于钢坯种类及生产节奏的不同, 烧钢时间也各不相同, 一般为3~6h, 而数据的采样间隔为10s, 因此加热炉间歇过程又具有数据量大和批次数据严重不等长的特性.如果仍采用传统的针对间歇过程的钢温预报方法, 常常不能达到预期的结果.本文对采集的过程变量的数据特征进行分析和提取, 处理变量间存在的复杂特性, 实现对钢坯出炉温度的准确预报.
2 基于数据特征的钢温预报主元回归模型主元回归是结合主元分析(principal component analysis, PCA)和多元自回归的一种统计学建模方法^[9].首先采用PCA方法对原始过程数据进行降维处理, 然后将处理后得到的的主元分量作为多元自回归的自变量进行回归分析^[10].
本文首先对原始数据变量间存在的时滞性进行同步处理, 接着计算加热炉各批次数据的统计量和熵值, 将其组合成的数据特征向量作为新的原始数据, 最后采用PCA方法建立回归模型.
2.1 基于TD-SDG模型的变量间时滞性同步处理现有的基于数据的生产过程分析方法中所采用的数据在时间上大多具有同步性, 即在一个生产批次中, 不同变量采样数据的时间坐标是一致的.然而从加热炉工艺流程角度看, 由于燃烧与传热的机理特性, 在煤气、空气流量和压力等参数发生变化后, 温度变量会延迟变化.因此温度变量的采样数据虽然在时间坐标上和煤气流量等变量一致, 但其包含的信息必然存在滞后性.本文采用基于时延符号的有向图(TD-SDG)模型^[11]对煤气流量、空气流量、压力和温度之间的滞后性进行分析计算, 而后通过数据校正实现同步性处理.由于压力和流量的变化具有一致性, 只需要计算流量变量与温度变量间的滞后延迟时间即可.
分别记煤气流量和温度为a=[a_i], b=[b_j], i, j=1, 2, …, n, n为序列长度.信息传递方向为a→b, 时间延迟互信息量为

(1)

其中:p(a_i, b_i+τ)是变量a和b的联合概率密度函数; τ是延迟时间.变量a到b信息传递的时延大小定义为使TDMI_ab(τ)首次出现极大值时的τ_ab^*.
通过分析计算出煤气流量变量和温度变量之间的滞后时间后, 再对原始数据进行变量的时滞同步校正，即序列a₁, a₂, …, a_n校正前与序列b₁, b₂, …, b_n对应, 同步校正后则与序列b_{1+τ_ab^*}, b_{2+τ_ab^*}, …, b_{n+τ_ab^*}对应.对空气流量、压力变量和温度间的时滞性处理方法同上.
2.2 构建数据特征向量特征是从数据中抽象提取出的、与判断某一事物的状态或属性有较强关联的、可被量化的指标.在统计学方面, 统计特征按一定顺序组成的随机模型可重新描述和衡量原始数据, 过程状态也将由过程变量的不同统计特征重新表示^[12].此外, 从热力学角度看, 熵是系统分子热运动无序的一种量度, 而钢坯的出炉温度则表征着钢坯在炉内所经历的全部生产过程与能量交换, 因此熵特征也是一种描述数据信息的重要量度^[13-14].
本文选取加热炉各批次数据的熵值作为该批次的熵特征; 选取每一批次数据中各过程变量的均值、偏度、峭度和任意两个过程变量之间的协方差作为原始数据的统计特征.将统计特征与熵特征按一定顺序排列构成加热炉的数据特征向量.
假定用X_p表示第p个批次的样本数据:

(2)

其中:m为过程变量个数; n为批次中采集的样本个数.
定义数据特征向量D_p由一阶统计量μ、二阶统计量Σ, 高阶统计量Ξ以及熵值H四部分构成:

(3)

一阶统计量μ=[μ₁, μ₂, …, μ_m](简记为[μ_i]_1×m), 由样本数据中每个过程变量的均值μ_i组成:

(4)

任意两个过程变量x_i, x_j之间的协方差为

(5)

用C_{i, j}表示cov(x_i, x_j), 将其按如下顺序排列组成二阶统计量

, 即

(6)

高阶统计量

考虑了每个批次样本数据的偏度s_i和峭度k_i, 分别为

(7)

(8)

每个批次的熵特征是该批次数据的热力学熵值, 根据文献[13]所述, 热力学熵可由信息熵推导.因此, 本文选用信息熵中的Renyi熵进行熵特征H的计算, Renyi熵的计算过程见文献[14].
通过计算加热炉各批次数据的上述数据特征, 加热炉的过程状态可由如下1×v维(v=(m²+7m)/2+1)的数据特征向量重新描述:

(9)

由此可见, 经过数据特征提取, 加热炉生产过程各批次数据得到的数据特征向量D_p是等长的.同时, 通过特征提取, 变量间的非线性和非高斯性也得到了有效地处理.本文将处理后的等长数据特征向量作为加热炉新的原始数据, 对其进行主元分析, 建立回归预报模型.
2.3 主元分析假设选取w个钢坯批次作为建立模型的数据, 得到一个新的由数据特征向量构成的w×v的数据特征矩阵D=[D_ij]_w×v=[D₁^T, D₂^T, …, D_p^T, …, D_w^T]^T, 其中D的每一列对应一个统计量, 每一行对应一个批次.主元分析具体过程如下:
首先, 为消除各数据特征量纲的影响, 对D进行中心标准化处理得到[D_ij]_w×v, 即D_ij=(D_ij-d_j)/s_j, 其中

为数据特征矩阵D中第j个变量的平均值,

为第j个变量的标准差.
其次, 计算矩阵

的v个特征根和对应的特征向量, 并将特征根按照大小降序排列.排序后的特征根记为λ₁, λ₂, …, λ_v, 对应的特征向量记为p₁, p₂, …, p_v, 称为负荷向量.
再根据

求出主元.主元t_i表示数据特征矩阵

在和这个主元相对应的负荷向量p_i方向上的投影, 且各主元间正交.t_i的投影长度越大, 表示

在p_i方向上的变化范围越大.如果将主元长度按照降序排列‖t₁‖>‖t₂‖>…>‖t_v‖, 那么p₁将代表数据

变化的第一大方向, p_v将代表数据

变化的最小方向.
最后, 计算主元的累计贡献率:

(10)

通常当γ_q>0.85时, 即可选取

的前q个主元来解释

的主要信息.因此, 可将标准化预处理后的数据特征矩阵

分解为q个主元的线性组合:

(11)

其中:T_q=[t₁, t₂, …, t_q]; P_q=[p₁, p₂, …, p_q]; E代表忽略其他几个小的主元而引起的误差.
2.4 建立主元回归(PCR)模型以上述q个主元作为多元自回归的自变量, 建立的加热炉钢坯出口温度的回归模型如下:

(12)

其中B=[b₁ ?b₂? … ?b_q]^T为主元回归模型参数, 可以通过最小二乘方法由加热炉钢温的训练数据Y计算而得到:

(13)

2.5 加热炉钢温预报算法基于数据特征的改进PCR加热炉钢温预报算法的具体步骤如下:
1) 采集历史数据中加热炉正常运行时的各批次数据, 作训练数据使用;
2) 利用TD-SDG模型, 计算过程变量间的滞后时间并进行同步处理, 根据式(9)构建各批次训练数据的等长数据特征向量D_p;
3) 将各批次数据的数据特征向量组成新的数据特征矩阵D, 对其用2.3节的方法进行主元分析, 提取主元T_q=[t₁, t₂, …, t_q];
4) 由式(13)计算主元回归模型参数B;
5) 采集加热炉的新批次数据, 重复步骤2), 3);
6) 对新的正常批次数据, 根据2.4节所建立的回归模型进行钢温预报, 计算钢坯出炉温度, 即

(14)

3 钢温预报模型的仿真验证本文仿真实验选择某钢厂加热炉实际生产过程中30个批次钢坯的数据, 数据采样时间间隔是10s.
根据式(1)可计算得到温度与煤气流量、空气流量和压力变量间的滞后延迟时间为20s.监测变量如表 1所示.
实验1:用20个正常运行下的批次数据作为训练数据进行建模, 用10批次数据进行测试;
实验2:建模数据和测试数据均选择15个批次.
首先计算每个批次各过程变量的均值、偏度、峭度、任意两个变量间的协方差和熵特征, 并将这些数据特征组合成一个等长的数据特征向量, 然后利用不同的建模数据批次分别建立主元回归模型, 对钢坯出炉温度进行预报.图 2和图 3分别是两次实验时测试批次的温度预报曲线.
图 2(Fig. 2)

图 2 实验1温度预报曲线Fig.2 Steel temperature prediction curve of test 1

图 3(Fig. 3)

图 3 实验2温度预报曲线Fig.3 Steel temperature prediction curve of test 2

由仿真曲线可以看出, 采用本文算法预测加热炉钢坯出炉温度准确、有效, 并且在使用较少样本建模时(实验2)仍能保证模型的准确性.
两次实验选用均方根误差(RMES)和最大误差两个指标进行评测, 具体的分析如表 2所示.
表 2(Table 2)

表 2 预测误差分析表Table 2 Analysis for prediction error

实验1误差
t/℃	2.46	5.26

实验2误差
t/℃	3.73	7.32

表 2 预测误差分析表 Table 2 Analysis for prediction error

4 结语本文从钢坯角度出发, 将加热炉工业过程作为一种间歇过程, 并利用基于数据特征的改进PCR算法建立了出炉钢温的回归预报模型.该方法提取每一块钢坯的变量统计特征和熵特征, 以批次为单位进行建模及预报.仿真结果表明, 该方法在有效地降低了计算量的同时也提高了预报精度.
参考文献

[1]	Lu Y Z. Energy savings and productivity increases with computers-a case study of the steel ingot handling process[J].Computers in Industry, 1983, 4(1): 1–18.
[2]	Yu J J. An estimation of a billet temperature during reheating furnace operation[J].International Journal of Control Automation & Systems, 2007, 5(1): 43–50.
[3]	Laurinen P, Roning J. An adaptive neural network model for predicting the post roughing mill temperature of steel slabs in the reheating furnace[J].Journal of Materials Processing Technology, 2005, 168(3): 423–430.
[4]	梁军. 轧钢加热炉钢坯加热质量的检测研究(Ⅱ)[J].传感技术学报, 2003, 16(2): 117–123. ( Liang Jun. Measurements of quality variables for an industrial rolling mill reheating furnace (Ⅱ)[J].Chinese Journal of Sensors and Actuarors, 2003, 16(2): 117–123.DOI:10.3969/j.issn.1004-1699.2003.02.004)
[5]	Zhao C H, Gao F R, Niu D P, et al. Enhanced process comprehension and quality analysis based on subspace separation for multiphase batch processes[J].AICHE Journal, 2011, 57(2): 388–403.DOI:10.1002/aic.v57.2
[6]	Jesus F C. Multivariate monitoring of batch processes using batch-to-batch information[J].AIChE Journal, 2004, 50(6): 1219–1228.DOI:10.1002/(ISSN)1547-5905
[7]	常鹏. 基于统计量模式分析的MKPLS间歇过程监控与质量预报[J].仪器仪表学报, 2014, 35(6): 1409–1416. ( Chang Peng. Batch process monitoring and quality prediction based on statistics pattern an analysis and MKPLS[J].Chinese Journal of Scientific Instrument, 2014, 35(6): 1409–1416.)
[8]	Han S H. A numerical analysis of slab heating characteristics in a walking beam type reheating furnace[J].International Journal of Heat & Mass Transfer, 2010, 53(19): 3855–3861.
[9]	张淑美, 王福利, 王姝, 等. 基于数据特性分析的多变量过程监测[J].东北大学学报(自然科学版), 2017, 38(5): 609–613. ( Zhang Shu-mei, Wang Fu-li, Wang Shu, et al. Multivariate process monitoring based on the characteristic analysis of the data[J].Journal of Northeastern University (Natural Science), 2017, 38(5): 609–613.DOI:10.3969/j.issn.1005-3026.2017.05.001)
[10]	Ge Z, Huang B, Song Z. Mixture semisupervised principal component regression model and soft sensor application[J].AIChE Journal, 2014, 60(2): 533–545.DOI:10.1002/aic.14270
[11]	Lu N, Jiang B, Wang L, et al. A fault prognosis strategy based on time-delayed diagraph model and principal component analysis[J].Mathematical Problems in Engineering, 2012: 1–17.
[12]	He Q P, Wang J. Statistics pattern analysis:a new process monitoring framework and its application to semiconductor batch processes[J].AIChE Journal, 2011, 57(1): 107–121.DOI:10.1002/aic.12247
[13]	周检检. 热力学熵与信息熵[J].武汉科技大学学报(自然科学版), 1988(4): 21–23. ( Zhou Jian-jian. Thermodynamic entropy and information entropy[J].Journal of Wuhan University of Science and Technology (Natural Science), 1988(4): 21–23.)
[14]	Gao L, Guan L, Qi L, et al.A novel discriminative framework integrating kernel entropy component analysis and discriminative multiple canonical correlation for information fusion[C]//2016 IEEE International Symposium on Multimedia.Barcelona: IEEE, 2016: 291-294.