北京交通大学 交通运输学院, 北京 100044
收稿日期:2020-10-27
基金项目:国家自然科学基金资助项目(71571011)。
作者简介:张路凯(1988-),男,山东济宁人,北京交通大学博士研究生;
冯雪松(1979-),男,吉林省吉林市人,北京交通大学教授,博士生导师。
摘要:考虑区段间信息级联效应, 提出一种状态空间下的列车晚点预测误差控制分析架构.应用拟合回归方法处理运行统计数据以确定常微分方程组, 根据现代控制理论设计一种减小误差的线性二次调节器, 并通过推导论证为所提方法提供合理性支撑.设计了双温模拟退火算法以获取调节器的优化参数, 并结合SIMULINK环境实现仿真计算.结果表明, 相较于传统贝叶斯网络预测方法, 所提出的状态空间分析方法对各项误差性能指标具有不同程度的改善, 且在平均误差值、数据需求量和运算时间等计算指标上具有优势.
关键词:交通信息工程及控制运行区段晚点预测误差控制参数优化双温模拟退火算法
Error Control of Delay Prediction in Railway Sections Under State Space
ZHANG Lu-kai, FENG Xue-song
School of Traffic and Transportation, Beijing Jiaotong University, Beijing 100044, China
Corresponding author: FENG Xue-song, E-mail: xsfeng@bjtu.edu.cn.
Abstract: Considering the cascading effect of information between sections, an analysis framework of train delay prediction error control in state space was proposed. The fitting regression method was used to process the operating statistics to determine the ordinary differential equations. According to the modern control theory, a linear quadratic regulator was designed to reduce the error, and it provides reasonable support for the proposed method through deduction. The dual-temperature simulated annealing algorithm was designed to obtain the optimized parameters of the regulator, and the simulation calculation was realized in combination with the SIMULINK environment. Numerical experiment results show that compared with the traditional Bayesian network prediction method, the proposed state space analysis method has different degrees of improvement on various error performance indicators, it has obvious advantages in calculation indicators such as average error value, data demand and computing time.
Key words: transportation information engineering and controloperating sectiondelay predictionerror controlparameter optimizationdual-temperature simulated annealing algorithm
列车到发时刻的晚点预测在铁路系统日常运行中起着重要作用, 其性能直接影响站点、线路及网络的安全性和组织效率.近年来, 单区段相邻站点的列车晚点相关预测逐渐成为热点[1], 其难度主要体现在操作条件复杂且随机误差较多.从研究趋势来看, 关于列车区段晚点预测与其精确性分析的研究愈来愈凸显工程实践的应用性, 并且在方法形式上侧重于修正建模与聚类建模.
Yuan等[2]建立了动态预测优化模型, 以此分析晚点量、外界随机干扰和初始时刻表三者之间的关系.为了精确预测列车到达时刻的晚点和误差, Hansen等[3]提出了基于事件的列车晚点分析方法.Yaghini[4]设计了预测客运列车晚点的人工神经网络, 并以伊朗客运铁路系统为实例进行验证.基于大量的历史运营统计数据, Kecman[5]建立了实时状态下列车晚点预测与误差分析模型.此外, Markovi等[6]应用支持向量回归方法分析了客运列车晚点到达时刻.Kecman等[7]针对列车运行晚点的传播, 提出了基于条件概率分析的贝叶斯预测模型.Martin[8]设计了铁路运输决策咨询系统以提供延误预测信息, 其中应用了一系列的预测推理和机器学习模型.Gaurav等[9]采用n阶马尔科夫框架和两个基于回归的模型, 通过实验分析了列车到达时刻的系统性延迟及误差特点.Corman等[10]提出了预测列车晚点传播的随机模型, 该模型能够有效处理随机因素间的复杂推理.Satyakrishna等[11]研究了大数据分析在列车晚点预测系统中的应用, 其中使用了浅层和深层极限学习机的方法.为了分析与列车晚点预测密切相关的误差因素及其影响, Wang等[12]设计了机器学习模型以实现列车到达时刻的晚点预测.Lessan等[13]引入了混合贝叶斯模型对特定区段内列车到达时刻、发车时刻和相应误差值进行预测研究, 该模型能够基于历史运营统计数据进行条件概率下的分析推理.
在列车区段晚点预测误差分析方法中, 对于区段内的历史统计数据丰富程度要求较高, 且充分依托于区段内的运营数据可靠性; 同时, 对列车的实时位置和误差更新需求较多, 且缺乏对于动态调整移动单元特点的解析性描述.当前对于列车区段晚点预测产生的误差, 还没有完全高效可控的手段, 控制特点的体现较为薄弱, 更未实现自动控制对误差变量的有效作用.鉴于此, 本文提出基于状态空间结构的方法体系以分析列车区段晚点预测误差控制问题.对晚点预测误差控制问题进行了解析化描述, 介绍了关键参数的优化计算过程, 应用所提方法进行了仿真与实验, 并进行了相关总结与展望.
1 问题解析描述列车区段晚点预测涉及众多影响因素, 本节主要介绍晚点预测误差控制问题场景和相关概念, 同时建立了数学方法框架.
1.1 状态空间建立如图 1所示的一个运行区段内, 列车由站点1行驶至相邻站点2, 涉及的时刻变量包括在站点1的到达时刻与出发时刻, 以及在站点2的到达时刻与出发时刻.在依据列车于站点1的时刻值并按照行驶里程和车速预测其于站点2的相关时刻值时, 由于设备因素(车辆故障、信号失灵、动力故障等)、操作因素(调度失误、突发大客流等)和环境因素(暴雨雪、强风)等, 预测时刻值往往存在一定误差.借鉴贝叶斯模型中节点衍生原则[13], 提出级联式动态预测架构.结合规律性的统计学视角, 列车于当前站点时刻值的预测误差和列车于前一站点时刻值的预测误差呈一定的逻辑关系结构, 即当前站点的到达时刻预测误差与前一站点的到达时刻预测误差及出发时刻预测误差有关, 当前站点的出发时刻预测误差与当前站点的到达时刻预测误差及前一站点的出发时刻预测误差有关.
图 1(Fig. 1)
图 1 列车区段晚点预测变量示意图Fig.1 Schematic diagram of predictor variables for railway section delay |
图 2为线路中各站点的到发时刻晚点预测误差的逻辑关系结构, 例如“aS1”表示列车在站点S1到达时刻的预测误差, “dS1”表示列车在站点S1出发时刻的预测误差.根据相应结构组成, 可进一步通过常微分方程组的解析形式描述预测误差变量之间的关系:
(1) |
图 2 列车区段晚点预测误差逻辑关系结构图Fig.2 Structure diagram of prediction errors of railway section delay |
式中: xi, 1(t)为列车在站点i的到达时刻的预测误差; xi, 2(t)为列车在站点i的出发时刻的预测误差; xi-1, 1 (t)与xi-1, 2(t)分别为列车在前一站点i-1的相应值; H1, H2, H3, H4为方程组系数, 可通过运营数据的拟合来确定[14].具体操作为利用脚本工具Forcal实现数据拟合以获得参数值, 相应的Forcal操作流程如图 3所示.
图 3(Fig. 3)
图 3 Forcal拟合操作流程Fig.3 Instruction flow of Forcal fitting operation |
1.2 控制分析体系基于式(1)常微分方程组所示状态空间结构, 进一步引入控制分析体系以实现控制误差的目的.图 4为与状态空间相对应的基本控制结构.与状态空间对应的控制系统矢量形式为
(2) |
图 4 列车区段晚点预测误差的基本控制结构Fig.4 Basic control structure of train delay prediction error |
式中: X=[xi, 1(t)??xi, 2(t)]T, 表示系统的状态变量;
(3) |
在式(3)中, 二次项XTQX≥0, 且UTRU≥0, 当式中目标函数趋于极小时, 即可达到状态变量X和输入变量U被控制至最小的目的.因此, 式(3)的物理意义是最小化当前站点和前一站点的列车到达及出发时刻的预测误差.从理想的数值计算角度来看, Q和R的设定值越大, 对应的X和U越小.由图 4中的基本控制结构可明显发现X和U的数值存在制约变化关系, 难以实现同步的极小化.因此, 需要设定合理的二次项矩阵Q和R, 以使得式(3)目标函数趋于极小.为方便计算, 可将Q和R设定为对角矩阵.
式(3)的极小化目标函数即为图 4中基本控制结构需实现的控制目标, 在列车区段晚点预测误差控制实践中需要直接自动地减小误差.因此, 需添加设计合理的自动控制措施以获得合理的Q和R值, 确保实现目标函数的极小化(最大限度减小预测误差).本文设计了一种闭环调节器, 并将其添加在图 4的基本控制结构中, 以实现上述自动控制目标.
1.3 自动控制结构列车区段晚点预测误差自动控制结构的设计原则源于现代控制理论, 被控对象即图 4中的基本控制结构, 添加调节器到被控对象上并发挥反馈控制作用.为方便解析推导, 将图 4中基本控制结构简化为图 5, 进而添加调节器形成闭环反馈自动控制结构, 如图 6所示.反馈调节器K满足状态变量X和输入变量U之间的关系U=-KX, 进而问题的关键在于获取合理的K以自动实现式(3)目标.下面对K的取值条件进行推导.
图 5(Fig. 5)
图 5 简化的基本控制结构Fig.5 Simplified basic control structure |
图 6(Fig. 6)
图 6 闭环反馈自动控制结构Fig.6 Closed loop feedback automatic control structure |
闭环反馈控制系统对应的状态空间方程如式(4)所示.首先将U=-KX代入式(3)目标函数可得式(5)目标函数, 假设存在一个常量矩阵P使得式(6)成立, 将式(6)代入式(5)得到式(7).对于稳定的闭环反馈自动控制系统, 当t→ti时X趋于定值, 并且当ti→∞时X→0.
(4) |
(5) |
(6) |
(7) |
(8) |
(9) |
(10) |
图 7 自动控制模块设计步骤Fig.7 Design steps of automatic control module |
2 参数优化计算为便于计算, 将Q和R设置为对角矩阵, 相应的式(3)目标函数可表示为式(11), 进而设计双温模拟退火算法对Q和R的参数进行优化求解.
(11) |
图 8(Fig. 8)
图 8 参数优化的整体流程Fig.8 Schematic diagram of parameter optimization |
步骤1?双温模拟退火算法流程初始化.
步骤2?扰动产生新解, 每个解包含的(q1, q2, r1, r2)分配至控制系统仿真工具SIMULINK中的仿真架构.
步骤3?在SIMULINK中, 计算获得调节器K, 确定系统输入变量与状态变量之间的反馈关系U=-KX, 进而计算式(11)目标函数.
步骤4?将SIMULINK中计算获得的每个解的目标函数值返回至双温模拟退火算法流程, 执行绝对接受和概率接受过程.
步骤5?判断终止条件是否满足, 若满足则最优解即为最终输出, 否则转至步骤2.
2.2 双温模拟退火算法双温模拟退火算法的详细步骤如图 9所示, 且具体如下.
图 9(Fig. 9)
图 9 双温模拟退火算法详细步骤Fig.9 Detailed steps of dual-temperature simulated annealing algorithm |
步骤1?初始化: 起始的控制温度tempm=tempi, 初始搜索温度tempd=tempi, 控制温度的降温系数为α, 搜索温度的降温系数为β, 每一个控制温度下的马尔科夫链长度为L.初始解Tc=T0, 初始的最优解Tb=T0.类似地, 初始的当前目标函数值Zc=Z0, 初始的最优目标函数值Zb=Z0, 令k=1.
步骤2?新解的产生: 随机产生新解Tn, 计算新的目标函数值Zn以及目标函数的变化值ΔZ.
步骤3?最优解的判断: 若目标函数的变化值ΔZ < 0, 新解被接受Tc=Tn, Zc=Zn, 最优解随之更新Tb=Tn, Zb=Zn.此时, 流程中控制温度下降tempm=tempm·α, 而搜索温度也下降tempd=tempd·β, 令k=k+1转步骤4.若目标函数的变化值在设定范围内0≤ΔZ≤ΔZa, 保存临时温度tempg=tempd·β, 根据概率P=e-ΔZ/tempg判断是否接受Tn且搜索温度是否下降tempd=tempg, 若不接受则搜索温度不变tempd=tempd, 令k=k+1转步骤4.若目标函数的变化值超出设定范围ΔZ>ΔZa, 转步骤2.
步骤4?迭代进程: 当k>L时, 控制温度下降tempm=tempm·α, 令k=1, 下一个控制温度下的计算进程开始; 否则, 转步骤2.
步骤5?计算终止: 若控制温度tempm降至终止温度tempe以下时, 计算终止, 最优解Tb和最优目标函数值Zb为最终输出结果.
2.3 SIMULINK仿真架构SIMULINK仿真架构的详细设计如图 10所示, 端口1和端口2为列车区段晚点预测误差自动控制架构中状态变量值, 即列车在第i个站点的到达时刻晚点预测误差和出发时刻晚点预测误差.端口3和端口4为列车区段晚点预测误差自动控制架构中输入变量值, 即列车在第i-1个站点的到达时刻晚点预测误差和出发时刻晚点预测误差.引入高斯白噪声w(t)作为控制系统受到的外部环境扰动, 仿真中的扰动增益环节G=2π
图 10(Fig. 10)
图 10 SIMULINK仿真详细架构Fig.10 Detailed simulation architecture in SIMULINK |
3 数值实验基于前两节所述方法与技术, 应用MATLAB R2018b进行数值实验分析, 表 1和表 2分别列出了双温模拟退火算法和控制系统仿真配置的基本参数, 其中结构矩阵取自武清站至天津站区段2019年2月至7月间运营统计数据的Forcal脚本拟合结果.首先对双温模拟退火算法中的降温系数进行灵敏度测试, 以获得有效的计算参数.控制温度和搜索温度的下降系数分别为α和β, 图 11为不同降温系数组合下算法实现收敛的计算时间.本文所提出的双温模拟退火算法比传统模拟退火算法(设置β=1)计算效率更高.从总体趋势分析数值特征, β值越小, 计算效率越高.但是, α不应大于β, 以保证计算中“收敛”与“探测”的逻辑协调.同时可发现, α和β二者均不能小于0.85, 否则会由于计算未充分收敛而难以获得最优解.根据现有计算测试所得的最佳降温系数(α, β)分别为0.91和0.95.
表 1(Table 1)
表 1 双温模拟退火算法基本参数Table 1 Basic parameters of dual temperature simulated annealing algorithm
| 表 1 双温模拟退火算法基本参数 Table 1 Basic parameters of dual temperature simulated annealing algorithm |
表 2(Table 2)
表 2 控制系统仿真基本参数Table 2 Basic parameters of control system simulation
| 表 2 控制系统仿真基本参数 Table 2 Basic parameters of control system simulation |
图 11(Fig. 11)
图 11 降温系数测试结果Fig.11 Test results of cooling coefficients |
在SIMULINK仿真模块中, 4个输出端口分别对应如下: 列车在当前停靠站点到达晚点预测的误差(Ecarr, 端口1), 列车在当前停靠站点出发晚点预测的误差(Ecdep, 端口2), 列车在前一停靠站点到达晚点预测的误差(Earrp, 端口3), 列车在前一停靠站点出发晚点预测的误差(Epdep, 端口4).
目标函数值的计算收敛过程如图 12所示.目标函数值逐渐减小并趋于定值, 即1.692 8.最优解中相应参数q1, q2, r1和r2分别取值为0.009 7, 0.008 5, 0.010 8和0.009 1.通过以上参数可计算出与4个输出端口相对应的误差值.本文对所提出的状态空间(state space, SS)分析方法与传统贝叶斯网络(Bayesian network, BN)分析方法进行了误差性能指标对比[13].两种方法的误差性能指标对比如表 3所示, 在状态空间方法中误差性能指标得到了显著改善.从计算应用的角度来看, 状态空间方法也具备实践优势.表 4为状态空间方法和贝叶斯网络方法之间定量计算指标的简要比较.状态空间方法数据需求量更少, 相应的计算时间也更少.相比于贝叶斯网络条件概率递归和节点衍生的逻辑结构, 状态空间方法通过应用常微分方程组展现出更好的动态特性.考虑在实际决策支持中的综合应用, 状态空间方法的控制结构模块充分证明了问题处理的可控性, 这也是优于传统贝叶斯网络方法的关键之处.
图 12(Fig. 12)
图 12 目标函数收敛图Fig.12 Illustration for objective function convergence |
表 3(Table 3)
表 3 两种方法的误差性能指标对比Table 3 Comparison of error performance indexes of the two methods ?
| 表 3 两种方法的误差性能指标对比 Table 3 Comparison of error performance indexes of the two methods ? |
表 4(Table 4)
表 4 两种方法的定量计算指标对比Table 4 Comparison of quantitative calculation characteristics of the two methods
| 表 4 两种方法的定量计算指标对比 Table 4 Comparison of quantitative calculation characteristics of the two methods |
4 结论1) ?与传统的铁路运输晚点预测误差研究相比, 本研究不需要频繁更新实时信息.相比于传统贝叶斯网络分析方法, 本方法在误差性能指标和计算指标具有显著改进.
2) ?从全局线路预测的操作范围来看, 本文研究视角为微观建模和动态优化, 能够通过列车运行区段这一基本单元使线路级联集成为整体, 体现了动态分析和可控性特点.
3) ?描述状态空间的常微分方程组通过脚本拟合工具建立, 其结果准确度高.本方法仿真计算中对所应用数据的可靠性要求较高, 应避免参数优化时的杂项数据干扰.未来研究中可探究更多可行的仿真环境和人工智能算法, 使得优化计算更加高效准确.
参考文献
[1] | Van Oort N. Service reliability and urban public transport design service reliability[D]. Delft: Delft University of Technology, 2011. |
[2] | Yuan J, Goverde R M P, Hansen I A. Propagation of train delays in stations[J]. WIT Transactions on the Built Environment, 2002, 61: 975-984. |
[3] | Hansen I A, Goverde R M P, Van Der Meer D J. Online train delay recognition and running time prediction[C]//13th International IEEE Conference on Intelligent Transportation Systems(ITSC). Funchal, 2010: 1783-1788. |
[4] | Yaghini M, Khoshraftar M M, Seyedabadi M. Railway passenger train delay prediction via neural network model[J]. Journal of Advanced Transportation, 2013, 47: 355-368. DOI:10.1002/atr.193 |
[5] | Kecman P. Models for predictive railway traffic management[D]. Delft: Delft University of Technology, 2014. |
[6] | Markovi' N, Milinkovi' S, Tikhonov K S, et al. Analyzing passenger train arrival delays with support vector regression[J]. Transportation Research Part C: Emerging Technologies, 2015, 56: 251-262. DOI:10.1016/j.trc.2015.04.004 |
[7] | Kecman P, Goverde R M. Predictive modeling of running and dwell times in railway traffic[J]. Public Transport, 2015, 7: 295-319. DOI:10.1007/s12469-015-0106-7 |
[8] | Martin L J. Predictive reasoning and machine learning for the enhancement of reliability in railway systems[C]//International Conference on Reliability, Safety and Security of Railway Systems. Paris, 2016: 178-188. |
[9] | Gaurav R, Srivastava B. Estimating train delays in a large rail network using a zero shot Markov model[C]//21th International Conference on Intelligent Transportation Systems(ITSC). Maui, 2018: 1221-1226. |
[10] | Corman F, Kecman P. Stochastic prediction of train delays in real-time using Bayesian networks[J]. Transportation Research Part C: Emerging Technologies, 2018, 95: 599-615. DOI:10.1016/j.trc.2018.08.003 |
[11] | Satyakrishna J, Sagar R K. Train delay prediction systems using big data analytics[J]. International Journal of Innovative Research in Computer & Communication Engineering, 2018, 6(3): 2414-2420. |
[12] | Wang P, Zhang Q. Train delay analysis and prediction based on big data fusion[J]. Transportation Safety & Environment, 2019, 1(1): 79-88. |
[13] | Lessan J, Fu L, Wen C. A hybrid Bayesian network model for predicting delays in train operations[J]. Computers & Industrial Engineering, 2019, 127: 1214-1222. |
[14] | 李俊民, 万百五, 黄正良. 基于双线性模型的动态系统优化和参数估计集成方法[J]. 控制与决策, 1998, 13(5): 521-526. (Li Jun-min, Wan Bai-wu, Huang Zheng-liang. Dynamic integrated system optimization and parameter estimation algorithm based on bilinear model for nonlinear systems[J]. Control and Decision, 1998, 13(5): 521-526.) |
[15] | 史峰, 王辉, 郁磊, 等. MATLAB智能算法30个案例分析[M]. 北京: 北京航空航天大学出版社, 2011: 50-56. (Shi Feng, Wang Hui, Yu Lei, et al. 30 intelligent algorithm cases by MATLAB[M]. Beijing: Beihang University Press, 2011: 50-56.) |
[16] | Fei L, Zhao X. Integrated control of automotive four wheel steering and active suspension systems based on uniform model[C]//9th International Conference on Electronic Measurement & Instruments. Beijing, 2009: 3551-3556. |