1. 北京理工大学 爆炸科学与技术国家重点实验室, 北京 100081;
2. 福州大学 环境与资源学院, 福建 福州 350116;
3. 中国人民武装警察部队学院 消防指挥系, 河北 廊坊 065000;
4. 中国安全生产科学研究院, 北京 100012
收稿日期: 2014-08-10
基金项目: “十二五”国家科技支撑计划项目2012BAK13B01.
作者简介: 段在鹏1985-, 男, 山东潍坊人, 北京理工大学博士研究生, 福州大学讲师; 钱新明1967-, 男, 浙江湖州人, 北京理工大学教授, 博士生导师.
摘要: 运用多项数据分析及推理技术提高物资需求预测速度及可靠性.首先利用历史案例信息求救援案例指标权重;之后建立模糊聚类(FCM)及案例检索相结合的算法,案例检索采用CBR-GRA双重检索技术,在得到相似度向量与灰色关联度向量之后,再次应用灰色关联分析求取案例相似-关联度向量,从而保证可靠案例检索;最后建立救援物质需求模型.经实例验证可知:案例聚类实现数据初步筛选,提升了检索速度,2种检索方法融合,提升了检索可靠性.
关键词: 应急救援需求预测案例推理灰色关联分析模糊C均值聚类 主客观综合权重
Emergency Resources Demand Forecast Based on FCM and CBR-GRA Dual Search
DUAN Zai-peng1,2, QIAN Xin-ming1, XIA Deng-you1,3, DUO Ying-quan4
1. State Key Laboratory of Explosion Science and Technology, Beijing Institute of Technology, Beijing 100081, China;
2. College of Environment and Resources, Fuzhou University, Fuzhou 350116, China;
3. Department of Fire Command, Chinese People’s Armed Police Force Academy, Langfang 065000, China;
4. China Academy of Safety Science and Technology, Beijing 100012, China.
Corresponding author: QIAN Xin-ming, professor, E-mail: qsemon@bit.edu.cn
Abstract: Multi-data analysis and reasoning techniques were adopted to improve the forecasting speed and reliability of emergency resources demand. Firstly, based on the historical case information, the rescue case index weights were calculated. Then an algorithm combining fuzzy C-means clustering with case retrieval was established to increase the efficiency of case retrieval, which was performed by CBR (casebased reason) similarity and GRA (grey relational analysis) correlation. After the CBR similarity vector and GRA correlation vector were obtained, the grey relational analysis was used to calculate the similarity-correlation vector so as to ensure that similar cases are retrieved efficiently. Finally, a resources demand model was built up. The results confirmed that case clustering to achieve preliminary data filtering can enhance retrieval speed and combining two retrieval methods can improve the reliability of retrieval.
Key words: emergency rescuedemand forecastcasebased reason (CBR)grey relational analysis (GRA)fuzzy C-means clusterinsubjective and objective comprehensive weight 应急任务主要包括应急物资储备、需求分析、调运和指挥等4个基本关键环节.需求分析是其中承前启后的重要一环,救援活动中常用到的物资分配方法是案例推理技术(case based reason,CBR).CBR适用于知识难以表达或因果关系难以把握,且尚未完全公式化的情况,已在医疗诊断、规则设计、故障诊断、咨询管理系统、甚至矿物加工等领域得到广泛应用[1].自RICCI于1999年将CBR技术引入于森林火灾救援以来[2],CBR方法也广泛地被应用于应急救援需求预测领域[3].灰色关联分析(grey relational analysis,GRA)也可以实现系统间各因素之间的关联程度的求算[4],并且也可以对信息不完全的系统进行关联度分析[5].因为灰色关联分析与CBR有功能重叠部分,故已有学者尝试将灰色关联分析与CBR联用,即在CBR的案例检索过程中利用灰色关联模型来计算案例之间的相似度,或应用灰色关联度与欧式距离相结合的方法计算目标案例与各历史案例之间的相似度[6].
1 救援案例指标权重模型假设有z条案例,m种属性的案例集,可构造如下源案例属性值矩阵D,设目标案例为D0=[D01 D02 … D0m],则D又可与D0组成CBR寻近矩阵Ω(z+1)×m.
1.1 标准差权对每个指标在各个案例下的取值逐一分析其均值(期望),并在此基础上进一步分析其偏移度(方差),偏移度越大,则该指标越能实现将不同案例的分类,从而将该指标赋予较高权重[7].无序枚举型指标Dij取值只有1和0,故其相比于有序枚举型和数字属性指标会出现取值跳跃性较大的问题,本文参照熵权算法,在将D矩阵归一化为D*之后,再将其规范化为F,最后求取元素跳跃性较小的矩阵F的标准差权.
1) 归一化矩阵D*.为了消除属性量纲不同、属性值数量级不同的情况,需归一化处理,第j条属性归一化方程为
2) 规范化矩阵F.
本文L=2.
3) 标准差及标准差权.归一化后的第j指标的期望及标准差为σj=,根据标准差σj可求案例库第j个指标的权重wj:
1.2 AHP-标准差主客观综合权重本文通过引入AHP方法解决该问题,即准则层之于目标层各指标权重应用AHP求取,而指标层之于准则层各指标权重则是建立在标准差客观权重基础上求取,实现主观权重与客观权重的糅合.设目标层A为单元素;准则层B包含p个元素;指标层C包含m个元素.上一节所求wj可视为AHP结构中指标层C中m个指标权重,在已知各指标权重赋值的前提下,本文指标层相对于准则层权重不通过判断矩阵求算,而是通过对同一准则层下的各指标层指标求权重wCjBk,j∈(1,2,…,m),k∈(1,2,…,p).
其中,当指标层指标Cj与准则层指标Bk无关时,wmeb-kj取为0;当Cj与Bk相关时,wmeb-kj取为wj,即
在此基础上,准则层B相对于目标层A指标权重,以及指标层C相对于目标层A权重,采用传统AHP方法,不再赘述.
2 模糊C均值聚类算法模糊C均值聚类算法是把l个向量xq=[xq1,xq2,…,xqp](q∈(1,2,…,l),p是向量维度,本文即为案例库的各组成指标.) 分为c个类别组,并求出每个类别组的聚类中心,使得非相似性指标的目标函数达到最小.FCM利用模糊划分,使每个元素的隶属度用0-1间的值来表示.一个数据集的隶属度的总和为1,即j=1,2,…,l[8].
模糊C均值聚类算法的目标函数为
其中: uij为数据集的隶属度,取值为0-1之间;ci为类别组i的聚类中心;dij=‖ci-xj‖为第j个数据点与第i个聚类中心间的欧几里得距离;控制模糊度的加权指数m∈[1,∞).3 CBR-GRA双重检索模型通过模糊聚类分析将CBR寻近矩阵Ω(z+1)×m 分为c类,取目标案例D0=[D01 D02 … D0m]所在类Ψ分析,假设Ψ类含n条历史案例,则历史案例与目标案例Ψ0=D0共同组成(n+1)×m矩阵Ψ.应用灰色关联分析得各条历史案例之于目标案例的加权灰色关联度组成向量sT-grey=(sT1-grey,sT2-grey,…,sTn-grey),sTi-grey为第i条历史案例于目标案例的加权灰色关联度.应用CBR得s′ Ti-cbr=(s′T1-cbr,s′T2-cbr,…,s′Tn-cbr),s′Ti-cbr为Ψ类内任意第i条历史案例Ψi与目标案例Ψ0的相似度.
因为相似度与灰色关联度均能表征案例库各条历史案例与目标案例的相似关联关系,故取二者综合值设为新的表征参数——称相似-关联数,设各相似-关联数组成相似-关联数向量为sT.
首先将 s′Ti-cbr归一化到sTi-grey水平得新的相似度向量sTi-cbr:
式中:sT-greymax,sT-greymin为灰色关联度最大值与最小值;s′T-cbrmax,s′T-cbrmin为相似度的最大值及最小值.之后分别求取各指标关于sTi-grey,sTi-cbr的最大值,并组成最优向量sTi-opt(1×n):
将sTi-grey,sTi-cbr及sTi-opt综合为3×n矩阵sTi-grmatr:
对sTi-grmatr再次应用灰色关联分析分别求得sTi-grey,sTi-cbr之于sTi-opt的灰色关联度sgrey,scbr,再将sgrey,scbr百分化求权向量:
又设
则相似-关联数向量为
式(10)中sTi为Ψ类内任意i条历史案例Ψi与目标案例 Ψ0 的相似-关联数.
4 应急物资需求预测模型根据以上分析可确定相似历史案例,根据聚类内部各案例相似度建模求取应急资源需求数量.设物资需求共q类,相似案例的应急资源需求分析关键指标值为r,相似案例的第h∈(1,2,…,q)种物资需求量为φh,目标案例关键指标值为RT,根据相似原理,目标案例中第h种物资的需求量ΦT-h为
依此原理,本文建立物资需求模型为
式(12)中sop为最相似案例相似度,ΦT-op为据式(11)求得的最相似案例物资需求,φop,rop分别为最相似案例的物资分配和关键因素;(φ1,φ2,…,φn),(r1,r2,…,rn)分别为聚类案例的物资分配和关键因素.最后将Φ′ T截去小数向上取整得到实际需用量ΦT.
5 应用实例某案例库指标层次结构如图 1所示.
图1(Figure 1)
图1 案例库指标层次结构Fig. 1 Case base index hierarchy注:C1事故性质分为泄露(0),火灾(1)和爆炸(2);C2事故等级分为1级(1),2级(2)和3级(3);C4企业性质分为石化(0),油库(1),化工(2)和树脂加工(3);C8实时天气分为正常(0)和雨雪(1);C9日夜分为日(0)和夜(1);C10风力分为微风(1),中等风级(2)以及强风(3). |
某化工企业发生火灾事故,救援案例库内信息及该火灾事故信息见表 1、表 2,救援共需要a~k等11种救援物资,各历史案例的物资需求见表 3,其中,a为急救包(个),b为隔热服(套),c为对讲机(台),d为可燃气体检测仪(台),e为折叠担架(副),f为有毒气体检测仪(台),g为化学防护服(套),h为抢险救援服(套),i为正压式空气呼吸器(套),j为苏生器(套),k为抢险救援服(套).
表1(Table 1)
表1 历史案例明细表 Table 1 Details of historical cases
| 表1 历史案例明细表 Table 1 Details of historical cases |
表2(Table 2)
表2 事故明细表 Table 2 Details of accidents
| 表2 事故明细表 Table 2 Details of accidents |
表3(Table 3)
表3 历史案例物资明细 Table 3 Material details of historical cases
| 表3 历史案例物资明细 Table 3 Material details of historical cases |
5.1 救援案例指标权重根据式(3)求标准差权为[0.09,0.10,0.09,0.10,0.09,0.10,0.08,0.12,0.13,0.10],求得主客观综合权重为[0.04,0.04,0.03,0.04,0.10,0.10,0.09,0.20,0.21,0.16].将标准差客观权重与主客观综合权重比较可知,标准差客观权重基本在0.1附近浮动,指标权重之间区别并不大,经过AHP求B3指标之于A的权重为0.57,故其下属指标层指标C8,C9,C10等3个指标权重在标准差基础上大幅提高,而B1指标之于A的权重仅为0.14,故而其下属指标层指标C1,C2,C3和C4指标权重被压低了,B2指标之于A的权重为0.29居中,故C5,C6,C7指标权重基本不变.
5.2 模糊聚类的双重检索因为历史案例数目不多,本文应用模糊聚类分析将Ω矩阵分为2类,得聚类隶属度矩阵:
分析隶属度矩阵U知:目标案例与第1,4,5,6,7号历史案例聚为一类,所以对以上5条案例着重分析.按上文介绍,将C3,C5,C6和C7等4个指标视为数字属性,将C2和C10视为有序枚举属性,将C1,C4,C8和C9等4个指标视为无序枚举属性,得目标案例与以上5条案例的CBR相似度为s′T-cbr=[0.60,0.94,0.70,0.46,0.69],灰色关联数向量为sT-grey=[0.75,0.95,0.67,0.59,0.62],将s′T-cbr归一化到sT-grey水平得s′T-cbr=[0.70,0.95,0.77,0.59,0.76],求得各案例相似数最大值组成最优向量sT-opt=[0.75,0.95,0.77,0.59,0.76],以sT-opt为参照向量分别求得基于sT-grey和s′T-cbr的灰色关联度分别为sgrey=0.75,scbr=0.64,2个灰色关联度归一化为权重 w grey_cbr=[0.54,0.46],按式(10)求算相似-关联数为sT=[0.72,0.95,0.72,0.59,0.69].将sT-grey,s′T-cbr以及sT共绘于图 2,分析图 2可知,相似关联度sT基本趋于sT-grey与s′T-cbr之间,但因为本文sgrey=0.75,scbr=0.64,故sT更趋近于灰色关联度,如通过CBR方法计算得第7案例比第1案例更接近目标案例,但通过GRA分析可知第1案例要比第7案例更接近于目标案例,最后第7案例与第1案例之于目标案例的相似-关联数基本一致,但第1案例要略优于第7案例,结论与GRA结论一致.
图2(Figure 2)
图2 案例检索图Fig. 2 Case retrieval chart |
5.3 物资需求解算以上求得第4案例为相似案例,将指标C3“影响范围”作为本次救援的关键因素,目标案例C3=110000,查表 1可得聚类内其他案例的关键因素值,在求得各聚类案例相似-关联数矩阵sT基础上,根据式(12)求得
对比表 3分析ΦT,因为第4案例为最相似案例,且与目标案例相似-关联度为0.95,故目标案例的综合物资需求基本与第4案例一致,值得注意的是,因为化学防护服与隔热服、抢险救援服功能类似,故有时化学防护服可不必调运,案例中应用较少,故第4案例的化学防护服需求量为0,但因为本例是化工企业事故,故化学防护服即使不太可能需要,也最好准备.通过式(12)计算得g物资需求量为1,故本文的物资需求模型可实现可靠救援.6 结论1) 分析海量数据,建立主客观综合权重模型,使权重在主观判断基础上,体现数据本身结构特点.
2) 历史数据过多会降低检索速度,通过检索之前的案例聚类,实现数据初步筛选,提升检索速度.
3) 融合CBR和GRA等2种检索方法,规避各自的方法弊端,提高检索可靠性.
4) 物资需求模型可充分提取各历史案例优点,使物资需求计算值理论优化.
参考文献
[1] | 施永贵,王洪峰,唐加福.基于案例的CDMA网络故障管理决策支持系统[J].东北大学学报(自然科学版),2011,32(7):927-930. (Shi Yong-gui,Wang Hong-feng,Tang Jia-fu.Case-based decision support system for fault management in CDMA networks[J].Journal of Northeastern University (Natural Science),2011,32(7):927-930.)(1) |
[2] | Ricci F,Avesani P,Perini A.Cases on fire:applying CBR to emergency management[J].New Review of Applied Expert Systems,1999,5:175-190.(1) |
[3] | Liu W M,Hu G Y,Li J F.Emergency resources demand prediction using case-based reasoning [J].Safety Science,2012,50(3):530-534.(1) |
[4] | Mousavi S M,Vahdani B,Tavakkoli-Moghaddam R,et al.Soft computing based on a fuzzy grey group compromise solution approach with an application to the selection problem of material handling equipment[J].International Journal of Computer Integrated Manufacturing,2014,27(6):547-569.(1) |
[5] | Ramesh B N,Suresha B.Optimization of tribological parameters in abrasive wear mode of carbon-epoxy hybrid composites[J].Materials & Design,2014,59(7):38-49.(1) |
[6] | 高保禄,熊诗波,段江丽,等.灰色关联度在故障诊断系统中的应用[J].太原理工大学学报,2010,41(4):398-401. (Gao Bao-lu,Xiong Shi-bo,Duan Jiang-li,et al.The application of grey correlation in fault diagnosis system[J].Journal of Taiyuan University of Technology,2010,41(4):398-401.)(1) |
[7] | 张红涛,毛罕平.四种客观权重确定方法在粮虫可拓分类中的应用比较[J].农业工程学报,2009,25(1):132-136. (Zhang Hong-Tao,Mao Han-Ping.Comparison of four methods for deciding objective weights of features for classifying stored-grain insects based on extension theory[J].Transactions of the Chinese Society of Agricultural Engineering,2009,25(1):132-136.)(1) |
[8] | 吴浩,李群湛,易东.基于广域状态信息和模糊C均值聚类的电网故障区域判别[J].电力自动化设备,2013,33(7):39-45. (Wu Hao,Li Qun-zhan,Yi Dong.Faulty region identification based on wide-area state information and fuzzy C-means clustering[J].Electric Power Automation Equipment,2013,33(7):39-45.)(1) |
本文献在全文中的定位:
... 则设计、故障诊断、咨询管理系统、甚至矿物加工等领域得到广泛应用[1].自RICCI于1999年将CBR技术引入于森林火灾救援以 ...
1
本文献在全文中的定位:
... .自RICCI于1999年将CBR技术引入于森林火灾救援以来[2],CBR方法也广泛地被应用于应急救援需求预测领 ...
1
本文献在全文中的定位:
... CBR方法也广泛地被应用于应急救援需求预测领域[3].灰色关联分析(grey relational analysis,GRA)也可以实现系统间各因素之间的 ...
1
本文献在全文中的定位:
... grey relational analysis,GRA)也可以实现系统间各因素之间的关联程度的求算[4],并且也可以对信息不完全的系统进行关联度分 ...
1
本文献在全文中的定位:
... 并且也可以对信息不完全的系统进行关联度分析[5].因为灰色关联分析与CBR有功能重叠部分,故已有学者尝试将灰色关联 ...
1
本文献在全文中的定位:
... 联度与欧式距离相结合的方法计算目标案例与各历史案例之间的相似度[6]. ...
1
本文献在全文中的定位:
... 大,则该指标越能实现将不同案例的分类,从而将该指标赋予较高权重[7].无序枚举型指标Dij取值只有1和0,故其相比于有序枚举型 ...
1
本文献在全文中的定位:
... 集的隶属度的总和为1,即j=1,2,…,l[8]. ...