删除或更新信息,请邮件至freekaoyan#163.com(#换成@)

基于β似然函数的参数估计方法

本站小编 Free考研考试/2021-12-25

概率分布的参数估计是根据从总体中抽取的样本估计总体分布中包含的未知参数的方法,在可靠性数据分析中,通过获取产品故障数据、选择寿命分布类型、进行参数估计后,最终关注的是产品可靠度随时间的变化情况[1]。常用的点估计方法有:矩估计、最小二乘法估计、极大似然估计和图估计等。矩估计法由英国统计学家Pearson于1894年提出,可以在不知道母体的分布的情况下进行参数估计。最小二乘法于18世纪初提出,主要用于线性统计模型中的参数估计问题。极大似然估计法由英国统计学家费希尔于1912年提出,是可靠性数据分析中应用最为广泛的方法之一,该方法的理论依据是极大似然原理,极大似然原理可理解为“使当前样本中各个体故障时的故障密度估计值之积最大”,但这与评估的最终目标“使当前样本中各个体故障时的可靠度估计值最合理”并不等价,因此从理论上讲在可靠度的研究中使用极大似然估计是存在一定问题的[2, 3, 4, 5]。贝叶斯估计法是利用参数的后验分布对参数进行估计的方法。其中,期望型贝叶斯估计是使用最多的一种贝叶斯估计方法。
除了传统的点估计方法以外,很多****在原有估计的基础上,提出了一些其他的估计方法,如在寿命分布估计中常使用的最佳线性无偏估计(BLUE)[6],弥补BLUE只能适用于小样本缺点的简单线性无偏估计(GLUE)[7]等。还有一些研究者研究了如何以可靠度估计值构造似然函数进行参数估计,例如极大间距估计方法(maximum spacing estimation)[8, 9, 10, 11],它将相邻试件故障时的可靠度估计值之差,作为评价估计合理程度的标准,认为一个合理的估计结果应当使各相邻的试件故障时的可靠度估计值之差更接近。但显然极大间距估计方法也并未涉及可靠度估计值本身的合理性。结合β分布的性质和可靠度定义之间的关系[12, 13, 14, 15, 16, 17],本文以可靠度估计值的合理程度构造β似然函数,得出的分布参数估计方法适用于可靠度、生存率等关注事件发生比例的研究领域。
1 β似然函数的构造考虑有某种产品共h个,考虑其中某个具体产品的寿命长短,因为产品之间谁先失效谁后失效是等可能的,所以该个产品在所有h个产品中第几个失效(从1~h)也是等可能的。当产品个数h趋近于无穷大时,该个产品失效时还未故障产品所占比例也就是等可能的(从0~1),然而此时还未故障产品所占比例即为产品的可靠度。由此可知对某种产品,若仅知道其中一个具体产品的寿命值,则可认为该时刻产品的可靠度服从0~1上的均匀分布U[0,1],由此可得出结论 1。
结论 1 对一件产品进行寿命试验,在该件产品失效时间t时刻,该种产品的可靠度服从U[0,1]。
将可靠度服从U[0,1]看作向线段[0,1]上等可能地投一个点,则当对多个产品进行寿命试验时,由于各个产品的寿命互相独立,可看作向线段[0,1]上等可能地投多个点。根据有关β分布的2个定理[18]:
定理 1 向线段[0,1]上独立地投h个随机点,假设每个点都服从U[0,1],则左起第i(i=1,2,…,h)个落点的概率分布为β(i,h-i+1)。
定理 2X~β(a,b),则1-X~β(b,a)。由此可知:
结论 2 h个寿命独立同分布的产品进行寿命试验,则第i个产品故障时产品的可靠度服从分布β(h-i+1,i)。
事实上,可靠度非参数估计中的β分布法就是应用结论2来对产品的经验分布函数进行计算。假设对某产品n个试件进行寿命试验,记试验开始时为零时刻,试验中共m(mn)个试件发生故障,l(l≤n)个试件中途由于其他原因撤离(如未发生故障而中途退出试验、由非试验规定条件的意外因素致使试件故障),剩余nm-l个试件直至试验终止未发生故障。其中试件发生故障的时间依次为t1,t2,…,ti,…,tm,故障时间和撤离时间共同排序为t1,t2,…,tj,…,tm+l
由结论 2可知寿命试验中不同时刻产品可靠度服从的分布。在有试件中途撤离时,由于无法得知这些试件将在何时故障而无法直接使用该结论,此时需假设中途撤离试件将等可能地在其撤离后的试件故障之间发生故障,则可对真实故障试件在所有试件中的故障序号的期望(即平均秩次Ai)进行计算,进而使用平均秩次Ai作为β分布法中的序号,即:对n个寿命独立同分布的产品进行寿命试验,则第i个产品故障时(此时的故障时间和撤离时间的共同排序号为j)产品的可靠度服从分布β(n-Ai+1,Ai)。直接通过求期望计算平均秩次Ai比较复杂,可选择通过递推公式计算:

显然在无中途撤离的情况下Ai=i=j,此时与原β分布法的结论一致。
为了以可靠度估计值构造似然函数,需假设所选寿命分布的可靠度函数为R(t,θ),其中θ为待估参数,因此第i个故障发生时的可靠度估计值为R(ti,θ)。考虑到第i个故障发生时的产品的可靠度服从分布β(nAi+1,Ai),根据β分布的定义可知此时的可靠度估计值R(ti,θ)在可靠度分布β(nAi+1,Ai)中的概率密度为
其中B(nAi+1,Ai)为β函数:

认为对应概率密度较大的可靠度估计值更合理,用该概率密度f(R(ti,θ))的大小评价该试件故障时可靠度估计值的合理程度,以各个试件故障时的f(R(ti,θ))的乘积评价估计结果对整组数据估计的合理程度,由此得到β似然函数为

显然,在确定的寿命数据和可靠度函数R(t,θ)下,β似然函数是关于待估参数θ的函数,其反映的是不同参数θ取值下可靠度估计值的合理程度。注意到似然函数中的B(nAi+1,Ai)与待估参数无关而不会影响到函数的单调性,因此β似然函数也可写为

式中:F(ti,θ)=1-R(ti,θ)。由式(5)可对β似然函数进行另一种理解:ti时刻的可靠度估计值为R(ti,θ),故产品在ti之前故障的概率为F(ti,θ),在ti之后故障的概率为R(ti,θ)。对所有的n个试件,考虑到中途撤离的情况,在ti之前失效试件数的期望值为Ai-1,在ti之后失效试件数的期望值为nAi。即在ti时刻可靠度估计值为R(ti,θ)时,当前故障情况的发生概率为R(ti,θ)nAi·F(ti,θ)Ai-1。分别考察所有m个故障发生时的情况,将各发生概率之积作为评价整个估计的准则,即可得到式(5)所示的β似然函数。但事实上略去B(nAi+1,Ai)会使β似然函数值太小反而不便于实际计算,因此第2、第4和第5节中的β似然函数仍指式(4)。
2 β似然估计方法类似极大似然估计,β似然估计选择使β似然函数取值最大的参数值作为估计结果,表明此时各试件故障时的可靠度估计值总体最合理。
在β似然函数中,由于n为正整数、1≤Ain,因此无论可靠度估计值R(ti,θ)为[0,1]之间的何值,其概率密度值f(R(ti,θ))都在一个有限的范围内,不会出现似然函数中有无穷大项的情况。对n>1的这些分布的概率密度曲线在Ai=1时单调递增、1 < Ai < n时为单峰曲线、Ai=n时单调递减(如图 1为n=6,Ai=i(i=1,2,…,6)时的概率密度曲线),即各试件故障时的最佳可靠度估计值只有一个,由β分布的性质可知该值为 。因此对在分布的取值区间内且样本量n>1的寿命数据,无论所选寿命分布为何种数学形式,不同参数取值下其β似然函数都是存在最大值的,即β似然估计都存在。但需要指出的是,由于β似然函数可能存在多个极大值,当多个极大值相等且为最值时β似然估计的结果不唯一;另外β似然估计在样本量n=1时失效,因为唯一的试件失效时产品的可靠度服从分布β(1,1)即均匀分布,此时无论可靠度的估计值为何值,对应的概率密度都一样,也就无从进行比较。
图 1 β分布的概率密度曲线 Fig. 1 Probability density curves of β distribution
图选项



从计算的难易角度讲,β似然估计是优于矩估计的,特别是随着分布参数的增加,矩估计需要求解多元非线性方程组,而目前对于很多类型的方程组都是无法通过数值计算进行求解的,所以矩估计在参数较多时使用起来并不方便。β似然估计在多参数时只需求解多元函数的极值即可,具体计算时可以借用成熟的商业数学软件,如MATLAB实现求解。
3 仿真分析为了验证β似然估计方法在实际数据处理中的表现,本文采用了指数分布和威布尔分布仿真再估计的方法,将β似然估计与极大似然估计进行了比较,其具体步骤如下:
1) 随机确定分布参数(指数分布的故障率λ、威布尔分布的形状参数β和尺度参数α)。
2) 使用仿真的方法分别获取该参数下服从指数分布和威布尔分布的失效数据。
3) 分别选择指数分布和威布尔分布作为寿命分布模型,使用极大似然估计和β似然估计对这失效数据进行参数估计,得到指数分布的故障率λ1λ2及威布尔分布的参数α1β1α2β2
4) 比较2个估计得到的故障率λ1λ2与原始故障率λ的接近程度、比较参数α1β1α2β2与原始参数αβ之差的绝对值之和的大小关系。
5) 重复以上步骤,直到记录下足够多次的比较结果。使用计算机进行1 000次上述仿真比较后,统计的结果为使用极大似然估计得到的λ1较使用β似然估计λ2更接近原始λ的次数为568次,反之432次;使用极大似然估计得到的|α1α|+|β1β|较使用β似然估计得到的|α2α|+|β2β|更大的次数为383次,且2种方法对各组数据的估计结果相差往往都很小。图 2为指数分布和威布尔分布下的其中各一次仿真再估计得到的可靠度曲线。
图 2 仿真结果对比 Fig. 2 Comparison of simulation results
图选项



由此可认为2种方法对指数分布和威布尔分布的参数估计结果相差极小,可以认为2种方法对指数分布和威布尔分布都是适用的。
4 应用举例对某产品10件进行1 000 h定时截尾的寿命试验,试验中记录了试件的故障情况和撤离情况如表 1所示,其中3号试件为未故障撤离,现使用本文所述方法对该产品可靠度为0.7下的可靠寿命进行估计。
表 1 试验记录 Table 1 Test record
试件序号 工作时间/h 试验终止原因
1 216 故障
2 50 故障
3 514 撤离
4 565 故障
5 298 故障
6 460 故障
7 1 000 截尾
8 183 故障
9 131 故障
10 940 故障


表选项




对试验数据进行整理知,试件数量为10,发生故障的试件数量为8,进行排序并计算故障件的平均秩次如表 2所示。
表 2 事件排序表 Table 2 Events sorted table
共同排序号 j 故障排序号 i 工作时间 t i/h 平均秩次 A i
1 1 50 1
2 2 131 2
3 3 183 3
4 4 216 4
5 5 298 5
6 6 460 6
7 / 514 /
8 7 565 7.25
9 8 940 8.5


表选项




选择指数分布作为产品的寿命分布,其可靠度函数为

对应β似然函数为

式中:Aiti取值见表 2。使用MATLAB提供的数值方法[19]易求得当λ取0.001 7时L(λ)取到极大值5 811,即参数λ的β似然估计值为0.001 7。由此可知产品可靠度0.7下的可靠寿命为

使用平均秩计算产品的经验分布函数为

该经验分布函数与β似然估计结果R(t)=exp(-0.001 7t)的比较如图 3所示,可见β似然估计结果与经验分布直观上也是一致的。
图 3 估计结果对比 Fig. 3 Comparison of estimation results
图选项



5 结 论本文针对寿命分布的参数估计提出了一种基于β似然函数的β似然估计方法,该方法以可靠度估计值的合理性为核心,根据可靠度非参数估计中的β分布法得到试件故障时可靠度所服从的分布,进而使用该分布的概率密度来度量试件故障时可靠度估计值的合理程度,以该合理程度之积构造β似然函数,将使β似然函数取值最大的参数取值作为估计结果。本文方法具有以下特点:
1) 具有较强的理论支撑:β似然函数推导过程使用的“β分布法”和平均秩次的计算都非常成熟,前者可被严格证明、后者在无法得知准确故障秩次时使用秩次的期望值也是合理的。
2) 适用于各种寿命分布类型:无论分布的数学形式如何,β似然函数的取值都在一个有限的范围内,不会出现类似极大似然函数取值可能无穷大的情况,因此β似然估计都是存在的(仅要求样本量n > 1);另外随着分布参数的增加,β似然函数作为多元函数,其求极值在数值计算中容易实现,其难度低于矩估计中需要进行的多元非线性方程组求解。
3) 估计结果合理可信:β似然函数的推导就是以评价可靠度估计值的合理性为出发点,故本方法适用于可靠度、生存率等关注事件发生比例的研究领域。基于以上特点,本方法在浴盆曲线模型等较为复杂的分布参数估计中有较为突出的优点,克服了极大似然估计结果不存在的问题。
参考文献
[1] 赵军圣,庄光明,王增桂.极大似然估计方法介绍[J].长春理工大学学报,2010,5(6):53-54. ZHAO J S,ZHUANG G M,WANG Z G.An introduction about maximum likelihood estimation[J].Journal of Changchun University of Science and Technology,2010,5(6):53-54(in Chinese).
Click to display the text (12)
[2] BO R.The maximum spacing method:An estimation method related to the maximum likelihood method[J].Scandinavian Journal of Statistics,1984,11(2):93-112.
Click to display the text
[3] EKSTRÖM M.On the consistency of the maximum spacing method[J].Journal of Statistical Planning and Inference,1998,70(2):209-224.
Click to display the text
[4] GHOSH K,JAMMALAMADAKA S R.A general estimation method using spacings[J].Journal of Statistical Planning and Inference,2001,93(1):71-82.
Click to display the text
[5] EKSTROM M.Consistency of generalized maximum spacing estimates[J].Scandinavian Journal of Statistics,2001,28(2):343-354.
Cited By in Cnki | Click to display the text
[6] 孙振东,王喜山.一种计算电子元器件工作寿命的方法——最好线性无偏估计(BLUE)法[J].烟台大学学报(自然科学与工程版),1994(4):10-17. SUN Z D,WANG X S.A method to calculate lifetime of electronic devices-the best linear undistorted estimation[J].Journal of Yantai University(Natural Science and Engineering),1994(4):10-17(in Chinese).
Cited By in Cnki | Click to display the text
[7] 徐安.BLUE和GLUE及主要点估计方法的评价[J].济南交通高等专科学校学报,1994(1):37-44. XU A.Assessment of BLUE and GLUE and the main point estimation method[J].Journal of Jinan Communications College,1994(1):37-44(in Chinese).
Cited By in Cnki (1) | Click to display the text (1)
[8] SHAO Y.Consistency of the maximum product of spacing method and estimation of a unimodal distribution[J].Statistica Sinica,2001,11(4):1125-1140.
Click to display the text
[9] EKSTRÖM M.Alternatives to maximum likelihood estimation based on spacings and the Kullback-Leibler divergence[J].Journal of Statistical Planning and Inference,2008,138(6):1778-1791.
Click to display the text
[10] RANNEBY B,JAMMALAMADAKA S R,TETERUKOVSKIY A.The maximum spacing estimation for multivariate observations[J].Journal of Statistical Planning and Inference,2005,129(1):427-446.
Click to display the text (13)
[11] EL HAJE HUSSEIN F,GOLUBEV Y.On entropy estimation by m-spacing method[J].Journal of Mathematical Sciences,2009,163(3):290-309.
Click to display the text
[12] GOMES A E,DA SILVA C Q,CORDEIRO G M.The beta Burr III model for lifetime data[J] Brazilian Journal of Probability and Statistics,2013,27(4):502-543.
Click to display the text (2)
[13] BADSHA MD.B,MOLLAH MD.N H,JAHAN N,et al.Robust complementary hierarchical clustering for gene expression data analysisby β-divergence[J].Journal of Bioscience and Bioengineering,2013,116(3):397-407.
Click to display the text (3)
[14] CORDEIRO G M,NADARAJAH S,ORTEGA E M M.General results for the beta Weibull distribution[J].Journal of Statistical Computation and Simulation,2013,83(6):1082-1114.
Click to display the text
[15] CORDEIRO G M,LEMONTE A J.The β-Birnbaum-Saunders distribution:An improved distribution for fatigue life modeling[J].Computational Statistics and Data Analysis,2011,55(3):1445-1461.
Click to display the text
[16] PARANAÍBA P F,ORTEGA E M M,CORDEIRO G M,et al.The beta Burr XII distribution with application to lifetime data[J].Computational Statistics and Data Analysis,2011,55(2):1118-1136.
Click to display the text
[17] SILVA G O,ORTEGA E M M,CORDEIRO G M.The beta modified Weibull distribution[J].Lifetime Data Analysis,2010,16(3):409-430.
Click to display the text
[18] 赵宇,杨军,马小兵.可靠性数据分析教程[M].北京:北京航空航天大学出版社,2009:150-151. ZHAO Y,YANG J,MA X B.Data analysis of reliability[M].Beijing:Beihang Uuiversity Press,2009:150-151(in Chinese).
[19] 周品,赵新芬.MATLAB数理统计分析[M].北京:国防工业出版社,2009:200-204. ZHOU P,ZHAO X F.MATLAB statistics analysis[M].Beijing:National Defense Industry Press,2009:200-204(in Chinese).


相关话题/概率 计算 数据 经验 比例

  • 领限时大额优惠券,享本站正版考研考试资料!
    大额优惠券
    优惠券领取后72小时内有效,10万种最新考研考试考证类电子打印资料任你选。涵盖全国500余所院校考研专业课、200多种职业资格考试、1100多种经典教材,产品类型包含电子书、题库、全套资料以及视频,无论您是考研复习、考证刷题,还是考前冲刺等,不同类型的产品可满足您学习上的不同需求。 ...
    本站小编 Free壹佰分学习网 2022-09-19
  • 知识与数据融合的可靠性定量模型建模方法
    产品可靠性水平由设计活动限定。可靠性设计与功能设计、性能设计同步开展,才能从根本上提高产品可靠性水平。可靠性、功能、性能设计紧密结合,打破了“事后改进”(Test,AnalysisandFix,TAAF)造成可靠性活动被动、孤立的传统局面,实现了“主动预防”(DesignforReliability ...
    本站小编 Free考研考试 2021-12-25
  • 基于数据网格化方法的低轨辐射带建模技术
    ?地球外层空间存在着一个区域,其中充满地磁场捕获的高能质子和电子,这个区域被称为地球辐射带(以下简称为辐射带)[1].辐射带中的质子和电子能量较高[2],能够引起航天器材料和器件性能退化甚至失效[3,4].在地球空间运行的绝大多数航天器都要或多或少地穿越辐射带,遭遇高能粒子辐射.因此,在航天任务的设 ...
    本站小编 Free考研考试 2021-12-25
  • 民用飞机技术出版物的源数据影响度综合评价
    民用飞机的技术出版物是指保障飞机正常使用和维护所需的各种工程和技术信息文件,其既是飞机运营和人员培训的主要技术依据,也是飞机运营商能够正确高效运营和维修飞机的关键技术保障之一[1].对于民用飞机制造商而言,优良的技术出版物编制和维护能力不仅可以提高飞机的使用维护质量,提高用户的经济效益,而且可以树立 ...
    本站小编 Free考研考试 2021-12-25
  • 利用符号计算方法研究生物系统全时滞稳定性
    时滞微分系统的稳定性研究在理论和应用上都有其重要的意义,特别地,从控制理论的角度看,生物系统全时滞稳定即表明该系统对于时滞具有很好的鲁棒性和可靠性.长期以来,人们一直致力于寻找时滞微分系统全时滞稳定的代数判据,已取得了不少进展.秦元勋在文献[1]中第1次将单滞后多维系统的全时滞稳定判据由超越形式的检 ...
    本站小编 Free考研考试 2021-12-25
  • 基于关联规则的MBD数据集定义研究与实现
    随着数字化技术水平的不断提高,以航空航天为代表的大型装备制造业逐渐采用了基于模型定义(MBD)的全三维数字化设计制造方法[1].国内外针对MBD技术的应用进行大量研究,文献[2]在波音MBD应用技术基础上,详细阐述了基于模型定义的技术体系框架以及基本的定义方法和数据组织原则,文献[3]则对MBD标注 ...
    本站小编 Free考研考试 2021-12-25
  • 航天员受银河宇宙线辐射的剂量计算
    空间中的质子、电子、重离子、中子和X射线等辐射是威胁航天员健康和安全的环境要素.近20年,国际和我国的载人航天事业均有了很大发展,更多航天员参与空间活动,航天员在空间停留的时间也更长,接受越来越多的空间辐射照射.不同于以X射线、γ射线和中子为主的地面辐射,空间辐射含有高传能线密度(LET)的银河宇宙 ...
    本站小编 Free考研考试 2021-12-25
  • 汉语双模情感语音数据库标注及一致性检测
    情感语音中含有丰富的情感交流信息,在人们日常生活中起着非常重要的作用,对其研究可以进一步了解人类相应的心理状态,情感语音识别在情感计算和智能交互领域有重要意义.情感语音数据库是情感语音识别、合成等研究的基础.由于情感的复杂性、数据收集的困难性、录制标准的不统一性、情感分类目的和任务的差异性等,导致目 ...
    本站小编 Free考研考试 2021-12-25
  • 基于自由尾迹/面元法的旋翼下洗干扰计算和直升机配平
    受旋翼涡系的影响,直升机工作在十分复杂的流场当中,旋翼的下洗流对机身振动、桨叶气动载荷和直升机的飞行性能都有十分重要的影响.长期以来,科研人员从数值计算和试验两方面对涡动力学方法进行了大量的研究[1,2,3],对旋翼/机身的复杂气动干扰的理解也愈发加深.当直升机在吊挂飞行、舰载和沙漠等复杂条件起降时 ...
    本站小编 Free考研考试 2021-12-25
  • 面铣刀正交车铣加工切屑厚度的计算方法
    在航空工业,存在着许多的回转体或是半回转体同时带有凸台、耳片或者窗口等异形特征的工件.这类工件在应用传统的方法进行加工时效率低、成本高,对工厂来说是个很大的挑战.近些年出现的车铣复合加工技术为应对这一问题提供了有效的解决途径.越来越多的研究人员开始重视这一新技术,并在许多方面对其进行了探索和研究[1 ...
    本站小编 Free考研考试 2021-12-25
  • 基于两层元数据与本体的异构数据共享技术
    随着网络技术的发展和大数据时代的到来,海量数据的分布式存储和网络化管理变得日益重要.大数据的来源和格式呈多样性、复杂性和海量性等特点,简单通过增加存储空间的方法已不能完全解决大数据的共享问题.目前研究人员对数据共享的研究主要集中在元数据和本体两个方向,寄希望于通过一种数据中介实现资源数据的共享与管理 ...
    本站小编 Free考研考试 2021-12-25