周炳海


, 刘玉旺
同济大学 机械与能源工程学院, 上海 201804
收稿日期:2016-04-13
基金项目:国家自然科学基金资助项目(71471135)。
作者简介:周炳海(1965-), 男, 浙江浦江人, 同济大学教授, 博士生导师。
摘要:为了保证产出率的同时有效降低系统运作成本, 提出了考虑产品质量及返修的生产系统预防性维护决策模型.首先, 通过分析生产系统的结构特点, 基于返修点的位置, 将生产系统分为两部分.在此条件下, 以系统在给定运行时间内的总收益最大化为目标, 针对返修点前、后的生产线, 分别基于分解方法和状态转移思想构建了相应的产出率评价及预防性维护模型.最后, 利用混合粒子群分布估计算法对模型进行实例分析, 结果表明所构建的模型及算法是有效且实用的.
关键词:生产系统质量返修产出率预防性维护
Production System Maintenance Decision Models Based on Product Quality and Rework Process
ZHOU Bing-hai


, LIU Yu-wang
School of Mechanical and Energy Engineering, Tongji University, Shanghai 201804, China
Corresponding author: ZHOU Bing-hai, E-mail:
bhzhou@tongji.edu.cnAbstract: To effectively reduce the operation cost and ensure the throughput of production systems simultaneously, a preventive maintenance decision model was proposed, taking into consideration the product quality and rework process. Firstly, based on the location of the rework point, the whole production line was divided into two parts. Under this condition, the throughput evaluation and preventive maintenance models were established for the purpose of maximizing the overall revenue of the systems at the pre-and post-rework points, by using the decomposition method and the state transition rule respectively. Finally, an example analysis of the model was given by using the estimation algorithm of hybrid particle swarm distribution and the results showed that the proposed model and algorithm are valid and workable.
Key Words: production systemqualityreworkthroughputpreventive maintenance
生产系统中在制品数量会受到托盘数量的限制, 而在制品的数量又会影响生产系统产能
[1].此外, 设备性能的衰退会导致产品的不合格率随之增大, 从而影响系统有效产能.有效的维护决策和合适的托盘数量对于生产系统收益的提高有着重要的意义.
Biller等
[2-3]通过确定托盘数量以及系统中空闲托盘数量上限来针对闭环生产线进行优化分析.Savsar
[4]提出了离散迭代模型来优化缓冲容量和托盘数量.Kim等
[5]提出了马尔科夫模型对同时考虑质量和设备故障的生产线性能进行分析.Colledani等
[6]针对同时考虑质量和生产性能的生产线提出近似分析方法来估计有效产出率和在制品数量.Radhoui等
[7]针对产出混合质量产品的生产系统, 提出质量控制方法和预防性维护联合策略.Mhada等
[8]提出流体模型来确定最优的反馈控制策略使成本最小化.Ruifeng等
[9]针对装配系统, 提出解析模型来分析预防性维护策略以及产出率和在制品的估计.
分析上述文献, 对同时考虑产品质量及返修的闭环生产线进行产出率评价及预防性维护建模的研究鲜有报道.为此本文以最大化系统在运行时间内的总收益为目标, 建立了预防性维护决策模型, 并构建了混合粒子群分布估计算法对模型进行求解.
1 问题描述如
图 1所示, 每两个设备之间都存在一个中间缓冲区
Bi, 零件通过托盘在各个设备之间传递, 系统中托盘总数量为
N0.在生产线末端设置有检测区, 检测后的不合格品暂存在缓冲区
B0中, 统一进行返修.
图 1(Fig. 1)
为进一步描述研究问题域, 作如下假设:1) 当
B0满时, 对缺陷品统一进行返修, 且全部修复成合格品; 2) 设备
M1,
M2, …,
Mj-1不会产出不合格品, 设备
Mj,
Mj+1, …,
Mk在不同状态分别以概率pd
i, γi产出不合格品; 3) 设备
Mj,
Mj+1, …,
Mk分别包含
ni+2个状态, 且

, 其中πd
i, γi表示设备
Mi的维护决策变量.若为1, 则表示在状态
γi进行预防性维护; 若为0则不维护; 4)
B1, …,
Bk-1容量足够大,
B0存在上限
S0, 且
N0; 5) 任意两台设备不会同时发生状态转移.
2 生产线的产出率评价和成本模型2.1 返修点前生产子线的产出率评价模型利用分解方法
[10]将含有
j-1个设备的串行生产线
L分解为
j-2个包含两个设备的串行生产线
L(
i)(见
图 2), 假设每台设备有两种状态, 0表示设备处于故障停机状态, 1表示处于正常运行状态.
图 2(Fig. 2)
步骤 1??初始化(
i=1, …,
K-1).
其中:
μu(
i)和
μd(
i)分别是等效上下游设备
Miu和
Mid的操作速率; fr
u(
i)和fr
d(
i)分别是上下游设备的故障率; (
ru(
i),
qu(
i))和(
rd(
i),
qd(
i))分别是设备
Miu和
Mid的修复时间广义指数分布的参数.
步骤 2??给定
i=2, …,
j-2,
 | (1) |
 | (2) |
 | (3) |
 | (4) |
 | (5) |
 | (6) |
 | (7) |
 | (8) |
其中:
P(
i)代表生产线
L(
i)的产出率;
pi(
xi,
a,
b)代表生产线
L(
i)处于状态(
xi,
a,
b)的概率.
步骤 3??给定
i=
j-3, …, 1,
 | (9) |
 | (10) |
 | (11) |
 | (12) |
 | (13) |
 | (14) |
 | (15) |
 | (16) |
步骤 4??当其中的未知量趋于收敛时, 停止程序, 否则转到步骤2.其中两设备一缓冲系统不同状态的稳态概率
pi(
xi,
a,
b)由文献[
11]可得, 最终便可求得返修点前生产线的产出率
P(
j-1).
2.2 返修点前生产子线的成本模型在运行时间
T内, 由于对设备故障采取事后维修策略, 因此返修点前生产线的维护成本为
 | (17) |
其中
Cicm1表示设备
Mi单次维修成本.
2.3 返修点后生产子线的产出率评价模型针对生产线
Mj,
Mj+1, …,
Mk, 如
图 3所示, 设备不同状态之间会相互转化.当
γi≤
ni时, 设备
Mi以转化率
pi, γi进行退化, 同时以转移率
πi, γi进入预防性维护, 随后以转移率
pi完成预防性维护; 当
γi=
ni时, 进一步的退化将导致设备发生故障, 即进入状态
γi=
ni+1, 此时触发修复行为, 修复率为
λi.设备
Mi的状态分为4类:1)
γi=0, 初始全新状态; 2)
γi=1, 2, …,
ni, 正常工作状态; 3)
γi=
ni+1, 故障状态; 4)
γi=
ni+2, 预防性维护状态.
图 3(Fig. 3)
两设备一缓冲系统的状态可表示为SYS=(
x1,
γ1,
γ2), 其中
xi表示缓冲区
Bi中在制品数量.当
x1 > 0时, 其状态转移如
图 4所示, 由此可得状态间的平衡方程:
图 4(Fig. 4)
类似地, 当
x1=0时, 其状态转移见
图 5.
图 5(Fig. 5)
通过求解多组平衡方程, 可得到系统处于各状态的稳态概率.引入参数
αi, 当
αi=0时, 等效上游设备
Miu发生伪故障, 即
Miu代表的原设备发生饥饿现象; 当
αi=1时, 设备
Miu正常运行.系统状态可修正为SYS
i=(
xi,
γiu,
γid,
αi).对上游设备
Miu, 当且仅当设备加工完一个部件时,
Miu才会发生伪故障, 即当
Miu将零件传递给缓冲区
Bi时, 会以概率
piα从
αi=1转移到
αi=0进入伪故障状态:
其中
piαuui指当设备
Mui加工完一个部件后发生伪故障的概率.相似地, 设备
Mui从
αi=0转移到
αi=1恢复到正常状态的概率为
而其中的
λiα和
piα可以通过饥饿概率求解, 由文献[
9]可知下游设备处于饥饿状态的概率:
下游设备从饥饿状态恢复正常工作的概率为
根据系统分解原则,
piα=
gi-1d,
λiα=
hi-1d, 最终便可求得每个子系统状态间的转移概率
P(
xi,
γiu,
γid,
αi).由于设备
Mi在不同状态产出不合格品的概率pd
i, γi不同, 因此在不同的状态进行预防性维护会影响设备的平均不合格率, 即:
 | (18) |
其中pdef
i表示设备
Mi的平均不合格率.返修点后生产线的产出率可通过式(9) 计算:
 | (19) |
整条生产线的产出率为TH=
g(PR
e,
P(
j-1)).
2.4 返修点后生产子线的成本模型返修点后设备在时间
T内成本包括预防性维护成本
Cpm2, 事后维修成本
Ccm2及返修成本
Cr, 即:
 | (20) |
当维护阈值
γith=arc
γi(πd
i, γi=1) 为空时,
 | (21) |
其中
Cicm2表示设备
Mi的单次维修成本,
Cpm2(
i)=0.当
γith=arc
γi(πd
i, γi=1) 非空,
Cpm2(
i)为
 | (22) |
其中
Cipm2(
γi)表示设备
Mi处于状态
γi时的单次预防性维护成本,
Ccm2(
i)=0.因此返修点后生产线的
Cpm2和
Ccm2分别为
对于生产线末端检测出来的缺陷产品, 当缓冲区
B0满时, 进行统一返修, 其返修成本:
其中
Cur表示单个不合格产品的返修成本.同时托盘数量不同也会影响到系统运作成本, 因此系统在时间
T内的总成本:
 | (23) |
其中:
Cp为托盘成本;
Cup为单个托盘的成本.
由于提高产出率及降低成本都是为了提高最终收益, 因此本文模型旨在找出最优的预防性维护策略和托盘数量来最大化系统收益, 即目标函数为
 | (24) |
3 混合粒子群分布估计算法本文将分布估计
[12]的思想引入PSO
[13]中, 由于概率模型的建立基于所有个体的历史最优信息, 粒子的每次更新都是向全部个体的历史最优信息学习, 新算法中的粒子具有更全面的学习能力, 能够跳出局部最小值, 避免早熟; 而原始EDAs中每次模型的采样都忽略了至今全局最优信息, 新算法正好弥补了这一点.
3.1 编码基于离散粒子群算法的基本思想, 采用二进制对粒子进行编码, 取值可能是[0, 1]的某个状态, 定义位置向量
X和速度向量
V:
 | (25) |
 | (26) |
 | (27) |
 | (28) |
 | (29) |
 | (30) |
 | (31) |
其中:
N表示种群的大小;
xlj表示第
j个粒子的第
l位的值;
vlj表示第
j个粒子的第
l位取0的概率.
每一个粒子
Xj(见
图 6)代表一个可行解
G, 粒子维度为∑
nk, 其中维度为
ni的粒子段{
x1j+∑
ni-1,
x2j+∑
ni-1, …,
xj∑
ni}为设备
Mi的预防性维护决策基因, 当
xlj+∑
ni-1取1且

时, 表示设备
Mi在状态
l进行预防性维护, 即
γith=
l.
图 6(Fig. 6)
3.2 初始化种群采用随机初始化的方法产生
N个粒子作为初始种群, 即
Xini=[
X1,
X2, …,
XN].
3.3 适应度评价将
N个粒子代入所建模型中, 求解出各可行解的适应度值, 即总收益
f(
G)=
Q.记录所有粒子的个体历史最优值
X >
genepbest, j(
j=1, 2, …,
N)、个体历史次优值
Xgenenbest, j(
j=1, 2, …,
N)和全局最优值
Xgenegbest.
3.4 新解接受准则为增强算法的局部开发能力, 引入模拟退火算法中的概率接受准则进行个体历史最优值的更新.每当产生一个新解时, 首先计算新解和旧解的目标函数值, 如果产出率之差Δ
E=
f(
S′)-
f(
S)非负, 则接受新解作为最优解; 否则以概率exp(-Δ
E/
T)接受新解, 其中
T是随时间变化的温度参数.
3.5 种群分区将种群随机分成规模为NA和
N-NA的A, B两个子种群, 然后对A, B种群分别使用概率模型和粒子运动更新公式进行更新.
3.6 概率模型采用∑
ni×2维的随机矩阵
P表示解空间的概率分布, 其中
pml(gene)表示第gene次迭代中粒子的第
l位取
m的概率,
m=1, 0,l=1, 2, …, ∑
ni.首先对A种群中的NA个粒子按照适应度值进行排序, 随后选择其中MP个个体历史最优的粒子作为优势群体, 并基于这MP个个体来初始化矩阵
P:
 | (32) |
3.7 概率矩阵采样方法在产生一个新粒子时, 对于第
l+∑
ni-1个基因位, 当选中
xlj+∑
ni-1=1时, 则令
xllj+∑
ni-1=0;(
ll=1, 2, …,
ni;
ll≠
l), 从而防止设备在两个状态进行预防性维护, 保证新解的可行性.
3.8 粒子运动更新对于B种群, 使用粒子运动更新对
N-NA个粒子进行更新, 为了避免算法过早收敛出现早熟, 除了考虑自身最优和种群最优外, 还与粒子目前位置最近的粒子, 即自身次优粒子发生信息交流:
 | (33) |
 | (34) |
 | (35) |
 | (36) |
 | (37) |
其中:
xgenepbest, j,
xgenenbest, j和
vgenej分别表示第gene次迭代后第
j个粒子的历史最优值、历史次优值和速度值;
xgenegbest表示第gene次迭代后粒子的全局最优值; rand()表示[0, 1]内的随机数; 0 <
α,
β < 1表示算法对速度
vlgene的控制参数;
w表示惯性权重.
同时, 为了弥补粒子更新中固定参数的缺陷, 引入基于种群自适应调整的惯性权重法, 即
 | (38) |
其中:
wmax和
wmin分别为
w的最大值和最小值;
f为粒子当前适应度值;
favg和
fmin分别为当前所有粒子的平均适应度值和最小适应度值.
3.9 种群融合将分别根据概率模型和粒子运动更新得到的A,B两个子种群重新融合, 并根据适应度值对所有粒子进行排序, 得到一个包含有
N个粒子的新种群.
3.10 变异机制为了避免算法早熟, 执行互换变异来保持种群的多样性, 即随机选择一个粒子的第
j个粒子段的第
l1个位置, 对第
l1和
l2=arc
l(x
lj+∑
ni-1=1) 两个位置进行互换变异:
3.11 概率矩阵更新采用增量学习方法使用新种群中的MP个个体历史最优粒子对矩阵
P进行更新:
 | (39) |
其中
γ(0 <
γ < 1) 表示学习速率.
4 数值实例假设返修点前设备
M1,
M2, …,
Mj-1的修复时间服从广义指数分布, 其中
j=
k/2, 其累积分布函数为
F(
t)=(1-
q)+
q(1-e
-rt),
t≥0,
表 1为设备的故障率和修复率值.设
μ(
i)=1,
Cup=20,
S0=30,
T=100,
Cur=30, Price=800,
Cicm1=14,
Cicm2=20, 而返修点后设备
Mj,
Mj+1, …,
Mk状态数量在之间随机产生.初始化算法各参数, 设种群数量
N=50, 进化迭代100次, NA=
N/2,
α=0.3,
β=0.7,
c1=0.3,
c2=0.7,
c3=0.2.
表 1(Table 1)
表 1 返修点前的设备参数Table 1 Parameters of the machines before rework point 参数 | 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 | 10 | 11 | 12 | 13 | 14 | 15 | 16 | 17 | 18 | 19 | 20 | 1/fr(i) | 20 | 20 | 30 | 22 | 30 | 30 | 20 | 25 | 26 | 30 | 10 | 30 | 30 | 20 | 25 | 45 | 10 | 20 | 12 | 25 | 1/r(i) | 7 | 10 | 7 | 5 | 5 | 8 | 8 | 9 | 10 | 6 | 3 | 15 | 14 | 9 | 5 | 10 | 4 | 4 | 3 | 7 |
| 表 1 返修点前的设备参数 Table 1 Parameters of the machines before rework point |
图 7描述了在托盘数量一定的情况下, 不同设备数量对于总收益、总成本与产出率的影响.在给定托盘数量的情况下, 系统产出率会随着设备数量的增加而降低, 同时总成本也会逐渐增加, 从而使得系统总收益呈现出快速下降的趋势.
图 7(Fig. 7)
图 8描述了在设备数量一定的情况下, 不同托盘数量对于总收益、总成本与产出率的影响.产出率会随着托盘数量的增加而增加, 虽然总成本也在随之增加, 但增幅明显慢于产出率, 从而使得系统收益也随着托盘数量的增加而增加.
图 8(Fig. 8)
图 9是不同设备数量与不同托盘数量对系统的影响.从图中可以看出, 当设备数量一定时, 随着托盘数量的增加, 系统收益也随之增加, 这是因为尽管托盘数的增加导致系统总成本增大, 但产出的增幅更大; 而当托盘数量一定时, 随着设备数量的增加, 收益随之减少, 这是因为随着设备数量的增加, 设备维护成本增大导致系统总成本增大, 而产出率随之减小, 最终导致收益的快速下降.
图 9(Fig. 9)
5 结论1) 对于不同参数组合下的生产系统, 所建立的预防性维护决策模型和算法能够有效地找到相对最优的预防性维护计划使得系统总收益最大化.
2) 在其他参数不变的情况下, 系统总收益会随着托盘数量的增加而提高, 但却会随着设备数量的增加而降低.
进一步的研究方向可作如下考虑:以多台设备并行的生产系统或串并联的生产系统为研究对象, 从而使得维护策略的制定具有更广泛的应用意义.
参考文献 [1] | Li J S, Dennis E B, Huang N J, et al. Throughput analysis of production systems:recent advances and future topics[J].International Journal of Production Research, 2009, 47(14): 3823–3851.DOI:10.1080/00207540701829752 |
[2] | Biller S, Marin S P, Meerkov S M, et al.Closed production lines with arbitrary models of machine reliability[C]//IEEE International Conference on Automation Science and Engineering.Washington D C, 2008:466-471. |
[3] | Biller S, Marin S P, Meerkov S M, et al. Closed bernoulli production lines:analysis, continuous improvement, and leanness[J].IEEE Transactions on Automation Science and Engineering, 2009, 6(1): 168–180.DOI:10.1109/TASE.2008.917139 |
[4] | Savsar M. Modeling of hybrid production systems with constant WIP and unreliable equipment[J].International Journal of Information Systems & Supply Chain Management, 2011, 4(4): 46–66. |
[5] | Kim J, Gershwin S B. Integrated quality and quantity modeling of a production line[J].Operations Research Spectrum, 2005, 27(2/3): 287–314. |
[6] | Colledani M, Tolio T. Integrated analysis of quality and production logistics performance in manufacturing lines[J].International Journal of Production Research, 2011, 49(2): 485–518.DOI:10.1080/00207540903443246 |
[7] | Radhoui M, Rezg N, Chelbi A. Joint quality control and preventive maintenance strategy for imperfect production processes[J].Journal of Intelligent Manufacturing, 2010, 21(2): 205–212.DOI:10.1007/s10845-008-0198-x |
[8] | Mhada F, Hajji A, Malhamé R, et al. Production control of unreliable manufacturing systems producing defective items[J].Journal of Quality in Maintenance Engineering, 2011, 17(3): 238–253.DOI:10.1108/13552511111157362 |
[9] | Ruifeng C, Subramaniam V. Increasing production rate in Kanban controlled assembly lines through preventive maintenance[J].International Journal of Production Research, 2012, 50(4): 991–1008.DOI:10.1080/00207543.2011.551844 |
[10] | Xia B X, Xi L F, Zhou B H. An improved decomposition method for evaluating the performance of transfer lines with unreliable machines and finite buffers[J].International Journal of Production Research, 2011, 50(15): 1–16. |
[11] | Li Y, Chang Q, Xiao G, et al. Data-driven analysis of downtime impacts in parallel production systems[J].IEEE Transactions on Automation Science and Engineering, 2015, 12(4): 1541–1547.DOI:10.1109/TASE.2015.2443111 |
[12] | Wang L, Chen F. An effective estimation of distribution algorithm for the multi-mode resource-constrained project scheduling problem[J].Computers & Operations Research, 2012, 39(2): 449–460. |
[13] | Kenndy J, Eberhart R C.Particle swarm optimization[C]//Proceedings of IEEE International Conference on Neural Networks.Perth, 1995:1942-1948. |