生产加工过程中,生产设备状态的衰变会降低产品质量水平和成品率,导致多成品率质量问题。本项目针对此类具有多成品率质量问题的衰变设备进行最优预测维修策略的研究。在设备状态衰变的过程中,无法准确获得其状态信息,而是通过有限时间窗内的产品质检数据和距离上次维修以来的时间进行推断和预测。建立部分可观的马尔可夫决策问题模型,逐步松弛模型假设,从设备状态衰变概率已知的模型开始,到考虑检测时间引起信息时滞的模型,以及设备状态衰变概率未知且系统参数更具一般性的模型,模型中考虑了两类检测误差及一系列收益和成本参数。通过动态规划方法以及神经元动态规划方法,对每组系统观测信息,即产品质检数据和距离上次维修以来的时间,做出最优维修决策,决定是否触发维修行动,并预测未来的最优维修时间,从而最小化决策周期内的系统期望成本。随着质检数据的实时更新,将对预测的最优维修时间进行动态调整。
Maintenance policy;Predictive maintenance;Multi-yield deterioration;Markov Decision-making Process;Reinforcement learning
在生产加工过程中,生产设备状态往往会逐渐恶化,直至发生故障。在这个过程中,设备状态的衰变会对产品的成品率造成影响,导致多成品率质量问题。本课题针对此类具有多成品率质量问题的衰变设备进行最优预测维修策略的研究。在设备状态衰变的过程中,无法准确获得其状态信息,而是以有限时间窗内的产品质检数据作为观测信息。对应于系统观测信息,制定最优维修决策,从而最大化决策周期内的系统平均收益率。课题分别针对单台设备和两设备生产线开展了一系列研究工作,分别考虑了信息完备因素、完美或非完美维护、随机故障、质检误差、维修资源有限和衰变模式等各类因素,构建(部分可观的)马尔可夫决策过程模型,主要运用强化学习方法学习最优维修策略,预测维修时间。并提出多Agent动态预测维修策略学习系统,随着质检数据的实时变化,对维修策略进行动态调整。