设备的早期故障检测是确保机械系统安全可靠运行的重要保障,支持向量机(SVM)算法因其良好的非线性区分能力,成为目前广泛采用的故障检测方法。然而在实际应用过程中,由于运行现场故障样本难以收集,故障样本数量相对于正常样本而言较少,导致SVM算法的故障检测性能严重下降。因此,如何保证不均衡故障数据下基于SVM方法的故障检测性能是目前亟待解决的问题。本课题尝试从数据过抽样角度考虑,利用阴性免疫克隆选择算法生成异性样本,实现训练样本数据间的均衡;同时为降低训练时间及计算复杂度,拟利用基于多种群协同进化粒子群算法进行数据简约;建立一种抗噪能力强的模糊支持向量机算法,并利用集成特征选择技术构造一个具有最佳泛化性能的集成支持向量机网络;最终利用混合分类模型实现故障检测。该项目的成功实施为故障检测领域的现实应用提供了新的研究途径,同样也为目前流行的不均衡数据下机器学习方法的理论研究奠定了基础并提供新的思路。
Fault Diagnosis;unbalanced datasets;sampling methods;swarm particle;support vector machine
在故障诊断领域,由于运行现场故障样本难以收集,故障样本数量相对正常样本而言较少,因此会导致不均衡数据分类问题。为此,本课题从数据抽样角度及改善算法自身性能考虑,提出了基于阴性免疫克隆选择算法生成人工异性样本的过抽样算法,该算法利用阴性免疫实现少数类样本空间覆盖, 以生成的检测器中心为人工生成的少数类样本;进一步又提出了逐级优化递减欠采样算法和基于谱聚类欠取样的不均衡数据支持向量机 (SVM) 分类算法,该算法首先在核空间中对多数类样本进行谱聚类,然后在每个聚类中根据聚类大小和该聚类与少数类样本间的距离,选择具有代表意义的信息点;以及核聚类集成SVM算法和基于样本特性欠取样的不均衡SVM 分类算法,该算法首先在核空间中依据样本信息量选择一定比例的靠近不均衡分类界面的多数类样本,然后根据样本密度信息选择最具有代表性的均衡多数类样本点,在减少多数类样本的同时使分类界面向多数类方向偏移。同时为降低训练时间及计算复杂度,本课题又对基于优化算法的数据简约方法进行了研究并提出了一种多尺度协同变异的粒子群优化算法,该算法在初期阶段,利用大尺度变异及均匀变异算子实现全局最优解空间的快速定位,随着适应值的提升变异尺度随之降低,最终在算法后期阶段,利用小尺度变异算子完成局部精确解空间的搜索;以及双尺度协同变异的离散粒子群算法和求解最小属性约简的病毒协同进化微粒群算法,该算法的进化在宿主与病毒种群之间协同进行,通过满足约简分辨力不变条件的最优病毒种子复制操作产生病毒库,病毒通过感染操作在宿主种群完成横向局部搜索;进一步又提出了基于多尺度并行免疫克隆优化聚类算法,该算法进化在多个子群之间并行进行,不同子群的抗体根据子群适应度采用不同变异尺度,以及基于克隆多尺度协同开采的离散微粒群算法和定向多尺度变异克隆选择优化算法,该算法利用定向进化机制引导抗体向着抗体群最优解区域逼近和。为了将算法应用到故障诊断领域中,本课题又进一步构造了基于谱聚类下采样失衡数据下SVM故障检测方法以及基于代价敏感SVM的故障检测新算法。总之,该项目的成功实施为故障检测领域的现实应用提供了新的研究途径,同样也为目前流行的不均衡数据下机器学习方法的理论研究奠定了基础并提供新的思路。