现有煤矿安全评价方法存在的不足在于未能充分考虑评价有效历史数据样本小的特点,造成模型评价精度不高,难以应用于实际的煤矿安全评价。神经网络方法适用于煤矿安全这类复杂系统的评价,但因部分评价数据具有时间序列递变特性,神经网络可以对递变函数进行模拟,但在学习段以外并不能实现被模拟函数的映射关系,需要对传统的神经网络方法进行优化。本项目拟采用V-fold小样本建模方法来建立煤矿安全评价系统,与传统的剖分样本建模法相比,该方法通过重新打乱样本并对样本的重复使用,以尽可能利用有限的样本资源来减少评价的偏差;拟采用差分动态协整的方法优化传统的神经网络,去掉评价数据的递变趋势,将其变换为平稳序列,从而提高神经网络的泛化能力。项目研究将在一定程度上丰富和完善煤矿安全评价理论体系,推动煤矿安全评价方法从理论研究走向更广阔的应用层面。
small sample;cross-validation;neural network;support vector;kernel function
本项目充分考虑了煤矿安全评价系统存在着典型负类样本数据不足的问题,首先建立了采用V-fold小样本建模方法的神经网络煤矿安全评价模型。与传统的剖分样本建模法相比,该方法通过重新打乱样本并对样本的重复使用,以尽可能利用有限的样本资源来减少评价的偏差。各煤矿安全评价指标的权重隐含在网络结构及输入输出的数据映射关系之中,训练好的神经网络对各主控影响因素评价指标重要性权重具有自协调能力,无需传统建模方法那样去为各影响因素的权重赋值,因而降低了评价过程中人为因素的影响,较好地保证了评价结果的客观性和真实性,所建评价模型能够真实地刻画煤矿安全影响因素与风险实际水平之间的复杂非线性关系,模型具有较好的应用价值。本项目提出了改进的训练样本规范化方法,并分别为神经网络和支持向量机小样本评价方法的训练样本提出了具体的改进公式。针对神经网络评价模型,改进的方法避免了S型活化函数取极值及连接权足够大的边缘和苛刻条件,提高了训练速度。对支持向量机评价模型来说,在核计算中会用到内积运算或exp运算,不平衡的数据可能造成计算困难。改进的方法更好地保持了原始数据的关系、消除量纲影响和变量自身变异大小和数值大小的影响,有效地降低了计算难度。本项目提出了一种选取煤矿安全评价支持向量机模型核函数参数的新方法——调步长网格搜索与K-CV交叉验证组合的方法。先在一个大区域选定Gauss径向基核函数参数的取值范围,设定一个大的搜索步长,对每对参数组合进行训练,采用K-CV交叉验证方法计算风险评价准确率,选择评价准确率最高的参数组合作为模型的最优参数。本项目建立了擅长解决小样本问题的改进的支持向量机煤矿安全评价模型。该模型在小样本数据情况下仍然具有较高的评价精度,可用来对现场煤矿安全进行评价,该方法是基于小样本的评价,不仅可以解决矿井安全系统广泛存在着典型负类数据不足的问题,而且还可以降低采集数据带来的危险并减少评价成本,是一种具有较高实用价值的小样本评价模型和方法。