如何从小样本、多源、离散数据和连续数据并存的混合型数据中提取出有效的矿致信息,以及如何更好地建模来表征矿致因素间复杂的关系已成为矿产预测研究的核心和难点问题。敏感性分析是一种定量描述输入变量对输出变量重要性的方法,可很好地筛选出矿产预测模型中起主导作用的矿致敏感信息。本项目从解决致矿属性中离散变量和连续变量并存的问题出发,主要研究基于矿产数据特点的分层混合模糊-神经网络学习算法;基于分层混合模糊-神经网络的敏感性分析算法;基于分层混合模糊-神经网络模型敏感性分析的矿致敏感信息挖掘及矿产预测模型构造。本项目的研究将在基于神经网络的敏感性分析方面有重要的理论进展,为矿产预测及致矿敏感信息的发现提供一条全新的途径,将有效提高地质、地球化学、地球物理等矿产资源数据的矿致敏感信息挖掘水平,对推动需要关联分析的地质学、地球信息与探测技术、环境、生物学、医学模式识别等领域的发展具有重要理论和实际意义。
sensitivity analysis;HHFN;type-2 fuzzy;mineral resource prediction;remote sensing classification
本项目执行期间在敏感性分析、二型模糊理论研究及在地球科学数据应用方面发表学术论文31篇(8篇SCI,13篇EI),英文专著1部,申请国家发明专利6项,授权国家发明专利3项,获软件著作权1项。涉及化探、遥感和地质矿产数据,为致矿敏感信息挖掘和影像分类识别提供了一条新途径。主要成果 1.敏感性分析是一种定量描述输入变量对输出变量重要性的方法,可很好地筛选出矿产预测模型中起主导作用的矿致敏感信息。(1)粗集依赖和重要性分析的统计推断;(2)对基于矿产数据特点的分层混合模糊-神经网络学习算法进行研究,针对离散变量间可能存在交互关系,提出基于Lasso函数的分层混合模糊—神经网络算法,并在遥感影像分类中取得了较好的应用;(3)采用求偏导方式,分别计算离散变量和连续变量在模型中的敏感性,获取对系统输出重要性程度高的输入变量,以约简模型降低高维数据带来的复杂性;(4)采用扰动方法,每次给分层混合模糊-神经网络的一个输入变量添加噪声或者干扰,而其他变量保持不变,观察加入噪声前后输出变量结果的变化;(5)在遥感地物分类和重要矿致属性筛选实验中对方法的有效性进行验证,实验表明提出的模型提高了神经网络模型的精度;(6)研发敏感性分析仿真系统。 2.二型模糊比传统一型模糊对地物刻画更准确。(1)区间值数据描述聚类原型特征更符合遥感数据的模糊性,先构建区间值数据模型,再使用区间最大相异度量方法进行模糊C-均值聚类,实验表明可以明显改善聚类效果,降低“同物异谱”的不利影响,有效抑制类间光谱混叠的错分;(2)针对影像分割斑块进行区间建模,采用区间值数据刻画对象特征与单值特征相比更符合遥感数据的非均匀性,提出一种适用于遥感数据多波段特性的区间最大相异度量方法,进行基于区间值数据模型的模糊C-均值聚类,实验表明精度得到明显提升;(3)区间二型模糊集可有效地降低计算复杂度,基于区间二型模糊C均值聚类算法能更好处理遥感影像的不确定性,在数据具有较大密度差异性时能够得到更精确的边界,明显优于一型模糊C均值算法;(4)针对岩土已有的方法分类精度不高,提出一种基于多特征波段岩土层次分类方法,兼顾无监督分类和监督分类双优势,利用多个特征波段组合,层次地将不同类型的岩土逐步分开,实现对岩土的精准分类,实验表明,能显著提高岩土分类精度,有效克服“同物异谱、异物同谱”难题,能识别以往方法难以区分的岩石阴影和水体。