总结了物化探数据挖掘的相关过程数据预处理、实测数据的聚类分析、聚类结果的分析,探讨了地学聚类分析的基础理论与应用方法,验证了聚类分析在物化探资料处理中应用的有效性。给出了地学数据挖掘领域今后研究方向的相关建议。根据实测物化探数据的特征,设计并实现了一种基于密度和密度可达的聚类算法(CADD)。实验数据对比表明CADD算法实现了无指导挖掘;对不同分布形状、不同密度的数据集聚类效果较好;可消除噪声数据的影响;该算法的时间效率较高。对宁夏地区电法资料和某地化探采样数据进行了聚类分析。电法研究结果表明该方法能够有效地确定测区的区域电性分布特征;反映测区内近地表层和基底电阻率参数的变化规律;结合水文地质资料,给出了地下水资源的区域分布特征和规律。化探数据分析结果表明其聚类结果与已有的地质成果在地层岩性和化探异常带的展布特征上相吻合,说明利用聚类分析能够有效地确定地球化学元素的分异性以及其迁移与扩散特征;根据地球化学理论,结合聚类分析和相关分析,能够确定出产生化探异常的矿产资源类型。
英文主题词data mining; cluster analysis; CADD algorithm; geophysical-geochemical data