粒计算是近年来人工智能领域中出现的一种新理念和新方法,它涵盖了所有与粒度相关的理论、方法与技术,是国内外的一个热点研究方向。本研究从邻域系统粒计算模型出发,紧紧围绕知识工程的观点,系统地展开粒计算理论中基础问题的讨论。主要包括(1)探求粒空间在邻域系统模式下的分层递阶结构,寻找基于邻域系统的知识粒度公理系统与具体表现形式,分析知识粒度变化与不确定性度量之间的关系;(2)以知识合成为出发点,研究粒空间在邻域系统模式下的转换方法,构建新的知识合成算子以分析粒空间的代数结构;(3)研究粒空间在邻域系统模式下的知识表示方法,为基于粒计算的知识推理提供可靠的理论基础;(4)针对高维数据,采用邻域系统粒计算方法,设计高效的特征选择算法。本项目的研究成果将进一步丰富粒计算理论,对智能计算、机器学习、数据挖掘与知识发现等相关领域的研究有着重要的理论意义和应用价值。
Granular computing;Neighborhood system;Hierarchical structure;Multigranulation;Rough set
利用粒计算方法进行问题求解,展现了人类的多层次、多视角思维认知能力。在本项目的研究中,我们认为将信息粒作为知识的基本单元,这符合人类思维的基本特征,因为在尺度上通过不同的抽象和概括程度来把握所有的知识,会使得对于知识的掌握更为客观和合理。根据这一观点,本项目主要取得了如下创新性的成果。 (I) 利用知识工程的观点,将邻域系统中的每一个邻域对应于多粒化空间中的一个信息粒,提出了多粒化空间上知识距离的概念,用以度量两个多粒化空间之间的差异性,在此基础上构建了多粒化空间上基于知识距离的格结构,并将由该格所诱导的偏序关系刻画多粒化空间的层次,从而解决了分层递阶结构、空间转换与代数结构问题。 (II) 根据多粒化粗糙集在实际应用中的需求,提出了三种序关系用以比较多粒化空间的粗细关系,证明了多粒化粗糙模型在这三种序关系下的包含关系,即单调性,从而为利用多粒化粗糙模型进行属性约简、特征选择等实际问题提供了理论基础。 (III) 将邻域系统数学建模方法引入不完备数据的分析中,提出了如何利用最大连续块与描述子支持集来构建邻域系统的技术手段,利用该方法,能够进一步提高了粗糙近似质量,在此基础上,研究了邻域系统模型在不完备信息系统中的约简方法,给出了相应分辨矩阵的判定定理,从不完备数据分析的角度验证了邻域系统处理实际问题的有效性。 (IV) 考虑现实世界中数据的动态更新问题,提出了多粒化近似的增量式计算方法,并将其应用到属性约简与基于凝聚层次聚类的属性约简求解过程中,在小样本高维基因微阵列数据上实验结果表明,增量式计算方法可以在不改变约简结果的前提条件下,极大地降低时间消耗,同时具备较高的时间稳定性。 (V) 将代价敏感问题引入多粒化数据处理方法中,提出了测试代价敏感的多粒化粗糙建模手段,使得多粒化粗糙近似变得测试代价敏感,分析了测试代价敏感粗糙模型与其他模型的联系与区别,分别利用启发式与回溯算法选择具有较低代价的粒空间,为多粒化技术的研究指出了一个可行的方向。 (VI) 分析了多粒化空间中的知识获取问题,提出了不同粒空间下决策规则的融合策略,并研究了融合后决策规则的全局和局部度量标准,为从多视角、多层次进行信息融合提供了一种新颖的技术手段。 综上,本项目系统分析了粒计算理论中的邻域系统与多粒化方法,为智能计算、机器学习、数据挖掘与知识发现等相关领域的深入研究提供了理论基础与技术支撑。