粒计算是当前人工智能,特别是智能信息处理领域一个非常活跃的研究方向,它以粒为基本计算单位,以处理大规模复杂数据和信息等建立有效的计算模型为目标。粒计算的基本思想是从多角度、多层次进行信息粒度的表示和问题求解,然而,目前该理论尚缺少多粒度标记数据的具体计算模型。针对这个问题,本课题从模拟人的认知出发,以信息系统和形式背景为对象,以粗糙集和概念格为工具,研究数据的多粒度标记以及知识表示和知识获取的理论与方法。主要内容包括(1)多粒度标记数据模型的建立及多粒度标记数据的信息粒度的表示;(2)具有多粒度标记数据的知识获取的理论与方法;(3)基于多粒度标记数据的知识不确定性分析。本项目研究成果不但能够丰富粒计算理论,为复杂系统的数据挖掘及不确定性分析提供新的理论和方法,而且对空间数据分析等应用领域有重要的理论意义和应用价值。
granular computing;rough set;knowledge representation;concept lattice;rule extraction
本课题研究了具有多粒度标记的信息系统和形式背景中的知识表示和知识获取的理论与方法。用粒计算的角度提出了分层数据结构的多粒度知识表示系统的形式化描述,给出了多粒度标记划分和多尺度决策粒标记划分结构及其导出的粗糙近似;发展了无限论域中经典和模糊环境下各种广义粗糙集近似及其数学结构;给出了多尺度信息表和形式背景中基于粒计算的知识约简与基于规则提取的知识发现的方法;讨论了多尺度决策表中基于标准粗糙集模型和对偶概率粗糙集模型在各种意义下的最优粒度选择问题;分析了从多粒度标记数据中所获取的知识的不确定性问题。上述研究成果丰富了基于粗糙集和概念格的粒计算理论,为数据挖掘与知识发现提供了理论和方法。