粗糙集和概念格理论在数据挖掘和知识发现方面已经成为两个重要和热点研究领域,作为两种具有很大潜力的数据分析方法,成功应用于很多领域。本课题将粗糙集和概念格两种数据分析方法相韵合,结合模糊集、偏序理论、包含度理论,提出基于粗糙集和概念格理论的韵合数据分析方法,为数据分析提供相互关联、补充和推进的方法,主要研究内容包括(1) 粗糙集的等价分类和概念格的外延分类两种分类之间的关系;(2) 经典概念格基于粗糙集中二元关系的属性约简方法,集值形式背景基于集值信息系统的属性约简方法;(3) 基于粗糙集方法的模糊形式背景合成与分解知识获取方法;(4) 基于粗糙集和基于概念格的信息表属性约简、属性特征和决策规则关系。通过本课题的研究,进一步发展和完善粗糙集和概念格理论,为复杂系统中的知识获取和不确定性推理提供新的理论基础,相关研究成果将对数据挖掘、信息检索、机器学习等学科领域的实际问题具有广泛的应用前景。
Rough set;concept lattices;information systems;knowledge reduction;knowledge discovery
粗糙集和概念格理论在数据挖掘和知识发现方面已经成为两个重要和热点研究领域,作为两种具有很大潜力的数据分析方法,成功应用于很多领域。粗糙集和概念格两种理论虽然不同,但具有很多共性研究对象都是信息表,研究内容都是分类、知识约简和规则提取。我们在研究中发现,粗糙集和概念格在对同一个信息表进行分类、约简和知识获取的方法方面和具体的结果方面都具有密切的关系。本课题将粗糙集和概念格两种数据分析方法相韵合,结合模糊集、偏序理论、包含度理论,提出了基于粗糙集和概念格理论的韵合数据分析方法,为数据分析提供相互关联、补充和推进的方法,我们的主要研究工作如下 (1) 研究了基于变精度概念格的模糊形式背景的知识约简方法。 (2) 揭示了粗糙集约简和概念格约简的关系,建立了概念外延集合和优势类集合的关系。 (3) 研究了形式决策背景保持极大规则不变的复杂度约简方法。 (4) 引入了三类新的粒计算概念系统,研究了它们之间的关系,给出了非概念外延集合的近似方法。 (5) 给出了模糊形式背景的属性特征直接判别方法,给出了模糊形式背景的非矩阵属性约简方法。 (6) 建立了一种新的单边模糊概念格,讨论了所引入的模糊概念格建造算法和知识约简方法。 (7) 揭示了形式模糊背景的概念外延集合和优势类集合的关系,研究了它们的知识约简之间的关系。 粗糙集和概念格两种理论的比较和融合可以产生新的数据分析的工具。以上研究结果为粗糙集和概念格两种理论建立了一个有意义的桥梁,可以加深我们对两种理论的本质的认识。通过本课题的研究,进一步发展和完善了粗糙集和概念格理论,为复杂系统中的知识获取和不确定性推理提供了新的理论基础,相关研究成果将对数据挖掘、信息检索、机器学习等学科领域的实际问题具有广泛的应用前景。