近20多年发展起来的数学新分支- - 形式概念分析(概念格理论)是数据挖掘的有效工具之一。概念格的建构和属性约简是形式概念分析中的两个关键问题。本课题以形式背景和(模糊)决策形式背景为研究对象,以格理论、集理论、数据分析及统计算法为工具,提出研究概念格的两个模型,并给出它们的数学刻画、属性约简新方法及其应用。主要研究内容有利用集理论建立概念格的依赖空间模型,给出属性约简新方法;建立概念格的协调近似表示空间模型,研究该模型下的属性约简、属性重要性程度等问题;研究概念格粒计算系统及属性约简新方法在地理信息系统和数据挖掘中的应用问题,特别地,结合现代统计方法构建空间数据误差分析新模型。本课题的研究成果不仅可丰富和发展概念格理论,而且在网络工程、管理科学、地理信息系统、信息检索、机器学习等方面也具有重要的应用价值。
Concept lattice;dependence space;consistent approximation repre;concept granular computing sy;
形式概念分析(概念格理论)是数据挖掘的重要工具之一。概念格的建构和属性约简是形式概念分析中的两个关键问题。本课题以形式背景和多值形式背景为研究对象,以格理论、集理论、数据分析为工具,提出了概念格的两个模型,并给出了它们的数学刻画、属性约简新方法及其应用。主要研究内容有(1) 概念格建构的依赖空间模型及属性约简新方法首先从粗糙集角度研究了基于上下近似的对象概念格,给出了对象概念格属性约简的判定定理和约简方法;在格值形式背景下给出了C-C变精度概念格,C-F变精度概念格和F-F变精度概念格、格值概念格以及它们的属性约简方法;讨论了区间值信息系统的概念格约简方法;在此基础上提出了子形式背景上对偶概念格的依赖空间模型,进而给出了形式背景上一对对偶概念格建构的依赖空间模型; 基于Galois连接和外延、内涵算子,给出了一对对偶概念格的公理化刻画。(2) 概念格的协调近似表示空间模型及属性约简新方法首先从数据库的合成与分解角度出发,研究了合成序信息系统的属性特征和合成集值信息系统的属性特征;讨论了集值信息系统的属性约简和粗糙熵;给出了基于信息量的序信息系统和集值信息系统的属性约简,以及基于依赖空间的协调决策信息系统的属性约简;在此基础上提出了基于粗糙集的对象概念格的协调近似表示空间模型,形式背景上对偶概念格的协调近似表示空间模型,利用概念格的依赖空间模型,给出协调近似表示空间模型下的属性约简方法。(3) 概念粒计算系统及属性约简在地理信息系统的数据挖掘中的应用在对偶概念格的公理化刻画基础上提出了对偶概念格的概念粒计算系统和属性约简。将概念粒计算系统应用到地理信息系统中,解决了面向对象关系数据库的分类、降维、封装、泛化等问题。利用世界城市分类对该方法进行了验证。