本项目以信息系统为基本研究对象,以统计方法为工具,以知识发现和知识约简为目的,系统地研究粗糙集数据分析的统计证据。具体研究成果包括(1)将基于列联表卡方统计量,用于信息系统属性相关性的度量,并以此为启发信息研究了信息系统属性约简问题,为变精度属性约简的参数取值提供了统计意义。(2)引入了信息系统属性非线性关联程度的度量- - 有向关联系数,基于此统计量,给出了信息系统属性约定的一个判定定理,该算法明对协调和不协调决策表均有效。(3)引入秩相关系数,定义了属性集之间的Spearman、Kendall相关系数、Gamma系数以及Kendall协和系数,并基于这些度量给出了相应的有序信息系统与有序决策表的属性约简新方法;证明了Gamma约简与粗糙集约简之间有着密切的联系。(4)用模糊集、证据理论刻画了粗糙集。用模糊集来描述了一般关系概率粗糙集;借用模糊集的一些不确定性度量指标来反映了粗糙集的不确定性度量;以证据理论为工具,研究了优势关系下随机信息系统的属性约简算法。(5)研究了区间值模糊近似空间理论和不完备信息系统的属性约简算法。给出了区间值模糊近似空间的定义;提出了区间值模糊目标信
英文主题词data analysis; rough set; statistics; information systems;Bayesian analysis