位置:立项数据库 > 立项详情页
结构离群特征分析与释义空间建模研究
  • 项目名称:结构离群特征分析与释义空间建模研究
  • 项目类别:面上项目
  • 批准号:61073058
  • 申请代码:F020204
  • 项目来源:国家自然科学基金
  • 研究期限:2011-01-01-2013-12-31
  • 项目负责人:朱庆生
  • 负责人职称:教授
  • 依托单位:重庆大学
  • 批准年度:2010
中文摘要:

离群点可能蕴含重要信息,因此研究离群集的结构特征及释义空间具有重要学术意义和广泛应用领域。现有离群挖掘主要集中于检测离群点,缺乏对离群数据的行为进行分析和解释的有效方法。本项目针对数据集空间模型的结构特征,引入"结构离群"、"离群释义空间"等概念,把正常数据和离群数据融入统一结构体内进行分析,综合考虑宏观层面和微观层面,剖析离群对数据集主体结构特性的影响,探索检测和解释离群点的新方法。技术路线采用谱系特征系统描述结构离群特性,将数据空间划分为离群子特征系统和聚类子特征系统;基于项目组前期提出的离群划分相似度、关键域子空间等算法,研究高维离群数据的结构特性和降维算法;针对特定领域,研究获取离群触发规则及解释离群行为的模型;拟采用国际标准测试数据集和移动通信中欺诈离群数据分析来验证算法的正确性和有效性。项目研究有望在离群检测及离群行为分析的模型和算法研究方面取得突破。

结论摘要:

离群点可能蕴含重要信息,因此研究离群集的结构特征及释义空间具有重要学术意义。现有离群挖掘主要集中于检测离群点,缺乏对离群数据的行为进行分析和解释的有效方法。本项目针对数据集的结构特征,引入"结构离群"、"离群释义空间"等概念,把正常数据和离群数据融入统一结构体内进行分析,综合考虑宏观层面和微观层面,剖析离群对数据集结构特性的影响,提出离群检测和离群释意的新方法。项目研究成果的核心内容如下 1)深入分析了结构离群与聚类结构的内在联系。从分析高维离群数据集的空间结构入手,从“结构”出发得出离群可解集,统一“结构离群”与“聚类结构”之间的处理差异,确立了它他们之间的内在联系,从而为离群检测和离群空间寻找打下坚实的基础。 2)针对高维数据集的结构特征,提出了含离群点的高维数据集的降维算法。将粗糙集中属性约简的概念扩展到离群检测中,提出一种关键子集查找算法。将离群检测视为一种划分问题。如果在全属性集中发现的大部分离群点在某个属性子集中仍然保持离群性质,那么该属性子集就是属性约简。 3)针对给定的未知性质的任意数据集,提出一种基于谱聚类的聚类结构分析和离群检测算法。该算法给出了密度敏感的距离量度定义函数,能克服由数据分布密度不同对距离度量和聚类数目造成的影响。对于以相似图表示的数据集,将谱聚类过程近似地看成图的分割问题。 4)提出基于幂图的离群释义子空间搜索算法。从检测离群点入手发觉离群子空间,对其属性做相应解释;将释义空间与离群行为子空间进行匹配,分析离群产生原因;提出基于张量空间的离群关键子空间搜索算法和离群数据的释义空间的搜索算法。项目组成员在Knowledge-Based Systems,IEEE Transactions on Systems Man and Cybernetics-Systems,Expert Systems with Applications,Future Generation Computer Systems等期刊上发表论文21篇。其中,SCI检索6篇、EI检索16篇;申请发明专利2项;作为Co-Chair承办了International Conference on Information Engineering and Applications两届(IEA 2012和IEA 2011);培养毕业博士研究生3人和硕士研究生6人。


成果综合统计
成果类型
数量
  • 期刊论文
  • 会议论文
  • 专利
  • 获奖
  • 著作
  • 23
  • 2
  • 2
  • 0
  • 0
相关项目
期刊论文 10 会议论文 9 专利 4
期刊论文 42 会议论文 8 获奖 2
朱庆生的项目