位置:立项数据库 > 立项详情页
高维稀疏数据聚类研究
  • 项目名称:高维稀疏数据聚类研究
  • 项目类别:面上项目
  • 批准号:70771007
  • 申请代码:G01
  • 项目来源:国家自然科学基金
  • 研究期限:2008-01-01-2010-12-31
  • 项目负责人:武森
  • 负责人职称:教授
  • 依托单位:北京科技大学
  • 批准年度:2007
中文摘要:

高维数据处理能力是聚类研究的难点之一。本项目拟针对高维数据普遍具有稀疏特征,提出特定的高维数据表示、数据精简和差异度计算方法,并进一步给出高效的不同数据类型的聚类算法。主要研究内容包括 (1)高维稀疏数据的特征表示和基本性质、针对高维稀疏数据聚类的更高效更高质量地缺失数据填补方法和数据取值类型转换方法。 (2)在保留全部原有数据信息或至少保留聚类相关信息的情况下,高维稀疏数据的精简方法、存在缺失数据的高维稀疏数据精简方法、兼顾缺失数据填补的高维稀疏数据精简方法。 (3)不同数据类型的高维稀疏数据集合差异度计算方法。针对高维稀疏数据聚类,从根本上解决差异度计算问题,为高效聚类算法的提出提供理论依据。 (4)不同数据类型的高维稀疏数据聚类算法。

结论摘要:

英文主题词high dimensionality; sparse data; clustering; data mining


成果综合统计
成果类型
数量
  • 期刊论文
  • 会议论文
  • 专利
  • 获奖
  • 著作
  • 38
  • 12
  • 0
  • 0
  • 0
期刊论文
相关项目
期刊论文 14 会议论文 1 专利 4 著作 2
期刊论文 16 会议论文 1
期刊论文 62 会议论文 79 著作 3
期刊论文 65 会议论文 4
武森的项目