位置:成果数据库 > 期刊 > 期刊详情页
稀疏数据非线性降维的CN-Isomap算法
  • ISSN号:1000-0984
  • 期刊名称:数学的实践与认识
  • 时间:0
  • 页码:182-188
  • 语言:中文
  • 分类:TP181[自动化与计算机技术—控制科学与工程;自动化与计算机技术—控制理论与控制工程]
  • 作者机构:[1]北京科技大学经济管理学院,北京100083
  • 相关基金:国家自然科学基金(70771007)
  • 相关项目:高维稀疏数据聚类研究
中文摘要:

针对经典的流形学习算法Isomap在非线性数据稀疏时降维效果下降甚至失效的问题,提出改进的切近邻等距特征映射算法(Cut-Neighbors Isometric feature mapping,CN-Isomap).该算法在数据稀疏的情况下首先通过有效识别样本点的"流形邻居"来剔除近邻图上的"短路"边,然后再通过最短路径算法拟合测地线距离,使得拟合的测地线距离不会偏离流形区域,从而低维嵌入映射能够正确地反映高维输入空间样本点间的内在拓扑特征,很好地发现蕴含在高维空间里的低维流形,有效地对非线性稀疏数据进行降维.通过对Benchmark数据集的实验表明了算法的有效性.CN-Isomap算法是Isomap算法的推广,不仅能有效地对非线性稀疏数据进行降维,同样也适用于数据非稀疏的情况.

英文摘要:

An improved algorithm Cut-Neighbors Isometric feature mapping(CN-Isomap) is proposed after analyzing why Isomap,a classic manifold learning algorithm,can not reduce dimensionality effectively for sparse nonlinear data.The algorithm first identifies the 'manifold neighbors' effectively when data is sparse in order to delete the 'short circuit' edges in neighborhood graph.Then it simulates the geodesic distance by shortest path algorithm,so that the geodesic distance will not deviate from the manifold region.Thus low-dimensional embedded mapping can correctly reflect the inherent topological features of sample points in high-dimensional input space,which enables that the algorithm finds the low-dimensional manifolds implicated in high-dimensional space better and reduce dimensionality of sparse nonlinear data effectively.The effectiveness of the algorithm is verified by experiment on Benchmark data set.CN-Isomap is the extension of Isomap.It is not only effective for dimensionality reduction of sparse nonlinear data,but also applicable to non-sparse data.

同期刊论文项目
期刊论文 38 会议论文 12
同项目期刊论文
期刊信息
  • 《数学的实践与认识》
  • 中国科技核心期刊
  • 主管单位:中国科学院
  • 主办单位:中国科学院数学与系统科学研究院
  • 主编:林群
  • 地址:北京大学数学科学学院
  • 邮编:100871
  • 邮箱:bjmath@math.pku.edu.cn
  • 电话:010-62759981
  • 国际标准刊号:ISSN:1000-0984
  • 国内统一刊号:ISSN:11-2018/O1
  • 邮发代号:2-809
  • 获奖情况:
  • 国内外数据库收录:
  • 美国数学评论(网络版),德国数学文摘,中国中国科技核心期刊,中国北大核心期刊(2004版),中国北大核心期刊(2008版),中国北大核心期刊(2011版),中国北大核心期刊(2014版),中国北大核心期刊(2000版)
  • 被引量:22973