位置:成果数据库 > 期刊 > 期刊详情页
面向分类特征的无监督特征选择方法研究
  • ISSN号:1000-1220
  • 期刊名称:《小型微型计算机系统》
  • 时间:0
  • 分类:TP311[自动化与计算机技术—计算机软件与理论;自动化与计算机技术—计算机科学与技术]
  • 作者机构:[1]广东科贸职业学院,广东广州510430, [2]广东外语外贸大学信息学院,广东广州510006
  • 相关基金:国家自然科学基金项目(60673191)资助; 广东省高等学校自然科学研究重点项目(06Z012)资助; 广东省自然科学基金项目(9151026005000002)资助
中文摘要:

针对分类特征数据给出一种新的特征重要性程度度量方法.以一趟聚类算法为基础,提出一种无监督特征选择方法.理论分析表明该方法时间复杂度与数据集的大小和特征个数成近似线性关系,适合于大规模数据集中的特征选择.在UC I数据集上的实验结果表明,与文献中的经典方法相比,本文方法具有较好的性能,说明提出的特征选择方法是有效可行的.

英文摘要:

In this paper,a new definition of measuring the importance of features is proposed for categorical data.Furthermore an unsupervised feature selection method based on one-pass clustering algorithm is presented.Theory analysis indicates that the time complexity of the feature selection method is nearly linear with the size and the number of features of dataset.It can be applied in feature selection for high dimensional data.Experimental results on UCI datasets show that the performance obtained by the proposed method is effective and practicable in features selection through comparing with other traditional feature selection approaches.

同期刊论文项目
期刊论文 53 会议论文 21 著作 1
同项目期刊论文
期刊信息
  • 《小型微型计算机系统》
  • 中国科技核心期刊
  • 主管单位:中国科学院
  • 主办单位:中国科学院沈阳计算技术研究所
  • 主编:林浒
  • 地址:沈阳市浑南新区南屏东路16号
  • 邮编:110168
  • 邮箱:xwjxt@sict.ac.cn
  • 电话:024-24696120 024-24696190-8870
  • 国际标准刊号:ISSN:1000-1220
  • 国内统一刊号:ISSN:21-1106/TP
  • 邮发代号:8-108
  • 获奖情况:
  • 中国自然科学核心期刊,中国科学引文数据库来源期刊
  • 国内外数据库收录:
  • 俄罗斯文摘杂志,波兰哥白尼索引,荷兰文摘与引文数据库,美国剑桥科学文摘,英国科学文摘数据库,日本日本科学技术振兴机构数据库,中国中国科技核心期刊,中国北大核心期刊(2004版),中国北大核心期刊(2008版),中国北大核心期刊(2011版),中国北大核心期刊(2014版),中国北大核心期刊(2000版)
  • 被引量:23212