位置:成果数据库 > 期刊 > 期刊详情页
HFS:一种面向软件缺陷预测的混合特征选择方法
  • ISSN号:1001-3695
  • 期刊名称:计算机应用研究
  • 时间:0
  • 页码:-
  • 分类:TP311.53[自动化与计算机技术—计算机软件与理论;自动化与计算机技术—计算机科学与技术]
  • 作者机构:[1]南通大学计算机科学与技术学院,江苏南通226019, [2]南京大学软件新技术国家重点实验室,南京210093
  • 相关基金:国家自然科学基金资助项目(61202006); 南通市应用研究计划项目(BK2014064); 南京大学计算机软件新技术国家重点实验室开放课题(KFKT2012B29); 南通大学大学生创新训练计划项目(2014075;2015074)
  • 相关项目:软件测试和调试过程中的测试用例演化技术研究
中文摘要:

在软件缺陷预测研究中,若考虑了大量度量元会造成数据集中含有大量特征,其中冗余特征和无关特征会降低缺陷预测模型的性能。提出一种两阶段混合特征选择方法 HFS,具体来说,首先基于特征子集评估器移除已有特征集中的无关特征和冗余特征,随后基于特征排序评估器进一步移除其中的无关特征。在实证研究中,以基于实际开发项目的数据集作为评测对象,以NONE、CFS和CAR三种方法作为与HFS方法比较的经典方法。最终基于三种不同类型的分类器(包括决策树法、支持向量机和最近邻法)上,发现HFS方法不仅能够选出更小规模的特征子集,而且在大部分情况下,尤其以决策树作为分类器时,能够有效提高缺陷预测模型的性能。

英文摘要:

In software defect prediction,some datasets may have many features as the consider different metrics. Irrelevant and redundant features can influence the effectiveness of defect prediction models. This paper proposed a novel two-stage hybrid feature selection( HFS) approach. In particular,it firstly applied a feature subset evaluator to remove irrelevant and redundant features. Then it applied a feature ranking evaluator to further remove irrelevant features. In empirical studies,it chose datasets from real development projects and used NONE,CFS,and CAR as this baseline approaches. Based on different classifiers( such as decision tree,support vector machine,and nearest neighbors),HFS can not only produces smaller subset of features,but also can improve the performance of software defect prediction models in most cases,especially on decision tree.

同期刊论文项目
同项目期刊论文
期刊信息
  • 《计算机应用研究》
  • 北大核心期刊(2011版)
  • 主管单位:四川省科学技术厅
  • 主办单位:四川省计算机研究院
  • 主编:刘营
  • 地址:成都市成科西路3号
  • 邮编:610041
  • 邮箱:arocmag@163.com
  • 电话:028-85210177 85249567
  • 国际标准刊号:ISSN:1001-3695
  • 国内统一刊号:ISSN:51-1196/TP
  • 邮发代号:62-68
  • 获奖情况:
  • 第二届国家期刊奖百种重点科技期刊,国内计算技术类重点核心期刊,国内外著名数据库收录期刊
  • 国内外数据库收录:
  • 俄罗斯文摘杂志,波兰哥白尼索引,英国科学文摘数据库,日本日本科学技术振兴机构数据库,中国中国科技核心期刊,中国北大核心期刊(2004版),中国北大核心期刊(2008版),中国北大核心期刊(2011版),中国北大核心期刊(2014版),中国北大核心期刊(2000版)
  • 被引量:60049