东篱科研大数据发现系统（DRDS）

位置：成果数据库 > 期刊 > 期刊详情页

一种半监督集成跨项目软件缺陷预测方法

ISSN号：1000-9825
期刊名称：《软件学报》
时间：0
分类：TP311[自动化与计算机技术—计算机软件与理论;自动化与计算机技术—计算机科学与技术]
作者机构：[1]天津大学软件学院软件工程系,天津300072, [2]南通大学计算机科学与技术学院,江苏南通226019
相关基金：国家自然科学基金（61202030,61373012,61202006,71502125）

关键词：跨项目软件缺陷预测, 半监督学习, 集成学习, 遗传算法, 朴素贝叶斯, cross-project defect prediction, semi-supervised learning, ensemble learning, genetic algorithm, Naive Bayes

中文摘要：

软件缺陷预测方法可以在项目的开发初期,通过预先识别出所有可能含有缺陷的软件模块来优化测试资源的分配.早期的缺陷预测研究大多集中于同项目缺陷预测,但同项目缺陷预测需要充足的历史数据,而在实际应用中,可能需要预测项目的历史数据较为稀缺,或这个项目是一个全新项目.因此,跨项目缺陷预测问题成为当前软件缺陷预测领域内的一个研究热点,其研究挑战在于源项目与目标项目数据集间存在的分布差异性以及数据集内存在的类不平衡问题.受到基于搜索的软件工程思想的启发,提出了一种基于搜索的半监督集成跨项目软件缺陷预测方法 S~3EL.该方法首先通过调整训练集中各类数据的分布比例,构建出多个朴素贝叶斯基分类器;随后,利用具有全局搜索能力的遗传算法,基于少量已标记目标实例对上述基分类器进行集成,并构建出最终的缺陷预测模型.在Promise数据集及AEEEM数据集上与多个经典的跨项目缺陷预测方法（Burak过滤法、Peters过滤法、TCA＋、CODEP及HYDRA）进行了对比.以F1值作为评测指标,结果表明：在大部分情况下,S~3EL方法可以取得最好的预测性能.

英文摘要：

Software defect prediction can help developers to optimize the distribution of test resources by predicting whether or not a software module is defect-prone. Most defect prediction researches focus on within-project defect prediction which needs sufficient training data from the same project. However, in real software development, a project which needs defect prediction is always new or without any historical data. Therefore cross-project defect prediction becomes a hot topic which uses training data from several projects and performs prediction on another one. The main research challenges in cross-project defect prediction are the variety of distribution from source project to target project and class imbalance problem among datasets. Inspired by search based software engineering, this paper proposes a search based semi-supervised ensemble learning approach S3EL. By adjusting the ratio of distribution in training dataset,several Naive Bayes classifiers are built as the base learners, then a small amount of labeled target instances and genetic algorithm are used to combine these base classifiers as a final prediction model. S3EL is compared with other up-to-date classical cross-project defect prediction approaches （such as Burak filter, Peters filter, TCA＋, CODEP and HYDRA） on AEEEM and Promise dataset. Final results show that S3EL has the best prediction performance in most cases under the FI measure.

同期刊论文项目

软件测试和调试过程中的测试用例演化技术研究

期刊论文 33 会议论文 4

稀疏表达下社会化正则方法与低秩分解推荐模型的研究

期刊论文 1

基于退火Memetic算法和贝叶斯网络的回归测试用例集优化研究

期刊论文 9 会议论文 1

面向软件网络模型的复杂软件系统测试框架和技术研究

期刊论文 8

同项目期刊论文

An improved collaborative movie recommendation system using computational intelligence

A hybrid method for test suite reduction using genetic algorithm and heuristic method

GAMFal：一种基于遗传算法的多缺陷定位方

IMPROVED ANNEALING - GENETIC ALGORITHM FOR TEST CASE PRIORITIZATION

应用遗传算法优化子空间的SVM分类算法

静态软件缺陷预测方法研究

一种基于遗传算法的多缺陷定位方法

Optimizing Test Case Execution Schedule using Classifiers

变异测试:原理、优化和应用

回归测试中测试用例集扩充技术研究进展

回归测试中的测试用例优先排序技术述评

回归测试中测试用例集缩减问题的研究

HSFal: Effective Fault Localization using Hybrid Spectrum of Full Slices and Execution Slices

基于切片谱的错误定位框架影响因素分析

一种基于多变量logistic模型的缺陷定位方法

基于程序频谱的动态缺陷定位方法研究

基于程序谱概念格的软件错误定位技术

回归测试用例选择技术研究综述

HFS：一种面向软件缺陷预测的混合特征选择方法

Empirical Studies of a Two-stage Data PreprocessingApproach for Software Fault Prediction

GAMFal：一种基于遗传算法的多缺陷定位方法

面向软件缺陷预测的聚类欠采样集成方法

静态软件缺陷预测方法研究

基于分块切片的软件错误定位技术

适应性安全的可追踪叛徒的基于属性加密方案

一种基于遗传算法的多缺陷定位方法

基于动态切片和关联分析的错误定位方法

探索性软件测试方法及其在嵌入式系统中的应用

空指针异常的自动故障定位方法

具有认知功能的入侵防御系统研究与设计

基于Box-Cox转换的集成跨项目软件缺陷预测方法

基于参数-值替换的错误定位方法

SBFS：基于搜索的软件缺陷预测特征选择框架

多特征分类识别算法融合的网络钓鱼识别技术

一种基于层次切片谱的软件错误定位技术

面向有效错误定位的偶然正确性识别方法

基于程序频谱的动态缺陷定位方法研究

静态软件缺陷预测方法研究

一种基于遗传算法的多缺陷定位方法

基于内容的图像分割方法综述

图像分割方法综述研究

基于BP神经网络的停车诱导泊位预测

期刊信息

《软件学报》
北大核心期刊（2011版）

主管单位:中国科学院
主办单位:中国科学院软件研究所中国计算机学会
主编：赵琛
地址：北京8718信箱中国科学院软件研究所
邮编：100190
邮箱：jos@iscas.ac.cn
电话：010-62562563

国际标准刊号：ISSN：1000-9825
国内统一刊号：ISSN：11-2560/TP
邮发代号:82-367

获奖情况:
2001年入选中国期刊方阵“双百期刊”,2000年荣获中国科学院优秀科技期刊一等奖

国内外数据库收录:
俄罗斯文摘杂志,美国数学评论（网络版）,波兰哥白尼索引,德国数学文摘,荷兰文摘与引文数据库,美国工程索引,美国剑桥科学文摘,英国科学文摘数据库,日本日本科学技术振兴机构数据库,中国中国科技核心期刊,中国北大核心期刊（2004版）,中国北大核心期刊（2008版）,中国北大核心期刊（2011版）,中国北大核心期刊（2014版）,中国北大核心期刊（2000版）

被引量:54609