东篱科研大数据发现系统（DRDS）

位置：成果数据库 > 期刊 > 期刊详情页

跨机构的软件缺陷集成采样预测研究

ISSN号：1000-1220
期刊名称：《小型微型计算机系统》
时间：0
分类：TP311[自动化与计算机技术—计算机软件与理论;自动化与计算机技术—计算机科学与技术]
作者机构：[1]南京航空航天大学计算机科学与技术学院,南京210016, [2]南京大学计算机软件新技术国家重点实验室,南京210093
相关基金：国家自然科学基金项目（41301407）资助.

关键词：跨机构, SMOTE, K-means, 采样, 集成学习, cross-company, SMOTE, K-means, sampling, ensemble learning

中文摘要：

针对在本机构的历史缺陷数据缺乏的情况下，如何合理利用跨机构的缺陷数据进行预测的问题，提出一种基于迁移的跨机构软件缺陷集成采样预测方法．首先利用跨机构的源缺陷数据和所要预测的目标缺陷数据共有的特征属性进行K—NN过滤，合理选择带标记的跨机构缺陷数据；然后，综合利用SMOTE过采样和K-means聚类降采样解决所选择的跨机构缺陷数据中的不平衡问题；最后，对平衡后的数据，进行集成投票训练，并在目标数据上验证预测分类的效果．实验结果表明，该缺陷预测方法能够在保持较高的查全率的同时，显著降低误报率，具有一定的实际指导测试过程的能力．

英文摘要：

In the case of lack of within-company historical defect data,this paper presents a novel algorithm, which makes use of the cross-company data to build software defect prediction. Firstly,we utilize K-NN filter to calculate the distances between the source data and target data on the same attributes, then choose the top k sample as the similar data. After that, we use SMOTE and K-means clustering methods to balance the similar data. Lastly, we utilize multiple single classifiers to ensemble learning. Experimental results show that this algorithm has good performance, obtaining a higher true positive rate while significantly reducing the false alarm rate. It means that this method has some practical capability to guide testing process.

同期刊论文项目

支持弱链路感知的微地理信息管理若干关键问题研究

期刊论文 6

同项目期刊论文

链路质量感知的无线传感器网络生命最大化算法

时间区间上的不确定移动对象距离范围查询

一种异构集群中能量高效的大数据处理算法

移动对象的动态反向最远邻查询算法

无线传感器网络中安全高效的空间数据聚集算法

期刊信息

《小型微型计算机系统》
中国科技核心期刊

主管单位:中国科学院
主办单位:中国科学院沈阳计算技术研究所
主编：林浒
地址：沈阳市浑南新区南屏东路16号
邮编：110168
邮箱：xwjxt@sict.ac.cn
电话：024-24696120 024-24696190-8870

国际标准刊号：ISSN：1000-1220
国内统一刊号：ISSN：21-1106/TP
邮发代号:8-108

获奖情况:
中国自然科学核心期刊,中国科学引文数据库来源期刊

国内外数据库收录:
俄罗斯文摘杂志,波兰哥白尼索引,荷兰文摘与引文数据库,美国剑桥科学文摘,英国科学文摘数据库,日本日本科学技术振兴机构数据库,中国中国科技核心期刊,中国北大核心期刊（2004版）,中国北大核心期刊（2008版）,中国北大核心期刊（2011版）,中国北大核心期刊（2014版）,中国北大核心期刊（2000版）

被引量:23212