位置:立项数据库 > 立项详情页
面向对象系统中经济有效的潜在缺陷模块推荐模型研究
  • 项目名称:面向对象系统中经济有效的潜在缺陷模块推荐模型研究
  • 项目类别:面上项目
  • 批准号:61073029
  • 申请代码:F020202
  • 项目来源:国家自然科学基金
  • 研究期限:2011-01-01-2013-12-31
  • 项目负责人:周毓明
  • 负责人职称:教授
  • 依托单位:南京大学
  • 批准年度:2010
中文摘要:

本课题旨在开发经济有效的潜在缺陷模块推荐模型。该模型的输出是"潜在缺陷模块序列"即按照包含缺陷的可能性从大到小排序的模块序列,其中模块为面向对象系统中的类。与传统的缺陷模块预测模型相比一方面,该模型建立在源代码等信息的基础上,不需要那些花费很长时间和不菲代价才能收集到的历史缺陷和过程度量信息,因而构建成本低;另一方面,该模型的输出是"潜在缺陷模块序列"而不是"潜在缺陷模块集",用户可根据资源的约束情况从该序列中选取适量模块进行代码审查/软件测试,因此更为实用。特别地,与随机选择模型和基于模块规模的排序模型等相比,当用户按照该模型推荐的模块序列选择模块进行审查/测试时,花费同等工作量能发现更多的缺陷。本项目的主要研究内容包括: (1)基于无监督/半监督机器学习的潜在缺陷模块推荐模型研究;(2)基于因果图的潜在缺陷模块推荐模型研究;(3)潜在缺陷模块推荐模型的实验验证;(4)相应工具开发。

结论摘要:

在软件开发中,开发者需要识别潜在的缺陷模块,以便有针对性地进行审查或者测试,从而尽早地找出并修复缺陷。近年来相关研究结果表明,在考虑模块的审查或者测试工作量时,传统的缺陷预测模型的性能非常差,甚至比不上随机模型的性能。针对上述问题,本课题试图开发经济有效的潜在缺陷模块序列推荐模型,使得其构建成本低、预测有效性高。在课题执行期间,我们重点研究了基于半监督和主动学习的潜在缺陷模块序列预测模型、基于聚类和投票等无监督机器学习方法的潜在缺陷模块序列预测模型、基于因果图的潜在缺陷模块序列预测,并在多个开源系统上进行了实验研究。特别地,我们深入了研究了缺陷预测中的模块规模的混和效应问题,发现规模的混和效应普遍存在,并且是导致传统缺陷预测模型在工作量感知的性能评价下具有很差性能的主要原因。为此,我们提出了一种有效的规模混和效应移除方法。实验结果表明,在移除规模混和效应后,传统缺陷预测模型的工作量感知性能得到大幅度提高,明显优于常用的基准模型,因此具有实用价值。在三年的研究过程中,经过全体课题组成员的共同努力,我们完成了课题的研究内容,总共发表和录用论文9篇。其中,在国外著名期刊上4篇(包括在国际一流期刊《ACM Transactions on Software Engineering and Methodology》上1篇),在国内著名期刊《中国科学:信息科学F辑》英文版上论文2篇。与此同时,在该课题的支持下,已经有4名硕士研究生以课题的研究内容为毕业论文的内容,顺利获得了工学硕士学位。总体上,课题达到了预期的研究目标和人才培养目标。


成果综合统计
成果类型
数量
  • 期刊论文
  • 会议论文
  • 专利
  • 获奖
  • 著作
  • 9
  • 1
  • 0
  • 0
  • 0
相关项目
期刊论文 11 会议论文 4 专利 2
期刊论文 4 会议论文 14
周毓明的项目