本课题系统地研究了软件项目管理中的软件开发成本预测问题,涉及缺值处理、特征子集优选和成本预测三个方面。在缺值处理方面,针对软件项目数据集数据量少以及分类属性较连续属性的使用更多的情况,我们分别探讨了基于k-NN 聚类的类均值缺值预测和基于关联规则的方法解决其缺值预测问题。在特征子集优选方面,根据软件工程数据集分类型数据较多、连续型数据夹杂其中和数据量相对较小的特点,以属性和软件成本的关联关系挖掘为切入点,通过对关联关系的深层分析,不仅识别了无关和冗余属性,而且同时也保留了配合属性, 提高了特征子集优选的精度,为后续的软件成本预测奠定了良好的基础。在软件成本预测方面,根据软件开发过程的特点和不同的数据资源,采用两种截然不同的方案进行研究,以相互印证。在第一种方案中,根据项目组自身产生的成本数据建立灰预测模型并预测其后续阶段的开发成本。第二种方案则综合其它已完成项目的历史成本信息和开发中项目的成本数据信息,依次从趋势和模数两方面进行预测。两种方法均获得了良好的预测精度。 本课题发表国际期刊论文7篇,申请发明专利2项,培养研究生5名,获得教育部自然科学二等奖一项。
英文主题词software project management, project effort prediction, Grey System Theory, missing data imputation, feature selection.