软件项目开发成本估算需要对大量的项目进行研究,并且这些项目都带有众多属性。选择所有的项目及其所有的属性进行估算建模并不现实,因此需要研究项目之间以及项目的属性之间的关系。本研究拟提出一种熵值类比优化算法EBAO(Entropy Based Analogy Optimization)优化权重的加权类比模型估算软成本。该方法在计算项目估算能力的类比相关度矩阵中计算不同类型变量的标准化的局部相关度H(Lsim),并提出全局相关度量算法H(Gsim),用加权信息熵增益作为衡量项目之间相关性的标准。本研究通过EBAO方法用来优化类比估算中各个特征属性的权重,将利用国际通用软件成本估算历史数据集ISBSG对提出的方法进行统计学多模型验证。本申报课题的研究工作将为软件成本估算模型中的项目及关键的成本估算数据集合的选择提供新视角的理论依据和一种通用的方法。
Software Effort Estimation;complex data types;relevance evaluation;feature selection;non-orthogonal spance distance
软件项目开发成本估算需要对大量的项目进行研究,并且这些项目都带有众多属性。选择所有的项目及其所有的属性进行估算建模并不现实,因此需要研究项目之间以及项目的属性之间的关系。本研究提出了引入信息熵计算到类比估算模型的近似度计算方法,提出EBAO(Entropy Based Analogy Optimization)权重优化的加权类比模型方法。该方法在计算项目估算能力的类比相关度矩阵中计算不同类型变量的标准化的局部相关度H(Lsim),并提出基于图聚类的全局相关度量算法H(Gsim),用非正交空间坐标来定义项目之间相关性的标准,并利用国际通用软件成本估算历史数据集ISBSG对提出的方法进行统计学多模型验证,为软件成本估算模型中的项目及关键的成本估算数据集合的选择提供新视角的理论依据和一种通用的完整方法。实验表明,根据复杂数据类型属性相关性度量方法设计出的属性选择方法能准确找出合适的复杂数据类型属性,提升软件成本预测准确度,针对不同数据集和对比方法,MMRE指标平均降低11%,Pred(0.25)指标平均提升23%。基于属性聚类的属性选择方法降低MMRE指标5%~13%左右,提升Pred(0.25)指标12%左右。基于非正交坐标基的属性权重设置方法平均降低MMRE指标30%,平均提升Pred(0.25)指标15%。目前项目研究达到预期设计目标,并将在下一阶段结合敏捷开发和大数据分析对软件成本度量进行进一步的深入研究。