本项目的研究工作关注于基于RDF的软件工程数据管理。项目组成员搜集和整理了各种类型的软件工程数据,并对这些数据进行了语义标注和抽取处理,通过与公开的语义数据集DBpedia进行整合,形成了一个海量的RDF数据集。基于这个数据集,项目组成员完成了以下的研究工作 1、设计了基于OWL的软件工程数据描述模型,该模型不仅能够对源代码、需求、测试、版本和缺陷数据进行描述,同时还对这些数据之间的语义关联进行了描述; 2、提出了基于Hash技术的RDF数据存储和查询解决方案,将RDF三元组解析后存储在关系表中,并采用Hash方法将每个节点所对应的入边和出边保存成一个二进制向量,在查询时利用Hash技术对查询图中的每个非页节点进行快速定位,从而提高了检索效率; 3、实现了一个基于集群计算的分布式RDF数据处理引擎,支持对海量RDF数据的存储和查询。该系统取得了软件著作权证书。 4、通过对大型软件系统开发过程中的缺陷报告数据进行管理和分析,验证了本项目研究工作的有效性。综上所述,本项目的研究目标明确,研究工作进展顺利,项目管理符合相关规定,研究成果达到了项目任务书所列研究目标的要求。
英文主题词Software Engineering Data; RDF/OWL; Data Modeling; Query Processing