标签为面向Internet的构件检索提供了一种动态的分类管理方法。标签的数量和质量难以保障、检索效率低是目前标签系统中存在的两个主要问题。本项目的研究目标是提出并建立一套软件构件自动标签的方法及应用技术。针对如何自动获得高质量的构件标签以及如何自动组织标签支持高效的构件检索,深入研究自动生成构件标签、自动识别标签间关联关系以及自动组织标签支持构件检索等关键技术,提出一种通用的、Web搜索引擎和特定站点抓取结合的构件信息收集和整理机制、一种自适应的软件构件标签的自动生成算法、一种面向领域的标签间关系分析方法,给出一个基于标签构造的构件知识本体,以及一种具有自优化能力的构件检索模式。研发相应的支持系统原型,以提高Internet环境下构件检索的效率,支持软件复用的成功进行。
software component;tag;classification;component search;component information
标签系统为大规模软件构件库提供了一种动态的分类管理方法。如何保障标签的数量和质量以及如何提高检索效率是当前构件标签系统面临的两个主要问题。以此为目标,本项目研究提出一套软件构件自动标签的方法及应用技术框架,并对该框架中的多个技术点进行了较深入的研究,取得了较好的研究成果。针对如何保障标签数量和质量的问题,提出了一种基于互联网的软件构件信息自动收集机制、一个自适应的软件构件标签的自动生成算法;针对如何提高构件检索效率的问题,研究探讨了自然语言与标签系统相结合的软件构件检索模式,提出了基于疑问词的检索优化方法、基于多源信息的软件构件评估与推荐方法。项目的研究内容包括构件信息的自动收集和整理、构件标签的自动生成方法、标签的组织和管理、智能检索方法及辅助系统原型等多个方面。三年以来,本项目共发表(含已录用待发表)学术论文11篇(含国际会议10篇),获得了技术发明专利1项,获得了软件著作权1项。