随着语义Web的高速发展,本体数据的规模不断增长,人们对语义Web的搜索需求强烈。现有研究在搜索方式、需求种类支持和交互友好性等方面存在很大的局限性。针对用户复杂多样的信息需求,本项目将探索式搜索的思想引入到语义Web搜索中,研究面向语义Web的探索式搜索模型、查询解释方法、本体数据的呈现方法、本体数据的索引方法以及相应的支撑技术。项目力图在基于认知科学理论的探索式语义Web搜索模型、本体驱动的交互式查询解释方法、以实体为中心的本体数据摘要与呈现方法以及支撑探索式搜索的本体数据索引方法上有所创新,并将研究成果在一个语义Web搜索原型系统中实现及开展实验。项目研究中形成的新模型、新方法与新技术对于推动语义Web和Web搜索的发展,对于提升语义Web面向普通用户的信息服务水平,均将起到重要的指导和促进作用。
Semantic Web;Exploratory Search;Query Understanding;Entity Summarization;Ontology Summarization
近年来迅速发展的语义Web技术是对Web的一种扩展,通过将信息表示为基于本体语义的结构化数据并公开发布,能够增强Web应用之间的互操作性。语义Web的规模增长很快,然而其面向Web用户直接提供信息服务的程度却不充分,主要因为传统的Web搜索技术难以直接用于语义Web上的搜索,用户搜索体验不尽人意。为此,本项目将探索式搜索的思想引入到语义Web搜索中,重点研究面向语义Web的探索式搜索模型、本体驱动的交互式查询解释方法、本体数据的呈现方法以及本体数据的索引等支撑技术,以更好满足用户复杂多样的信息需求并提升交互的友好性,从而推动语义Web和Web搜索技术的协同发展。 项目组在“本体驱动的交互式查询解释方法”方面取得了较丰富的研究成果。在面向实体间关联的探索式搜索方面提出了一种从路径关联中基于本体归纳出关联模式作为探索选项的方法,该项理论成果获得了语义Web领域顶级国际会议ISWC的最佳研究论文提名奖。在面向实体搜索的关键词查询解释方面提出的一种新方法申请了一项发明专利,并已被应用于与工业界合作研发的实际系统中。 项目组在“本体数据的呈现方法”方面重点研究了实体描述数据和本体的摘要问题,延续了在相关领域的国际优势地位。在实体描述的摘要方面开展了一项大规模的标准摘要构建和分析工作,为后续研究奠定了基础,继而率先提出了一种双实体描述的对比式摘要方法以帮助用户更高效地完成实体共指消解任务。在本体摘要方面提出了两种新的图模型来表示本体内部术语之间的关联,继而形成了更好的摘要方法,并已应用于自主研发的本体搜索引擎中。 项目组在“面向语义Web的探索式搜索模型”方面开展了实用价值较高的研究。提出了两种新型的基于语义的相关本体/实体推荐方法,并已分别应用于自主研发的本体搜索引擎和语义Web浏览系统中。在本体相关性方面开展的实验分析从不同角度展示了现有本体之间相关性的全景图结构,对语义Web领域的研发人员具有较高的参考价值。 总体而言,项目达到了预期研究目标。项目组已发表学术论文14篇,其中6篇发表在CCF推荐的国际期刊和会议上(包括1篇B类国际会议最佳研究论文提名),3篇发表在其它高水平国际会议上,1篇发表在国内核心期刊上。项目组已申请发明专利1项,登记计算机软件著作权1项。项目取得的主要理论成果已落实在Falcons、SView、Explass以及RelClus等在线系统中。