如何在P2P这种分布式计算模式下有效利用网络信息资源,提高信息检索的质量和效率,成为国际前沿研究领域之一。本项目以分布、异构的P2P信息资源为对象,利用其呈现的社区特性,研究基于本体的语义检索策略与模型。首先,借助本体形成社区节点资源与用户信息需求的语义表示,进一步提出两者的语义匹配策略,制定节点信息资源的管理策略,建立语义检索结果的排序模型,形成基于社区的分布式P2P信息资源的语义检索模型;其次,引入P2P的无标度、小世界等特性建立基于社区的语义检索优化模型、利用分众分类与本体相结合及基于标签的社区和资源管理机制建立语义检索改进模型;最后,进行模拟验证并对相关策略和模型予以修正。项目研究成果将在一定程度上丰富传统计算机信息检索的理论和方法,为实现分布式信息环境下节点资源与用户信息需求的语义匹配提供理论依据。相关成果将在分布式知识共享、协同工作、电子商务、电子政务等领域具有广泛应用前景。
Community;peer to peer;semantic information retrieval;scale-free;tags
随着Internet用户数量和检索频率的迅速增长,如何能充分利用P2P环境自身具有的特性有效挖掘和利用分布、异构的P2P信息资源,从语义理解的角度分析信息资源与检索者的检索请求,实现语义层次的查询与匹配,来提高信息检索的质量和效率,是本项目要研究和解决的问题,也是国际前沿研究领域之一。本项目以分布、异构的P2P 信息资源为对象,利用其呈现的社区特性,研究基于本体的语义检索策略与模型。主要内容包括(1)借助本体形成社区节点资源与用户信息需求的语义表示,提出了两者的语义匹配策略、建立了分布式P2P信息资源的管理机制、构建了分布式P2P信息资源的语义检索系统模型、形成了基于社区的P2P语义检索策略和模型;(2)引入P2P 的无标度、小世界等特性建立基于社区的语义检索优化模型、利用分众分类与本体相结合及基于标签的社区和资源管理机制建立语义检索改进模型,提出了一种基于社会化标签的本体构建方法、建立了基于社会化标签的语义检索模型、研究了基于社会化标签的资源管理与推荐方法;(3)在跨社区的P2P语义检索策略方面,通过挖掘各个层次用户的本地资源及搜索历史记录,形成跨社区路由模块和跨社区历史查询记录管理模块,使得查询首先发送到这些节点而不是相关社区的所有节点上。(4)拓展研究了基于信任的P2P社区形成与知识共享。由于P2P网络的开放性、动态性和匿名性等特点,社区中可能会存在大量的恶意行为,通过一种信任机制将P2P网络中的恶意节点进行隔离,利用节点间的知识共享历史来度量其信任程度,并进一步选择信任度高的节点进行知识共享。(5)对基于社区的P2P语义检索系统模型、基于社会化标签的本体构建方法等进行了模拟仿真实验。依托项目研究成果,目前已发表相关学术论文20篇,主要发表在国际期刊、图书情报类核心期刊及国际会议论文集上。其中,国际EI源期刊《International Journal of Services Technology and Management》1篇、国家自然科学基金委管理科学部遴选的A类重要期刊《情报学报》2篇、EI 收录2篇、CSSCI收录15篇。培养硕士研究生9名,已顺利毕业7名。项目研究成果将在一定程度上丰富传统计算机信息检索的理论和方法,为实现分布式信息环境下资源与用户信息需求的语义匹配提供理论依据。在分布式知识共享、电子商务、电子政务等领域具有广泛应用前景。