随着语义Web的快速发展,语义Web数据不断增长。语义Web中对象共指的消解是识别语义Web中指称真实世界相同对象的不同标识,并消除描述这些标识的RDF数据之间不一致性的过程,它对于语义Web数据的搜索、集成和管理具有重要作用。面对语义Web中数以亿计的对象、以及对象之间异构性强等特点,单纯依赖属性值比较或语义等价的传统方法已难以应对。本项目研究语义Web中对象共指的消解模型、对象共指的识别方法、数据冲突的消解方法、以及相应的支撑技术。项目力图在对象共指的自训练式消解模型、基于属性可判别度和可匹配度的对象共指识别方法、以及基于信任度传播的数据冲突消解方法等方面有所创新。项目拟将研究成果集成到一个语义Web对象搜索系统中,研究面向用户交互的对象共指消解技术。本项目研究中形成的新模型、方法和技术对于语义Web的发展、语义Web应用、以及基于语义Web数据的软件开发具有重要意义。
Object coreference resolution;Entity linkage;Semantic Web;Data integration;
随着语义Web的快速发展,语义Web数据不断增长。语义Web中对象共指的消解是识别语义Web中指称真实世界相同对象的不同标识,并消除描述这些共指对象的RDF数据之间不一致性的过程。语义Web中对象共指的消解是当前语义Web研究中的一个核心问题,本项目探索了语义Web中对象共指消解的创新模型、方法和技术,主要贡献如下 全面调研了语义Web中对象共指消解的本质特性和最新研究进展,提出了基于自训练模型的新型对象共指消解模型,以实现对于大规模、异构语义Web对象的自举式消解。分别设计了基于属性局部可辨识度和全局可辨识度的对象共指识别方法,以准确、全面地识别对象共指。同时,提出了基于MapReduce框架的并行算法,以提高对象共指识别的效率。另外,还提出了基于URI解引用和相似度计算的数据冲突消解方法,并宏观分析了当前语义Web中对象的“别名”现象。通过集成以上模型和方法,开发了一个全自动的在线语义Web对象共指消解系统,称为ObjectCoref,为大规模语义Web对象共指的消解提供了支撑和实证。上述工作也为后续系统深入地研究基于大众参与的语义Web实体链接方法打下了基础。