本体学习是语义Web能否成功的关键之一。已有的本体学习主要面向术语、同义词、概念、概念层次、关系和关系层次,而公理模式和一般公理的研究很少。已有的公理学习方法包括归纳逻辑程序设计和直接学习描述逻辑,但是只能学习OWL DLP公理或部分OWL DL公理,例如概念的定义公理等。统计关系学习集逻辑、概率论和机器学习于一身,可以学习一阶谓词逻辑,从表达能力上讲一阶谓词逻辑包含所有OWL DL公理。但是到目前为止,还没有采用统计关系学习方法学习OWL DL公理的报道。虽然语义Web数据已经很多,例如链接开放数据,但是公理的完备性还有待提高。因此本项目申请针对语义Web数据的特点,提出一种面向OWL DL公理的统计关系学习模型与方法;研究将统计关系学习模型转换为OWL DL公理的方法;研究基于链接开放数据构造OWL DL公理学习测试基准的方法;基于以上方法和技术,构造OWL DL公理学习工具与应用。
Ontology Learning;Statistical Relational Learning;Semantic Web;;
本体学习是语义 Web 能否成功的关键之一。已有的本体学习主要面向术语、同义词、概念、概念层次、关系和关系层次,而公理模式和一般公理的研究很少。已有的公理学习方法包括归纳逻辑程序设计和直接学习描述逻辑,但是只能学习OWL DLP公理或部分OWL DL公理,例如概念的定义公理等。统计关系学习集逻辑、概率论和机器学习于一身,可以学习一阶谓词逻辑,从表达能力上讲一阶谓词逻辑包含所有 OWL DL公理。但是到目前为止, 还没有采用统计关系学习方法学习OWL DL公理的报道。 因此,本项目基于统计关系学习提出一种面向OWL DL公理学习的有向概率图模型BelNet。对其边的方向及概率查询进行扩展,得到改进的有向概率图模型BelNet+。在无向图模型Markov逻辑网的基础上提出一种二阶Markov逻辑网,提出一种针对带噪音链接数据的统计关系学习方法。针对本体学习、生成或修改可能会造成的本体不一致性,提出一种解决偏序本体不一致性的方法。在观点挖掘领域,提出一种规则子集的自动选择方法;在评价对象抽取方面,提出一种基于终生学习的无监督方法。 相关研究成果包括SCI源期刊论文4篇,EI检索论文15篇,其中CCF推荐A类会议长文2篇,B类会议长文2篇,短文1篇。一本英文专著的其中一章。获得ISWC 2011最佳博士论坛建议奖和NLP&CC 2013大会最佳论文奖。获批专利1项,申请专利2项。培养博士2名,硕士14名。