东篱科研大数据发现系统（DRDS）

位置：成果数据库 > 期刊 > 期刊详情页

双语影视知识图谱的构建研究

ISSN号：0479-8023
期刊名称：《北京大学学报：自然科学版》
时间：0
分类：TP391[自动化与计算机技术—计算机应用技术;自动化与计算机技术—计算机科学与技术]
作者机构：清华大学计算机科学与技术系知识工程实验室,北京100084
相关基金：国家重点基础研究发展计划（2014CB340504）; 国家自然科学基金委员会与法国国家科研署双边合作协议（61261130588）; 清华大学自主科研项目（20131089256）; 国家科技支撑计划（2014BAK04B00）; THU-NUS下一代搜索联合研究中心项目资助

关键词：影视本体, 双语, 知识图谱, movie ontology, bilingual, knowledge graph

中文摘要：

提出一种双语影视知识图谱（BMKG）的构建流程。通过半自动化的方法构建了双语影视本体（BMO）,将各个影视数据源对齐到BMO,以保持异构数据源的语义描述一致性。在知识链接方面,在充分挖掘和利用领域特征的基础上,采用基于Word2Vec和TFIDF两种向量模型的实体相似度计算方法,使相似度特征增加一倍,大大提升了模型的链接效果。在实体匹配方面,提出基于相似度传播算法的实体匹配算法,并利用影视数据源之间的内在联系,克服了跨语言实体之间计算相似度的语言障碍。实验结果表明,当阈值取到0.75以上时,实体匹配的准确率都能达到90%左右。此外,还建立了影视知识图谱共享平台,并提供开放性的数据访问和查询接口。

英文摘要：

This paper proposes a method to construct Bilingual Movie Knowledge Graph（BMKG）. The authors first builds Bilingual Movie Ontology（BMO） through a semi-automatic way, and aligns each data source with it in order to ensure semantic consistency of heterogeneous data sources. For entity linking, the proposed method makes best use of the field characteristics and calculate entity similarity based on both Word2 Vec and TFIDF models, which greatly improve entity linking. For entity matching, a similarity flooding based algorithm is proposed, which utilizes the intrinsic links between the movie data sources, addressing the problem of similarity computation between cross-lingual entities. The experiment results show that the entity matching precision is over 90% when the threshold is above 0.75. In addition, a movie knowledge graph sharing platform is also built to provide open data access and query interface.

同期刊论文项目

跨语言环境中语义链接关键技术研究

期刊论文 2

同项目期刊论文

RiMOM-IM： A Novel Iterative Framework for Instance Matching

期刊信息

《北京大学学报：自然科学版》
中国科技核心期刊

主管单位:教育部
主办单位:北京大学
主编：赵光达
地址：北京海淀区海淀路52号
邮编：100871
邮箱：xbna@pku.edu.cn
电话：010-62756706

国际标准刊号：ISSN：0479-8023
国内统一刊号：ISSN：11-2442/N
邮发代号:2-89

获奖情况:
1997年第二届全国优秀科技期刊评比一等奖,1999年教育部“优秀自然科学学报一等奖”,1999年获首届国家期刊奖,中国期刊方阵“双高”期刊

国内外数据库收录:
俄罗斯文摘杂志,美国化学文摘（网络版）,美国数学评论（网络版）,德国数学文摘,荷兰文摘与引文数据库,英国科学文摘数据库,英国动物学记录,日本日本科学技术振兴机构数据库,中国中国科技核心期刊,中国北大核心期刊（2004版）,中国北大核心期刊（2008版）,中国北大核心期刊（2011版）,中国北大核心期刊（2014版）,英国英国皇家化学学会文摘,中国北大核心期刊（2000版）

被引量:18270