位置:成果数据库 > 期刊 > 期刊详情页
一种基于Subject-Action-Object三元组的知识基因提取方法
  • ISSN号:1008-973X
  • 期刊名称:浙江大学学报(工学版)
  • 时间:2013.3.15
  • 页码:385-399
  • 分类:TP391.1[自动化与计算机技术—计算机应用技术;自动化与计算机技术—计算机科学与技术]
  • 作者机构:[1]浙江大学机械工程学系工业工程中心,浙江杭州310027, [2]台州职业技术学院机电一体化技术实验室,浙江台州318000
  • 相关基金:国家自然科学基金资助项目(51175463);国家自然科学基金重点资助项目(71132007); 国家“985工程”三期资助项目
  • 相关项目:智慧的低碳设计和制造一体化技术及系统研究
作者: 许琦|顾新建|
中文摘要:

以专利引证网络为载体,从知识基因稳定性、遗传性以及变异性等基本特征出发,提出一种基于subject-action-object三元组的知识基因提取方法.应用连接度算法分析专利引证关系,挖掘引证专利和被引专利之间继承和发展的知识流,建立知识进化轨迹;利用文本语法分析技术,从专利权利要求书中提取subject-action-object三元组;基于语义词库WordNet进行语义加工,计算语义相似度,合并同义的subject-action-object三元组,绘制知识基因图谱.从美国专利数据库中采集了5 073项1975—1999年授权的数据挖掘领域的相关专利,分析了专利的地区分布情况和年度分布情况.从NBER(National Bureau of Economic Research)的专利数据集中查询得到专利引证关系,利用网络分析软件Pajek构建专利引证网络,作为实验数据样本,对所提出的知识基因提取方法进行验证.实验结果表明:所提取的subject-action-object三元组具备了知识基因稳定性、遗传性和变异性等特征,可以作为知识基因的一种表现形式.

英文摘要:

Taking the patent citation network as carrier and the basic characteristics of knowledge gene as extraction principle,such as stability,hereditary and variability,this work proposed a subject-action-object-triples-based method for extraction of knowledge gene.First,the connectivity algorithm is applied to analyze the patent citation relationship,mine the knowledge flow of inheritance and development between citing patents,and cited patents and establish the knowledge evolutionary trajectory.Then,the text parsing technology was used to extract the subject-action-object triples from patent claims.And last,semantic processing was carried out based on semantic repository WordNet to compute semantic similarity,combine synonymous subject-action-object triples,and draw knowledge genetic map.This work collected 5 073 patents related to data mining which was granted between 1975 to 1999 from database of United States Patent and Trademark Office.The geographical distribution and annual distribution of the patents were analyzed.Query from the patent data set National Bureau of Economic Research(NBER) to get patent citation relations and use the network analysis software Pajek to build patent citation network.Taking it the patent citation metwork as experimental data,the proposed knowledge gene extraction method was validated.The experimental results show that the extracted subject-action-object triples possess the basic characteristics of knowledge gene,so they can be used as a kind of form of knowledge gene.

同期刊论文项目
期刊论文 61 会议论文 1 著作 2
同项目期刊论文
期刊信息
  • 《浙江大学学报:工学版》
  • 北大核心期刊(2011版)
  • 主管单位:教育部
  • 主办单位:浙江大学
  • 主编:岑可法
  • 地址:杭州市浙大路38号
  • 邮编:310027
  • 邮箱:xbgkb@zju.edu.cn
  • 电话:0571-87952273
  • 国际标准刊号:ISSN:1008-973X
  • 国内统一刊号:ISSN:33-1245/T
  • 邮发代号:32-40
  • 获奖情况:
  • 2000年获浙江省科技期刊质量评比二等奖,中国期刊方阵“双效”期刊
  • 国内外数据库收录:
  • 俄罗斯文摘杂志,美国化学文摘(网络版),波兰哥白尼索引,德国数学文摘,荷兰文摘与引文数据库,美国工程索引,美国剑桥科学文摘,英国科学文摘数据库,日本日本科学技术振兴机构数据库,中国中国科技核心期刊,中国北大核心期刊(2004版),中国北大核心期刊(2008版),中国北大核心期刊(2011版),中国北大核心期刊(2014版)
  • 被引量:21198