位置:成果数据库 > 期刊 > 期刊详情页
基于SAO结构的中文相似专利识别算法及其应用
  • ISSN号:1000-0135
  • 期刊名称:《情报学报》
  • 时间:0
  • 分类:TP18[自动化与计算机技术—控制科学与工程;自动化与计算机技术—控制理论与控制工程]
  • 作者机构:[1]北京工业大学经济与管理学院,北京100124, [2]中国科学技术信息研究所,北京100038
  • 相关基金:本文系北京市自然科学基金资助项目(9132005)和北京工业大学人文社会科学基金项目(X5011019201201)的研究成果之一.
中文摘要:

本文根据中文专利权利要求书的特点,提出了基于SAO结构的中文相似专利识别算法。首先对权利要求书进行依存句法分析和语义角色标注,从中抽取出SAO(主-谓-宾)结构。其次计算SAO结构之间的相似度,由SAO结构的相似度得出权利要求书相似度,并对结果进行多维尺度分析(MDS)和聚类分析,判断专利间相似性。最后将该方法运用到专利无效中,取得了良好的效果。此外,本文需要进一步提高SAO结构抽取的准确性,也需要提高该方法在实际应用中的有效性。

英文摘要:

According to the characteristics of Chinese patent claims, this article proposes a method of Chinese similar patents recognition based on SAO structures. First, based on the dependency parsing analysis and semantic role labeling for patent claims, we extract SAO (Subject-Action-Object) structures. And then, this article calculates the similarity between SAO structures, and obtains patent claims similarity based on SAO structures similarity. The paper takes the multidimensional scaling (MDS) and cluster analysis on the above resuhsto judge the similarity between patents. Finally we apply the method to patents invalidity and achieve a good result. Additionally, this article needs to further improve the accuracy of extracted SAO structures, but also to strengthen the effectiveness of the method in practical applications.

同期刊论文项目
同项目期刊论文
期刊信息
  • 《情报学报》
  • 北大核心期刊(2011版)
  • 主管单位:中国科学技术协会
  • 主办单位:中国科学技术情报学会 中国科学技术信息研究所
  • 主编:戴国强
  • 地址:北京复兴路15号
  • 邮编:100038
  • 邮箱:qbxb@istic.ac.cn
  • 电话:010-68598273
  • 国际标准刊号:ISSN:1000-0135
  • 国内统一刊号:ISSN:11-2257/G3
  • 邮发代号:82-153
  • 获奖情况:
  • 1992年全国优秀科技期刊评比二等奖,1997年中国科协优秀科技期刊三等奖,被国外4种检索工具录用
  • 国内外数据库收录:
  • 俄罗斯文摘杂志,美国剑桥科学文摘,英国科学文摘数据库,日本日本科学技术振兴机构数据库,中国中国人文社科核心期刊,中国中国科技核心期刊,中国北大核心期刊(2004版),中国北大核心期刊(2008版),中国北大核心期刊(2011版),中国北大核心期刊(2014版),中国北大核心期刊(2000版)
  • 被引量:19778