位置:成果数据库 > 期刊 > 期刊详情页
基于不同信息资源专利查询扩展方法的研究
  • ISSN号:1000-0135
  • 期刊名称:《情报学报》
  • 时间:0
  • 分类:G359.21[文化科学—情报学]
  • 作者机构:大连理工大学,大连116024
  • 相关基金:国家自然科学基金资助项目(编号:61272370,61402075)、国家863高科技计划资助项目(编号:2006AA01Z151)、辽宁省自然科学基金(编号:201202031,2014020003),中央高校基本科研业务费专项资金资助.
中文摘要:

近年来查询扩展方法已被证明能有效地提升专利检索的平均性能,而大多数查询扩展方法仅使用实验数据集进行扩展词选择,很少有研究将外部信息源利用于专利检索,提高检索准确率。因此,本文在实验数据集基础上,同时采用一种利用外部资源的方法提升专利检索性能。该方法利用谷歌搜索引擎优化查询扩展方法的性能,并采用排序学习方法LambdaMART方法融合不同查询扩展方法,对信息源中的不同文本域进行加权处理,从而提升专利检索性能。在TREC数据集上的实验结果表明,基于本文所采用的信息资源进行查询重构的方法有效地提升了专利检索的性能。

英文摘要:

Query expansion methods has been proven to be effective to improve the average performance of patent retrieval, and most query expansion methods use a single source of information experimental data set for query expansion term selection. In contrast, in this paper, we propose a method which exploits external resources for improving patent retrieval besides using experimental data set. We present a learning to rank framework that optimizes the combination of information sources used for effective query expansion terms. The Google search engine is used as external resources to enhance the performance of query expansion methods. We use the learning to rank method LambdaRank to combine approaches to improve patent retrieval by combining different query expansion methods with different text fields weighting strategies from information resources. Experiments on TREC data sets have shown that our method for query formulation is found to be effective to improve patent retrieval performance.

同期刊论文项目
同项目期刊论文
期刊信息
  • 《情报学报》
  • 北大核心期刊(2011版)
  • 主管单位:中国科学技术协会
  • 主办单位:中国科学技术情报学会 中国科学技术信息研究所
  • 主编:戴国强
  • 地址:北京复兴路15号
  • 邮编:100038
  • 邮箱:qbxb@istic.ac.cn
  • 电话:010-68598273
  • 国际标准刊号:ISSN:1000-0135
  • 国内统一刊号:ISSN:11-2257/G3
  • 邮发代号:82-153
  • 获奖情况:
  • 1992年全国优秀科技期刊评比二等奖,1997年中国科协优秀科技期刊三等奖,被国外4种检索工具录用
  • 国内外数据库收录:
  • 俄罗斯文摘杂志,美国剑桥科学文摘,英国科学文摘数据库,日本日本科学技术振兴机构数据库,中国中国人文社科核心期刊,中国中国科技核心期刊,中国北大核心期刊(2004版),中国北大核心期刊(2008版),中国北大核心期刊(2011版),中国北大核心期刊(2014版),中国北大核心期刊(2000版)
  • 被引量:19778