位置:成果数据库 > 期刊 > 期刊详情页
基于引文的科技文献主题抽取研究
  • ISSN号:1000-7490
  • 期刊名称:《情报理论与实践》
  • 时间:0
  • 分类:G254.2[文化科学—图书馆学]
  • 作者机构:华中师范大学信息管理学院,湖北武汉430079
  • 相关基金:本文为国家社会科学基金项目“基于语义理解的多模态信息融合与集成服务研究”(项目编号:11CTQ017)和中央高校基本科研业务费专项资金项目“社交化问答平台信息质量感知模型及推荐算法研究”(项目编号:CCNU16A02035)的成果.
中文摘要:

[目的/意义]主题抽取的效果对于信息检索、自动标引、自然语言处理具有重要的价值,提高主题抽取的效果,既能改善检索系统主题检索准确性,又能够帮助学者更加高效地了解文献的主要思想。文章研究并探讨了从引用内容中抽取文献主题的有效性。[方法/过程]选取自然语言处理领域文献为研究对象,利用文献之间的引用与被引用关系抽取引用内容,进行分词并计算权重;将引用内容、全文抽取的候选词进行专家打分评价效果并将其与关键词对比,使用F值评价两种语料库抽取候选词的优劣。[结果/结论]通过专家打分及计算F值,发现引用内容在抽取候选词方面具有明显优势。

英文摘要:

[ Purpose/significance ] The effect of subject extraction has important value on information retrieval, automatic indexing, and natural language processing. Improving subject extraction can not only increase the accuracy of the retrieval system, but also help researchers understand the topics of papers more efficiently. This paper discusses the effectiveness of extracting subject from citations. [ Method/process ] The paper selects papers in natural language processing to do the study. Using the citing and cited relationship among papers to extract citation content, perform word segmentation and calculate the term weight. The paper uses the expert scoring method to evaluate the quality of candidate terms of citation content and the full text and applies the F-measure to evaluate their pros and cons. [ Result/conclusion] By evaluating the candidate terms of citation content and full text by expert scoring method and F-measure, the paper finds that citation contents have obvious advantages in extracting candidate words.

同期刊论文项目
同项目期刊论文
期刊信息
  • 《情报理论与实践》
  • 北大核心期刊(2011版)
  • 主管单位:中国兵器工业集团公司
  • 主办单位:中国国防科学技术信息学会 中国兵器工业集团第二一零研究所中国兵器工业第二一0研究所
  • 主编:王忠军
  • 地址:北京2413信箱10分箱
  • 邮编:100089
  • 邮箱:ita@onet.com.cn
  • 电话:010-68961793 68963306
  • 国际标准刊号:ISSN:1000-7490
  • 国内统一刊号:ISSN:11-1762/G3
  • 邮发代号:82-436
  • 获奖情况:
  • 国内外数据库收录:
  • 中国中国人文社科核心期刊,中国北大核心期刊(2004版),中国北大核心期刊(2008版),中国北大核心期刊(2011版),中国北大核心期刊(2014版),中国北大核心期刊(2000版)
  • 被引量:26785