位置:成果数据库 > 期刊 > 期刊详情页
基于大数据挖掘的科技项目查重模型研究
  • ISSN号:1002-1167
  • 期刊名称:《图书馆论坛》
  • 时间:0
  • 分类:G311[文化科学]
  • 作者机构:中国科学技术信息研究所,北京100038
  • 相关基金:本文受国家自然科学基金“大数据挖掘在科技项目查重中的应用研究”(编号:71303223)的资助.
中文摘要:

整合科技项目所产出成果的信息能间接反映项目的研究内容,可以弥补项目查重过程中申报书难以获取的不足,具有重要的研究意义。本文提出一种整合科技项目相关产出信息的数据模型。该模型通过整合项目产出的科技报告、学术论文和科技成果等信息,抽取其中的关键词、标题和摘要等对项目的研究内容进行准确的描述,并强化了项目负责人和承担机构等辅助信息对项目查重的重要性,从而为解决项目查重问题提供客观的数据支撑。

英文摘要:

Information integration of research project outputs which are closely related to research contents can represent the research content of a project without the project proposal. This indirect description method is of important research value for the similar project detection. This paper proposed a data integration model of research project outputs, which precisely represented the research content of a project with keywords, titles and abstracts extracted from its published reports, papers and achievements. The information of principle investigator and research organization was also introduced and applied to reinforce the similarity calculation. This model will provide data support and lay the foundation for similar project detection.

同期刊论文项目
同项目期刊论文
期刊信息
  • 《图书馆论坛》
  • 北大核心期刊(2011版)
  • 主管单位:广东省文化厅
  • 主办单位:广东省立中山图书馆
  • 主编:刘洪辉
  • 地址:广州文明路213号
  • 邮编:510110
  • 邮箱:tsglt@vip.163.com
  • 电话:020-83360705
  • 国际标准刊号:ISSN:1002-1167
  • 国内统一刊号:ISSN:44-1306/G2
  • 邮发代号:46-127
  • 获奖情况:
  • 先后3次评为中国优秀图书馆学期刊,广东省第二届优秀社科期刊
  • 国内外数据库收录:
  • 中国中国人文社科核心期刊,中国北大核心期刊(2004版),中国北大核心期刊(2008版),中国北大核心期刊(2011版),中国北大核心期刊(2014版),中国国家哲学社会科学学术期刊数据库,中国北大核心期刊(2000版)
  • 被引量:46660