位置:成果数据库 > 期刊 > 期刊详情页
基于语义结构的科技论文抄袭检测
  • ISSN号:1000-0135
  • 期刊名称:《情报学报》
  • 时间:0
  • 分类:H152.3[语言文字—汉语]
  • 作者机构:[1]大连理工大学计算机科学与工程系,大连116024
  • 相关基金:国家自然科学基金资助项目(编号:60373095 60673039 60973068); 国家社会科学基金(编号:08BTQ025); 国家863高科技计划资助项目(编号:2006AA01Z151)
中文摘要:

当前科技论文抄袭比较严重,但针对科技论文抄袭的自动检测的研究还不够。科技论文的抄袭检测是重复的表示形式之一,可按照改动的程度分为全文抄袭、章节抄袭、段落抄袭、句子抄袭、同义词替换抄袭、思想抄袭等几种表现形式。本文针对剽窃全部或全部原文,并加以删改或段落移动的情况,首先采用基于bootstrapping算法扩展科技论文的主题词,根据主题词的交集划分重复检测候选组;然后提出基于滑动窗口的加权相似度算法,并通过相似曲线图较为直观的表现计算结果,取得了较好的研究效果。

英文摘要:

Nowadays,scientific paper duplication is serious,but there are few academic searches on automatically checking it.Copy detection is one form of duplication that can be divided into several forms,such as full text copying,sections copying, paragraphs copying,sentence copying,synonyms replacement copying,idea copying.This paper makes an attempt at to detect full text copying,paragraphs movement or synonyms replacement copying,but not idea copying.First this thesis groups scientific papers by topic words which are enlarged by bootstrapping,then brings forward the method to calculate similarity by weight based on gliding bezel which is divided by chapters and adopts similarity curve graphs that is relatively intuitive to represent the calculated results,which comes out a good research effect.

同期刊论文项目
同项目期刊论文
期刊信息
  • 《情报学报》
  • 北大核心期刊(2011版)
  • 主管单位:中国科学技术协会
  • 主办单位:中国科学技术情报学会 中国科学技术信息研究所
  • 主编:戴国强
  • 地址:北京复兴路15号
  • 邮编:100038
  • 邮箱:qbxb@istic.ac.cn
  • 电话:010-68598273
  • 国际标准刊号:ISSN:1000-0135
  • 国内统一刊号:ISSN:11-2257/G3
  • 邮发代号:82-153
  • 获奖情况:
  • 1992年全国优秀科技期刊评比二等奖,1997年中国科协优秀科技期刊三等奖,被国外4种检索工具录用
  • 国内外数据库收录:
  • 俄罗斯文摘杂志,美国剑桥科学文摘,英国科学文摘数据库,日本日本科学技术振兴机构数据库,中国中国人文社科核心期刊,中国中国科技核心期刊,中国北大核心期刊(2004版),中国北大核心期刊(2008版),中国北大核心期刊(2011版),中国北大核心期刊(2014版),中国北大核心期刊(2000版)
  • 被引量:19778