论文查重子系统的设计与实现文献综述
【内容摘要】当下,互联网技术飞速发展,伴随着科技进步,网络信息爆炸,越来越多的文章中存 在相似的内容。如何准确管理文档以及找到相似的文档,是查重技术存在和发展的原因。论文查重防止论文抄袭的重要手段,可以防止论文重复度过高,防止学术不端的情况。本文将结合TextRank技术和Simhash指纹技术构建论文查重子系统,满足论文查重的需要。本文通过分析文档查重技术现状、TextRank和Simhash学习环境及互联网的高速发展,提出论文查重子系统的研究目标和内容。
【关键词】 查重 Simhash TextRank
一:背景
随着互联网技术飞速发展,生活中越来越多网络信息,抄袭现象也日益增多。自媒体的产生和发表文章的低成本使得文章质量的良莠不齐。互联网飞速的发展带来很多问题,越来越多的人写文章喜欢在网上进行抄袭,这是对学术的不尊重,容易产生学术不端,论文是学术界很重要的一个部分,为了避免学术不端的出现,论文查重子系统的开发与使用关乎极大。因此设计一个合理有效的论文查重系统十分有必要,本次毕业设计开发一款论文查重子系统,进而帮助大家方便进行论文查重,拒绝学术不端。进而帮助学术期刊更好的对论文进行管理,也便利学生进行论文查重。
二:研究的目的和意义
进入21世纪以来,互联网技术飞速发展,论文信息化管理是发展的必然情况。近年来,随着大学生的数量的不断增多,毕业论文的数量越来越多,为了防止论文抄袭重合度过高,论文查重子系统需要进一步优化与实现。毕业设计是带有研究性质的专题研究分析、设计报告,是完成教学任务、培养合格人才的一个重要实践性教学环节。论文查重就是通过测试软件,检查论文和已发表的论文的重合度。重合度过高就会认定你的论文具有抄袭行为,考察一个人的学术道德问题。论文查重子系统的设计与实现的目的在于测试论文的重合度,防止抄袭,拒绝学术不端,营造优秀的学术态度。论文查重子系统提供了对科研服务平台的论文进行数据查重,检查新论文重合度是否过高。随着互联网的普及以及数字出版物的增多,复制检测也开始发展起来了。
三:国内外研究现状
论文查重技术属于复制检测技术的一种,用来检测文件是否剽窃另外一个文件。最初的复制检测技术产生与20世纪70年代,二十年后,对自然语言的文本复制检测技术开始产生。论文查重以相似度作为比较论文文本之间的内容相关程度的依据。
以上是毕业论文文献综述,课题毕业论文、任务书、外文翻译、程序设计、图纸设计等资料可联系客服协助查找。