登录
  • 欢迎访问CrossCheck中文网站,在这您可查阅相关文章以及免帐号检测您的论文哦!

反剽窃软件CrossCheck工作原理简介

检测资讯 admin 2855次浏览

这几天浙大学报张月红老师发表于Nature的一篇通讯(特别是其标题Chinese journal finds 31% of submissions plagiarized)在业内引发了一些争议和讨论。从技术的角度,Nature的编辑将标题改得很成功,确实吸引人无数人的眼球,并成为一个热点话题。张老师文中提到了浙大学报英文版B辑在使用了CrossCheck之后所得到的一些统计数据。科学网上似乎还没有人介绍CrossCheck,这里我就开个扫盲贴吧,对此很熟的同仁就不必再往下看了。

2

在介绍CrossCheck之前,一定先得说一下CrossRef。CrossRef最初是由几家出版商于2000年创立的非赢利性组织,其宗旨是通过出版商之间的集体合作,让用户能够访问原始研究内容。简单的说,就是读者对A期刊某篇文章的参考文献中所列的B期刊的文章感兴趣,可以通过点击这条参考文献(如下图所示),就可直接链接到B期刊的相应文章(全文或摘要,视读者或其单位订阅情况而定)。当然前提是A、B两期刊的出版商都是CrossRef的会员。这种链接机制背后最核心的技术是DOI(Digital Object Identificator,数字对象标识符),就是给网上的每篇文分配一个唯一的身份识别代码。目前CrossRef已有3000多家会员单位(出版商、学协会等)。

1

CrossCheck是由CrossRef推出的一项服务,用于帮助检测论文是否存在剽窃行为。它的软件技术来自于iParadigms公司的iThenticate。CrossCheck的工作原理其实很简单,用户通过客户端将可疑论文上传,然后系统将该论文与CrossCheck数据库中的已发表文献进行比较,最后报告给用户可疑论文与数据库中已发表文献的相似度,以百分比表示,并将相似的文本标示出来。例如可疑论文与已发表文献A文有70%的相似度,与B文有20%的相似度等。但CrossCheck的报告结果毕竟只是经过执行一系列查询与比较算法后的生成的数字和提示而已,至于可疑论文是否真的是剽窃而来,一定需要由相关研究领域的专家(期刊主编、编委或审稿人等)对相似论文进行仔细比较,才能作出比较客观的结论。

CrossCheck,也称为反剽窃文献检测系统,由国际出版链接协会研发,全球六家国际出版集团共同参与实验,2008年6月19日正式向全球发布。CrossCheck的功能由两部分组成:一个基于全球学术出版物所组成的庞大数据库和一个基于网页的检验工具。这个基于网页的工具可用于编辑过程中去鉴别相似文档,生成对比报告,并通过分析去判断是否存有学术剽窃行为。CrossCheck于2008年6月19日正式向全球发布。其使用方法是: 首先加入CrossCheck成为会员,成为CrossCheck会员的出版者必须使其所出版的内容被收录在CrossCheck数据库中并可检索。鼓励所有的CrossCheck会员将其内容提交到CrossCheck数据库,以帮助防止出版者在不知不觉中重复发表相同的内容。第二步,就开始在数据库中核查署名作者的文章,通过基于网络的工具把文章上传后CrossCheck数据库和更宽的网络环境中进行相似度检测。系统会生成一份“独创性报告”,显示被测文献与目标文献的文字重复度,并给出相似度指标(百分比),然后由富有编辑专长和经验的人来分析判定是否剽窃。

在对论文的文字部分进行比较方面,CrossCheck确实比较好用,能够帮助期刊发现一些问题。比如,中国等非英语国家的一些作者可能会有意无意地直接套用其他论文的的Introduction或Method中的部分甚至几乎全部的文字,但实验数据、讨论等部分完全是原创性的。这种作法实际上是不妥当的,使用CrossCheck很容易检测出来。但如果期刊直接定性为剽窃并拒稿(Reject),似乎也有点太武断与”冷酷”了,因此有些期刊会将稿件退回(unsubmit),并委婉地请作者对可疑之处进行修改后再重新投稿。

我所管理的一本期刊还遇到过一种情况,某篇稿件的Introduction和Method与另外几篇已发表的论文几乎完全一样,连作者也是一样的。CrossCheck检测的结果自然是相似度很高,但经过期刊主编审查并与作者沟通之后,发现这位作者在相同的目标和背景下,采用相同的方法对不同的实验对象进行了一系列的研究,并且所采用的方法是原创的方法。因此主编在请作者添加了相应的说明和参考文献后,同意将稿件送审。

从另一方面说,在经过CrossCheck检测后,即使相似度为0,也并不能就此认为可疑论文一定就可以排除嫌疑了。因为CrossCheck数据库中的已发表论文只占全世界所有科技文献的一小部分,并且目前CrossCheck还只是最擅长比较英文论文,对其他语种似乎并不太支持。同样,一些手法比较“高级”的剽窃,也是很容易成为漏网之鱼的。

总之,CrossCheck只是一种辅助性的检测手段,只有配合以期刊主编、编辑、审稿人的专业判断能力,才能合理地发挥它的作用。

目前,CrossCheck项目已经引起全球学术界和出版界的广泛关注和积极响应。目前,一些大的国际科学出版集团,如Elsevier,Springer,Wiley-Blackwell,BMJ,Taylor & Francis,牛津出版社等,以及许多科学学会,如美国科学进步协会(AAAS),美国物理学会(APS),植物生物学会等均成为CrossCheck的正式会员。当然,要加入CrossCheck成为会员是要付费的,CrossCheck软件系统不是免费的。


本站的文章和资源来自互联网或者站长的原创,按照 CC BY -NC -SA 3.0 CN协议发布和共享,转载或引用本站文章应遵循相同协议。如果有侵犯版权的资源请尽快联系站长,我们会在24h内删除有争议的资源。
喜欢 (2)
[turnitinhk@sina.com]
分享 (0)