在学术论文投稿过程中,作者在查看 Crossref查重报告时,最常见、也最容易产生误解的问题之一,便是重复率应当如何理解,有些同学习惯性地认为只要总相似率低于某个百分比就一定安全,也有人担心哪怕出现少量高相似来源就会被直接退稿。事实上,Crossref 并不存在一个放之四海而皆准的相似度标准。

一、Crossref是否内置统一的相似度阈值?
Crossref 本身并不设定合格或不合格的相似度阈值标准。
作为一套相似性检测系统,Crossref 的功能是:比对投稿稿件与数据库中已有文献的文本相似性,标注相似片段及其来源,生成量化的相似度数据。
至于重复率多少算问题,系统并不会自动给出判断,这个判断标准一般是掌握在期刊编辑和出版机构手中。
二、重复率要求通常由谁来界定?
在实际操作中,重复率要求通常由以下几方共同决定:
- 期刊编辑部或出版社的内部政策
- 学科领域的写作惯例与容忍度
- 稿件类型(研究论文、综述、方法论文等)
因此,即便使用同一套 Crossref 系统,不同期刊之间的判定标准也可能存在明显差异。
三、常见的相似度参考区间(非统一标准)
虽然不存在统一标准,但在编辑实践中,确实可以观察到一些经验区间,仅供作者理解编辑思路,而非机械套用:
- 总相似度在10%以下
通常不会引发编辑的重点关注,但前提是相似内容分布合理。 - 总相似度在10%–20%之间
属于需要进一步人工查看的区间,编辑会重点检查相似来源和重复位置。 - 总相似度高于20%
多数期刊会进行严格审查,尤其关注是否存在大段连续重复文本。
需要强调的是,这些区间并非 Crossref 的系统设定,而是编辑端常见的经验判断。
四、单一相似来源的阈值往往比总相似度更重要
在实际审稿中,编辑往往更关注以下问题:
是否存在单一来源占比过高(例如某一篇文献贡献了5%甚至10%以上的相似度);
是否出现连续、整段甚至整节的文字重复;
即便总相似度不高,只要某一来源的重复比例集中、连续,仍然可能被视为存在学术风险。
五、不同学科对重复率的容忍度是否相同?
一般情况下是不相同的,比如下面这些,要求就不尽相同:
理工科、医学类论文
方法描述较为规范,允许一定程度的表达相似,编辑更关注结果和创新性。
人文社科类论文
对语言原创性要求更高,对重复表述的容忍度通常较低。
综述类文章
本身需要大量引用已有研究,整体相似度往往偏高,但必须引用规范、来源分散。
因此,即使相似度数字相同,不同学科的实际判断结果也可能完全不同。
六、期刊之间是否存在统一的执行标准?
从目前的出版实践来看,不存在跨期刊、跨出版社的统一相似度阈值,即便同一出版社旗下的不同期刊,也可能执行不同标准,一些期刊甚至不会向作者披露具体的可接受比例,而是采用编辑人工判断,这也是为什么作者常常会遇到同一篇稿件在不同期刊查重反馈不同的情况。
七、作者应如何理性看待重复率要求?
与其纠结某一个百分比,不如重点关注以下几点:
- 相似内容是否集中在引言或方法等可解释部分
- 是否存在未标注来源的直接重复
- 是否有单一文献占据过高比例
- 是否能清楚说明与既有研究的继承关系
从编辑角度看,透明性和可解释性往往比数字本身更重要。
总体而言,Crossref 查重报告中的重复率并非由系统统一设定,而是由期刊、出版社和学科惯例共同决定,不同期刊之间不存在完全一致的标准,编辑更关注重复内容的性质、位置和来源,而非单一的百分比数值。对于作者而言,理解这一逻辑,合理控制文本重复,并在必要时主动说明,才是应对查重审查的关键。