在学术写作和投稿过程中,可能有作者会有这样的疑问,引用了一些尚未分配 DOI 的文献,例如刚被接受但未正式上线的论文、部分会议稿、技术报告或预印本,这些文献还没有 DOI,基于 Crossref 体系的查重(如 CrossCheck)是否还能识别出相关相似内容?
要回答这个问题,需要先厘清一个关键点,是否DOI 与是否能被查重识别,并不是完全等同的关系。

一、DOI的作用,标识与关联,而非唯一识别前提
DOI(Digital Object Identifier)的主要功能,是为学术内容提供一个稳定、可解析的唯一标识,便于引用、检索和数据关联,在 Crossref 体系中,DOI 还承载着元数据注册的作用,使文献更容易被系统索引和追踪,不过需要强调的是,crossref查重系统识别文本相似性,依赖的是文本内容本身,而不是 DOI 这一标识。就是说,DOI 有助于提高文献的可见性和可追踪性,但并不是查重识别的唯一入口。
二、没有 DOI 的文献,仍有可能被识别
在实际查重过程中,即使某篇被引用文献尚未分配 DOI,只要其内容以某种形式进入了可检索或可访问的数据库,仍然可能被识别为相似来源。常见情况包括:
1. 已在期刊官网或平台提前发布
部分文章虽未正式编期,但已以online first或accepted manuscript形式公开,只是 DOI 尚未注册或尚未生效。
2. 已作为预印本公开
例如在各类预印本平台发布的版本,即使没有 DOI(或使用其他标识体系),只要被数据库收录,仍可能参与比对。
3. 被收录于机构库或学术数据库
高校或研究机构的开放存储系统、会议网站等,也可能成为文本来源。
4. 内容被二次传播或引用
即便原始文献没有 DOI,其部分内容如果出现在其他已收录文献中,也可能被间接识别。
三、哪些情况下更难被查重识别?
当然,并非所有无 DOI 文献都会被识别,以下情形中,查重系统识别的概率相对较低:
- 文献尚未公开,仅限内部流通
- 内容未被任何数据库或平台收录
- 文档访问受限,系统无法抓取文本
- 文件格式不利于文本解析(如扫描版图片)
在这些情况下,即便存在实际重复,也可能暂时不会体现在查重报告中。
四、编辑如何看待未被识别的引用来源?
查重系统的未检出重复,并不等同于学术规范上的没有问题,在编辑实践中,期刊更关注,引用是否真实、准确,是否存在对既有研究的不当复用,作者是否清晰说明与前期工作的关系,即便某些来源暂时未被系统识别,一旦在后续审稿或发表过程中被发现,仍可能引发质疑。
五、作者应如何应对这类情况?
面对尚未分配 DOI 的引用文献,作者可以采取更稳妥的处理方式:
- 按规范完整引用现有信息
即使没有 DOI,也应提供作者、标题、期刊或平台信息。 - 避免直接复制原文表达
对引用内容进行合理转述,而非简单复用。 - 对尚未正式发表的工作进行必要说明
尤其是在涉及自引用或团队内部成果时。 - 不要依赖查不到就没问题的判断逻辑
查重只是辅助工具,不是学术规范的替代。
总体来看,论文引用的文献即便尚未分配 DOI,Crossref 体系下的查重工具仍有可能识别相关相似内容,前提是这些文献已以某种形式进入可检索或可访问的数据库,DOI 的缺失会降低被识别的概率,但并不会完全阻断查重路径,对投稿的你而言,规范引用和合理表达始终是更可靠的做法,而不应依赖文献是否有 DOI来判断查重风险。