登录
  • 欢迎访问CrossCheck中文网站,在这您可查阅相关文章以及免帐号检测您的论文哦!

iThenticate查重是否能识别非英语论文内容?如果是中译英或英译中是否也会检测到重复?

检测资讯 admin 38次浏览

在学术论文投稿中,iThenticate重复率检测已经成为稿件提交前的重要环节,许多学者、师生们,尤其是非英语母语作者,他们可能更关心非英文检测的问题,就是iThenticate是否能检测到非英文内容的重复,特别是当内容经过中译英或英译中处理后,系统还能否检测出其中的潜在抄袭或重复?

一、iThenticate是否支持非英语内容的查重?

iThenticate由美国Turnitin公司开发,初始设计目的主要面向英文科研期刊出版社,支持文献与大规模数据库进行相似性比对,虽然其核心语言处理系统是基于英文语料构建的,但近年来,iThenticate已经逐步扩展对其他语种的支持。

据官方说明和实践反馈,iThenticate可以处理包括中文、法语、西班牙语、德语等多种语言的文献内容,但其查重精度与英文内容相比仍存在差距,中文内容的比对依赖于系统是否已将中文资源纳入对比数据库。例如,中国大陆或中国台湾的部分核心期刊、会议论文、学位论文,若已收录于Crossref、CNKI或合作数据库中,系统便可能识别出重合内容。然而,如果某篇中文文章没有被纳入公开数据库,或其格式特殊(如PDF扫描图像、复杂表格结构),系统识别能力将大打折扣。

二、面对翻译后的内容,iThenticate能否检测重复?

这是学术界关注的一个焦点问题,尤其在中译英、英译中投稿频繁的背景下愈发重要。

1. 中译英或英译中后是否会被检测到?

如果原始中文文章已存在于数据库中,而用户上传的查重稿件是其英文译文,那么iThenticate在多数情况下不会识别出两者之间的重复内容。原因很简单:iThenticate基于文本相似性检测,其比对是语言层级的逐词逐句匹配,语言转换后,即使语义完全一致,但词汇和句式发生了显著改变,系统就很难判别这种跨语言抄袭。就是说,iThenticate并不具备成熟的语义比对能力,更不具备机器翻译反推原文的能力,目前市面上还没有一种查重系统可以完全实现跨语言文本溯源。

2. 翻译与原创

尽管iThenticate无法识别语义上的重复,但在一些特定场景下仍有可能检测出部分翻译内容的相似性。例如:

  • 翻译时使用了网络机翻工具,如Google Translate,且未进行语言润色;
  • 翻译内容较为直译,与已有英文学术文章中出现的表述高度一致;
  • 使用了已有英文综述、定义性术语等常见表达。

这些情况可能会导致相似性增加,但这并不意味着系统识别了中译英的重复内容,而是因为目标文本与其他英文文献中某些句子刚好重复。

三、如何规避中译英/英译中后的查重风险?

尽管iThenticate尚不能实现真正意义上的跨语言查重,同学们在学术写作中仍应遵守学术诚信原则,以下几点建议值得参考:

  1. 避免将已发表的中文成果直接翻译后投稿英文期刊,如确有重复使用的必要,应在英文文稿中明确标注,并征得原出版社授权或遵循自我转载规范。
  2. 注重语言润色,避免使用机翻后的直接文本,多次修订可降低与他人表达重合的概率。
  3. 针对翻译后的文本进行英文环境下的查重,即使原文是中文,最终要提交的是英文稿件,也应当以英文为查重语言,确保在目标语境中符合查重标准。
  4. 了解目标期刊的重复率容忍度,不同出版机构对查重率的要求差异较大,一般控制在10%-20%以内为宜。

总的来说,iThenticate目前尚不具备跨语言查重的能力,也就是说,它无法有效检测中译英或英译中稿件是否源于他人的内容,但这并不意味作者可以通过翻译逃避学术不端的审查,随着人工智能语义识别技术的发展,未来的查重系统有可能向语义查重和跨语种比对方向演进。因此,建议同学们始终秉持诚实写作、合理引用的原则,确保稿件在任何语言版本下都经得起学术伦理的检验。


本站的文章和资源来自互联网或者站长的原创,按照 CC BY -NC -SA 3.0 CN协议发布和共享,转载或引用本站文章应遵循相同协议。如果有侵犯版权的资源请尽快联系站长,我们会在24h内删除有争议的资源。
喜欢 (0)
[turnitinhk@sina.com]
分享 (0)