AI生成的论文内容普遍存在较高的查重率,这主要是由于以下几个原因:
- 训练数据来源:AI模型在训练过程中学习了大量已发表的学术文献、网络文章和书籍内容,导致生成的内容与现有文献存在相似性
- 语言模式相似:AI倾向于使用常见的学术表达方式和句式结构,这些表达方式在学术文献中频繁出现
- 缺乏原创性:纯AI生成的内容往往缺乏个人独特的思考角度和深入分析,容易与已有研究产生雷同
- 数据库匹配:查重系统能够识别出与数据库中高度相似的语言片段,即使内容是AI重新组织的
根据多项研究和实际测试数据显示,纯AI生成的论文初稿查重率通常在20%-40%之间,某些情况下甚至可能更高,特别是在讨论常见话题或使用标准研究方法时。