正文
的在线数据库,专门收录那些包含明显
AI
生成痕迹但未声明的学术文献案例。
截至目前,该数据库已记录了超过
700
篇此类论文。
Glynn
在一项对数据库中前
500
个案例的初步分析中发现,这个问题的影响范围远超预期。数据显示,这些存在问题的论文并非仅仅出现在影响力较低或边缘性的出版物中,其中高达
13%
的论文发表在由
Elsevier
、
Springer Nature
和
MDPI
等国际大型、知名学术出版商出版的期刊上。
图丨按出版商分类的文章
/
论文数量(来源:
arXiv
)
波兰卡托维兹经济大学的研究员
Artur Strzelecki
对一些知名期刊进行了研究,也同样发现了这一现象。他在学术期刊
Learned Publishing
上发表的研究,识别了
89
篇发表在被
Web of Science
或
Scopus
数据库收录、拥有影响因子或
CiteScore
指标的期刊上的论文,这些论文均带有明确的
ChatGPT
生成内容的
“
印记
”
。令人震惊的是,
其中
64
篇论文(占比超过
70%
)所在的期刊在其各自学科领域内位于
Scopus
数据库排名的前
25%
(即
Q1
区),更有
28
篇论文所在的期刊排名在前
10%
(即
90th percentile
以上)。例如,影响因子极高的顶级期刊如
Trends in Analytical Chemistry
和
Trends in Food Science & Technology
也未能幸免,其发表的文章中也出现了此类
AI
痕迹。
这些研究还揭示了问题的学科分布。
Strzelecki
的分析显示,在识别出的
89
篇论文中,
医学(
19
篇)、计算机科学(
17
篇)和工程学(
16
篇)是重灾区,但环境科学(
10
篇)、社会学、教育学、管理学(各
7
篇)以及经济学(
6
篇)等领域也均有涉及。
这表明
AI
的未披露使用已广泛渗透到多个学科领域。
图丨不同学科的分布情况(来源:
Learned Publishing
)