嗯哼…首先咳嗽一声,以表事态严峻。
昨天,国内人工智能学术圈曝出了一起重大的论文抄袭事故,登上知乎热搜:
谷歌大脑研究员于4月8日在个人博客发文,指出北京智源人工智能研究院、清华大学等等单位新近合作发表的综述论文“A Roadmap for Big Model”(大模型路线图)抄袭了他们的论文“Deduplicating Training Data Makes Languages Models Better”与其他论文,共计十余处。

消息一出,立刻在国内外的社交媒体上引起了众多AI研究者的关注与讨论。
由于该论文篇幅长达200页,涉及的学者众多(一百位),因此,自抄袭消息从北京时间4月13日早晨登上知乎热搜开始,AI科技评论编辑组就一直在尽可能与多位涉事学者核实情况,以求尽可能做到真实、客观、严谨的讨论。
毫无疑问,该论文在arXiv上发表,作为单单由就职于中国研究机构与高校的学者所合作撰写的研究综述,论文被曝抄袭,必然会使中国的AI学术圈蒙羞。
多位学者向AI科技评论表示,这一抄袭事件对华人学者的名声造成了极大的负面影响。
这再次警示我们的学者:学术诚信原则神圣不可侵犯,应将论文写作规范时时铭记在心,不要突破科研的基本底线。
与此同时,我们也需要做到理性分析。论文抄袭被国际友人讨论与抨击,不是藤断瓜落,而是雪山崩塌。作为圈内的一份子,我们不应抱着「吃瓜」的看客态度将此事潦草带过,也不应一杆子打翻一船人。廉洁建设,人人有责。
追索真理,本就是科研的态度。
1、论文详情
首先让我们来回顾一下事件的经过:
今年3月底,一篇由19家机构、100位中国学者联合署名发表在 arXiv 上的200页论文引起了国内外人工智能领域的广泛关注。
这篇论文是一篇研究综述,题为“A Roadmap for Big Model”(大模型路线图),主要围绕近年来人工智能领域兴起的大规模语言/视觉模型(如GPT-3)研究进行了深入归纳与讨论。
此外,该论文在首页即表明:大模型的路线图由清华大学的唐杰教授设计,分为十八节,包含16篇章节,16篇章节中的每一节由一位(部分为两位)通讯作者组织。
论文地址:https://arxiv.org/pdf/2203.14101.pdf
从文章的出发点(促进大规模人工智能模型的研究)、合作作者数量与署名机构的权威性来看,这篇研究综述对AI研究者均有极大的阅读吸引力。Google Brain的研究员Nicholas Carlini就是其中一员。
但随即,4月8日,Nicholas在他的个人博文发文,称“A Roadmap for Big Model”一文抄袭了他参与的论文“Deduplicating Training Data Makes Language Models Better”,而且,他还指出,这篇论文至少还抄袭了十余篇其他论文。
免责声明:文章内容来自互联网,版权归原作者所有,本站仅提供信息存储空间服务,真实性请自行鉴别,本站不承担任何责任,如有侵权等情况,请与本站联系删除。
转载请注明出处:100位中国学者合作的研究综述被曝抄袭,智源发表声明:承认错误,转交第三方专家调查 https://www.7ca.cn/zsbk/zt/27315.html