1. XenForo 1.5.14 中文版——支持中文搜索!现已发布!查看详情
  2. Xenforo 爱好者讨论群:215909318 XenForo专区

科技 CVPR再度上演抄袭大戏:IBM中稿论文被指照搬自己承办竞赛第二名的idea

本帖由 漂亮的石头2022-06-28 发布。版面名称:新闻聚焦

  1. 漂亮的石头

    漂亮的石头 版主 管理成员

    注册:
    2012-02-10
    帖子:
    488,179
    赞:
    47
    一波未平,一波又起,CVPR 2022又被曝出论文抄袭!这两天,来自中国的研究团队发现,自己去年参加ICDAR竞赛的idea,竟然被IBM拿去投中了今年的CVPR。而这件事最讽刺的一点在于,ICDAR 2021正是由IBM自己承办的。

    [​IMG]

    目前,作者已经将相关举证信息发给了CVPR的Program Chairs。​

    [​IMG]

    这件事的热度还在发酵。Reddit上的讨论热度即将破千。​

    [​IMG]

    然而,挑战大厂的权威,又何谈容易呢。​

    作者自述

    下面,让我们用第一人称,还原一下原作者的自述。感受一下原作者的愤怒和委屈。​

    “我叫Xianbiao Qi,在计算机视觉领域搞研究已经十多年了。我写这篇博客是为了揭露一起明目张胆的剽窃行为。IBM苏黎世研究院剽窃了我们的研究。”​

    “他们抄的不是文本内容,他们抄的是我们辛辛苦苦做出来的idea。”​

    Xianbiao Qi所说的论文是“PingAn-VCGroup's Solution for ICDAR 2021 Competition on Scientific Literature Parsing Task B: Table Recognition to HTML”,于2021年6月上传至arXiv,合作者有Jiaquan Ye, Xianbiao Qi和Yelin He等人。​

    此外,代码也一并进行了开源。​

    [​IMG]

    论文地址:https://arxiv.org/abs/2105.01848​

    而抄袭团队则是来自IBM苏黎世研究院的Ahmed Nassar, Nikolaos Livathinos, Maksym Lysak和Peter Staar等人。​

    他们把最精华的点子吃干抹净带走,然后把文章改头换面地发在了IEEE/CVF计算机视觉和模式识别会议论文集上。​

    剽过来的文章名叫“TableFormer: Table Structure Understanding with Transformers”,请大家擦亮慧眼。​

    [​IMG]

    论文地址:https://arxiv.org/abs/2203.01017​

    Xianbiao Qi表示,Nassar等人的文章把我们的整体方法,以及预处理和后期处理的部分、可视化部分、推理部分、给出的系统解决方案都抄了过去。甚至还有代码和预训练模型。​

    但是,Nassar等人没什么别的本事,完美包装却熟练得很。他们的文章没有一个字引用了Xianbiao Qi团队的文章内容。他们以为这样就能把查重蒙骗过去了。​

    通俗地讲就是,研究生抄袭一般直接抄文字,而这位苏黎世的博士后更“高级”——重写idea。​

    实际上,这办法还真行。Nassar等人的文章确实没被判定为抄袭。最后还是其他很多专家发现了两篇文章在idea上的雷同,转告给了Xianbiao Qi团队。​

    在Reddit上,有不少网友表示支持作者维权,同时也提醒他在举证的时候尽量不要带有情绪,虽然很难做到。​

    [​IMG]

    也有网友指出,现在列出的证据远非决定性的:​


    这两个团队在同一个问题上,使用相同的公开数据,解决方案也有相似之处。但这并不意味着一方抄袭了另一方。​

    [​IMG]

    而知乎上对此的讨论也非常热烈。​

    [​IMG]

    [​IMG]

    简要时间线

    事情就是这么个事情,时间线还是有必要好好梳理一下的:​

    2021年4月7日,Xianbiao Qi团队结束了ICDAR 2021表格识别竞赛,并取得了第二名的成绩。这是由澳大利亚的IBM小组举办的。​

    同年5月5日,团队在arXiv上发表了想法的技术报告,以及预印版本。占了个坑。​

    两个月之后的7月29日,团队开源了相关代码,甚至还在Github上公开了相关的幻灯片。​

    2021年9月,团队发布了TableMASTER的预训练模型。11月,继续发布了tablemaster_mmocr的docker环境。​

    Xianbiao Qi自嘲道,“我们这个项目基本等于全裸了,该发布的全发布了。但我们发布是为了造福整个社区,不是方便你们抄袭来的。”​

    年底,来也技术团队在“表格识别方法评述及来也科技的实践”提到了这篇论文:​


    TableMASTER从一个非常新颖的角度来解决表格识别问题,是一次大胆的尝试,并且效果也是十分出色。PaddleOCR也用相似的思路开源了一个十分轻量的表格识别模型,并提供了PubTabNet数据集的预训练模型,略有不同的是paddleTable采用了RARE和GRU而不是MASTER和transformer。​

    时间来到2022年3月2日,TableFormer发布了。​

    当然,Xianbiao Qi愤怒之下没有丧失冷静,他列举了九大证据,实锤抄袭。​

    9大证据​

    Our methodology, you plagiarize​

    Our Pre-processing, you plagiarize​

    Our Post-processing, you plagiarize​

    Our Inference speedup method, you plagiarize​

    Our"tricky"work, you even plagiarize​

    Our text line detection and text line recognition, you plagiarize​

    Our systematic solution, you plagiarize​

    Our visualization, you plagiarize​

    Misleading the audiences in order to not be captured for plagiarism​

    第一,方法论部分,抄了。​

    TableFormer直接抄袭了Xianbiao Qi团队的点子,把文字部分改写了。​

    [​IMG]

    而且关键的图表也重新画了一遍。但是核心思想是雷同的。​

    第二,预处理阶段,抄了。​

    Nassar等人直接盗用了齐宪标团队的序列长度最大值500,然后悄悄改成了512。其实为什么改成这个数他们自己也不清楚。​

    [​IMG]

    第三,后期处理部分,抄了。​

    Xianbiao Qi的团队设计了三个巧妙的规则来处理后期部分。​

    而抄袭团队直接根据Qi的团队放出的开源代码,把三个规则写成了9条。​

    而这些规则和代码是Xianbiao Qi的团队花了好几周的时间才完成的。​

    [​IMG]

    第四,推理加速方法,抄了。​

    在推理阶段,Xianbiao Qi团队在之前的论文中提出了一种memory-cache方法。而Nassar等人直接就用了。​

    Xianbiao Qi表示,“你们真懂是啥意思吗就用?”​

    [​IMG]

    第五,小技巧,居然也抄了。​

    [​IMG]

    第六,文本行检测和文本行识别,抄了。​

    Xianbiao Qi团队训练文本行检测和识别的过程,Nassar等人直接抄了。​

    [​IMG]

    第七,系统化解决方案,抄了。​

    两边的处理过程完全一样,不可能完全是巧合。​

    [​IMG]

    第八,可视化部分,抄了。​

    可以看到,可视化的图标部分,Nassar等人只是换了个颜色。​

    [​IMG]

    第九,用各种手段误导读者,避免因为剽窃被抓到。​

    [​IMG]

    最后,作者表示这次学到的最深刻的教训就是:“即使开源了代码,也不要开源自己训练好的模型。”​
     
正在加载...