又一篇CVPR 2022论文被指剽窃,平安保险钻研者控诉IBM苏黎世团队

「他们并不是照抄文本,而是剽窃想法。」

昨天,有人在 reddit 上发帖称,IBM 苏黎世钻研中心剽窃了自己的论文,而且还被 CVPR 2022 接收了。这位发帖者写道:我叫 Xianbiao Qi,是一位有十多年钻研经验的计算机视觉钻研者。我写这个博客是为了投诉一个严重的案例:IBM 苏黎世钻研中心的员工蓄意剽窃我们的论文。他们并不是照抄文本,而是剽窃想法。

Qi 提到的疑似被剽窃的论文题为「PingAn-VCGroup's Solution for ICDAR 2021 Competition on Scientific Literature Parsing Task B: Table Recognition to HTML(平安 VCGroup 为 ICDAR 2021 科学文献解析比赛任务 B 提供的解决方案:HTML 表格辨别)」,作者来自平安保险和平安科技,上传 arXiv 的时间是 2021 年 5 月份,2021 年 7 月份公布了代码,2021 年 9 月发布了 Tablemaster 预训练模型,2021 年 11 月发布了 tablemaster_mmocr docker 环境。论文中提到的比赛是 2021 年 4 月结束的,由 IBM 的另一个团队主办。论文链接:https://arxiv.org/pdf/2105.01848.pdf如论文标题所述,这篇文章为 ICDAR 2021 科学文献解析比赛任务 B(HTML 表格辨别)提供了一套解决方案。具体来说,他们将表格实质辨别分为四个子任务:表格布局辨别、文本行检测、文本行辨别和框分配。表格布局辨别算法是基于一种鲁棒的图像文本辨别算法 MASTER 定制的。PSENet 用于检测表图像中的每个文本行。文本行辨别模型也建立在 MASTER 之上。最后,在框分配阶段,他们将 PSENet 检测到的文本框与通过表布局预测重构的布局项相关联,并将文本行的可辨别实质填充到对应项中。又一篇CVPR 2022论文被指剽窃,平安保险钻研者控诉IBM苏黎世团队被指剽窃的 IBM 论文题为「TableFormer: Table Structure Understanding with Transformers(TableFormer:用 Transformer 理解表布局)」,上传 arXiv 的时间是 2022 年 3 月份,提交给 CVPR 的时间未知。又一篇CVPR 2022论文被指剽窃,平安保险钻研者控诉IBM苏黎世团队论文链接:https://arxiv.org/pdf/2203.01017.pdf又一篇CVPR 2022论文被指剽窃,平安保险钻研者控诉IBM苏黎世团队在这篇论文中,IBM 的钻研人员提出了一种新的表布局辨别模型,它从两个方面改进了最新的端到端深度学习模型(即来自 PubTabNet 的 encoder-dual-decoder)。首先,他们引入了一种新的目标检测解码器用于表格单元格。通过这种方式,他们可以直接从 PDF 源中获取编程式 PDF 的表格单元格实质,从而避免了定制 OCR 解码器的训练。这种架构上的改变带来了更精确的表格实质提取。其次,他们将 LSTM 解码器替换为基于 transformer 的解码器。Qi 表示,IBM 的这篇论文剽窃了他们的方法论、预处理、后处理、可视效果、推理、系统级解决方案、代码、预训练模型等实质,但「为了不被抓住」,他们没有引用 Qi 等人的论文。又一篇CVPR 2022论文被指剽窃,平安保险钻研者控诉IBM苏黎世团队接下来,Qi 用十几张图展现了他认为 IBM 存在剽窃的地方。

又一篇CVPR 2022论文被指剽窃,平安保险钻研者控诉IBM苏黎世团队

Qi 展现的疑似剽窃点 1:方法论。他认为,IBM 的钻研者剽窃了他们的想法,并重写了「贡献」部分,而且根据他们的图重新画了布局图。又一篇CVPR 2022论文被指剽窃,平安保险钻研者控诉IBM苏黎世团队

Qi 展现的疑似剽窃点 2:预处理。又一篇CVPR 2022论文被指剽窃,平安保险钻研者控诉IBM苏黎世团队

Qi 展现的疑似剽窃点 3:后处理。又一篇CVPR 2022论文被指剽窃,平安保险钻研者控诉IBM苏黎世团队

Qi 展现的疑似剽窃点 4:推理加速方法又一篇CVPR 2022论文被指剽窃,平安保险钻研者控诉IBM苏黎世团队

Qi 展现的疑似剽窃点 5:技巧。又一篇CVPR 2022论文被指剽窃,平安保险钻研者控诉IBM苏黎世团队

Qi 展现的疑似剽窃点 6:文本行检测和文本行辨别。又一篇CVPR 2022论文被指剽窃,平安保险钻研者控诉IBM苏黎世团队

Qi 展现的疑似剽窃点 7:系统级解决方案。又一篇CVPR 2022论文被指剽窃,平安保险钻研者控诉IBM苏黎世团队

Qi 展现的疑似剽窃点 8:可视效果。又一篇CVPR 2022论文被指剽窃,平安保险钻研者控诉IBM苏黎世团队

Qi 展现的疑似剽窃点 9:误导读者。

在看了 Qi 给出的示例后,有人认为这些都是非常有力的证据,IBM 团队很难证明自己的论文是原创的,Qi 应该向 CVPR 程序委员会投诉。又一篇CVPR 2022论文被指剽窃,平安保险钻研者控诉IBM苏黎世团队不过,也有人认为,这些证据不够有力:「两个小组钻研的是同一个问题,使用的是相同的公开数据,他们的解决方案也有相似之处。但这并不意味着一方照搬另一方。例如「疑似剽窃点 1」中所展现的实质就不是那么接近」。又一篇CVPR 2022论文被指剽窃,平安保险钻研者控诉IBM苏黎世团队目前,我们还没有在帖子下方看到 IBM 论文作者的回应。不过,值得一提的是,这并不是今年 CVPR 曝出的唯一一件疑似剽窃事件。几天前,一位网友在 YouTube 上爆料说,首尔大学的一篇论文剽窃了十几篇其他论文,目前该论文作者已经出来道歉并撤稿。或许,顶会论文在查重上面需要多下点功夫了。参考链接:https://www.reddit.com/r/MachineLearning/comments/vlpnuw/d_ibm_zurich_research_plagiarised_our_paper_and/

原创文章,作者:机器之心,如若转载,请注明出处:https://www.iaiol.com/news/23777

(0)
上一篇 2022年7月1日 下午4:34
下一篇 2022年7月4日 下午2:24

相关推荐

发表回复

您的电子邮箱地址不会被公开。 必填项已用*标注