顶会paper愈来愈多,我该怎么看?

顶会论文愈来愈多,如何阅读?中国科学院大学计算机应用技术博士王晋东给出了一些建议。

近年来,作为学术前沿研讨的风向标的顶会接收的论文愈来愈多。例如,最近放榜的 NeurIPS 2020 就接收了高达 1900 篇论文,刚刚过去的 CVPR、ICML、ECCV 等也均在接收文章数量上「再创新高」。

这么算下来,一个做机器进修相关研讨的人,一年关注 5 个顶会的话(CCF 仅人工智能规模有 7 个会议,再加上每个子规模的 A,更多),也要面对将近 10000 篇顶会的 paper。试问谁能看的过来?

最近的观察:讲小说的才能愈来愈重要

2020 年是一个特殊的年份。因为疫情的缘故,绝大多数会议都选择在线上召开。作者们也为大师贴心地准备了每篇 paper 的 video,时长从几分钟到十几分钟不等。看 paper 看不过来,听 talk 似乎是一个经济的方案?

最近一段时间,笔者听了几场顶会的 talk,很明显的感觉是现在的顶会 paper 中讲小说的才能愈来愈重要了。

本来进献一般,甚至不乏很简单的 a+b/a for b 模式,落到普通人手里估计也就能中个二流会议,然而讲小说高手却能让他轻松中顶会。小说讲的太离奇,不太容易区分出真实的进献。硬核的、原创的、真实有用的研讨愈来愈少。

从研讨积累和经验上来看,在一个规模深耕多年的大组和牛组无疑比普通人更擅长讲小说,通过小说将自己的进献娓娓道来。一个好的小说配合不算差的创新点,使得文章被接受的概率大大增加。所以说普通人发文章愈来愈难啦。适当的包装和讲小说有利于让读者根据自己的思路对文章内容进行理解,这是必须的,但是绝对不是过度包装。

我的建议是,talk 可以听,但是绝对不要被 talk 所迷惑至少在听 talk 之前,还是要自己先大概看一下 paper。不然你没看 paper 直接听,我们的讲者的素质愈来愈高,每个讲者都能让你觉得他做出了前无古人的职业,直接影响你的判断,让你对这个内卷的学术圈更加绝望。

固然,任何题目我们都须要辩证地看待,并不是说任何的 talk 对应的 paper 都不好,只是从好的 talk 里找到好的 paper,还须要仔细鉴别

其实,除非研讨的是实践和新架构,否则机器进修和 AI 相关的要领 paper,归根到底没有新要领,都是已有要领的应用。所以一篇 paper 的进献就是围绕为什么要用这个要领、以及用这个要领到底办理没办理题目、为什么这个要领能办理题目。

因此,从要领层面,根本区分不出一个职业是长期在一个规模的学者、博士、硕士做出来的,还是刚进实验室、给 idea 就做的本科生做出来的。因为归根到底大师都在做机器进修的应用。而这个时候,讲小说的才能就体现出来了。

一篇好的职业应该是什么样的?

没有一篇 paper 是完美的,想拒它总能找到一万个理由。想接受它也能找到一万个理由。

那么一篇好的职业应该是什么样的?

个人浅见,一篇好的职业至少要满足以下几个条件之一:

非常好的想法。可能并不难,但是不告诉你你就永远想不到,办理的却是规模内的重大题目。典范例子是 ResNet。Skip connection 非常简单,但是想到加 skip connection 却很难。

非常扎实的工程实现和绝佳的性能。典范例子是 Transformer 和 BERT。自监督和无监督预训练并不是什么新的 idea,但是到了 Google 这帮厉害的程序员手里就可以利用大规模数据和分布式训练,硬生生搞出前无古人的性能。

非常充分的实践证明。从实践角度分析一个规模的某个题目,直接给未来职业以启示。典范例子是迁移进修规模的著名实践职业 Analysis of representations for domain adaptation,后续该规模任何的实践职业都会引这篇文章。

非常充分的实验。从实验角度分析规模的若干题目并给出相应的结论。显然在深度进修时代这种文章太重要了。典范例子是迁移进修规模 2014 年的文章 How transferrable are features in deep neural networks。

提出一个新题目。开疆拓土式的职业固然值得一看。只是在这个 paper 爆炸的时代,可能愈来愈难以鉴别到底是不是 first work 了。审稿人不可能看过一个规模内任何子方向的 paper,这时候鸡贼的投稿人就欺负审稿人没看过然后说自己是一个新题目。审稿这种 paper 我的原则是狠狠打死,strong reject,然后把前人的职业甩给他。并且,随便捏造一个不存在的 setting 就说是新题目的 paper,手段也是非常高明的。到底什么是一个好的新题目,还须要更仔细地甄别。

已有题目下直接开创一个新的分支。这就厉害了,属于另起炉灶的职业。典范例子如 MAML、GAN、Flow 模型,完全是在开辟一个崭新的(注水)方向。

如何看海量 paper?

这个题目没有标准答案。事实上每个人不可能对任何的「好」paper 都达到 100% 的召回率。我的方式也还是比较老套,就是顶会放榜后人工去筛出自己感兴趣的 paper 下载下来打上标签(用 zotero)留着慢慢看。尽量用一句话总结出一篇 paper 的进献。这时候就能很轻松地分辨出一篇 paper 是不是水文了:

如果你能轻而易举地用一句几乎没有任何新专业术语的文字概括它的任何进献、并且别人能看明白或者你一个月后看到条记你就能看明白,那它多半不是一个好的职业。

如果你自己都觉得一句话不太够、须要多做一些条记,那这篇 paper 是值得一看的。

例如,paper A 针对 x 题目提出 y 要领,其核心是 xxx,取得了好结果。

如果一个月后你看了条记还记得、并且对其 y 要领印象深刻、认为其确实办理了题目,那是一个好 paper;如果你一个月后已经记不得 y 是个啥、办理了个啥题目、到底有没有办理还是只是性能有提高,那多半不是一个好职业。

固然,这「一句话」就见仁见智了,不同的人有不同的理解。如果实在难以区分,那还有第二招:看它研讨的题目和 motivation。看这个题目是否很重要,为了办理它,作者为什么要用 xx 要领,xx 要领能够被其他要领所替代吗?你觉得这么用是不是注水、让你想你能不能想到。如果你也能轻松想到或你觉得这么加就是 a+b,那么多半它不是一个好的 paper。

新奇的看 paper 角度:看工业界的 paper

其实工业界的 paper 相对来说「好」paper 的召回率能有保证。为啥?因为发 paper 是学校和研讨所的 kpi,那固然大师会拼命发呀。但是只会发 paper 在公司里是不可能混的好的。所以工业界提交的 paper 里总会有一部分真实能 work 的 paper 才能保证这群人能在公司里混的好。

另一方面,深度进修时代最重要就是大数据和计算平台,这两个恰恰是工业界具备的、绝大多数高校和研讨所不具备的。工业界因为有实际题目和实际的数据,往往看题目会比高校和学术界更实际也更透彻、更能办理痛点。数据也都是实际应用的大规模数据,更能验证要领的有效性。不过工业界的 paper 通常都不是很花里胡哨,有点傻大粗……

所以这个角度是不是很新奇……固然题目没有绝对的,我从来没说高校和研讨所的 paper 都不好,工业界的都好,毕竟高校和学术界是工业界研讨的支持力量。我在这里只是给大师提供这个角度供参考。

我们怎么进修?

从讲小说讲得好的 paper 里,进修讲小说的才能。

再强调一下,讲小说和写作才能在顶会里愈来愈重要了。不是大牛组的同学一定要加强,多读别人的 paper 进修套路,能加实践就加一下(虽然你也不会用到)、参考别人的用词和套路、画的精美的插图和表格,更好地包装自己。

固然,科研的本质不是做出真实改变世界的成果吗,为什么我们一直在强调讲小说和写作?悲哀啊。

从硬核的你觉得的好 paper 里,进修研讨题目、分析题目、办理题目的才能。

这就见仁见智了,得是一个持续进修的过程,你须要自己真实进入一个规模去思考题目。

固然,并不是鼓励大师去注水,为了毕业也是不得已。这是从写作者的角度讲大师要给予理解。毕竟没有人生来就能做出好的职业,都得慢慢成长。但绝对不要长期注水,否则就太没有意义了,浪费电浪费 GPU 污染环境。任何的好职业也是建立在无数的平庸的职业基础之上的。要辩证地看待这个题目。

其实挺精神分裂的,一方面,作为研讨者,我们固然想发顶会,那就得花大时间讲好小说;另一方面,作为论文阅读者,我们确实不太想看小说、厌烦过度包装,直切要害最好了。然而又能怎么办呢?这就是从业者的命。

补充一句,顶会还是顶会,真实的好 paper 永远都会优先投在会议上,只是我们须要去发现它。并不是说因为注水的多了,顶会就不「顶」了。态度还是要端正的。

最后,大师加油吧!祝每一份努力都不会白费!

原文链接:https://zhuanlan.zhihu.com/p/315760425?utm_source=wechat_session&utm_medium=social&utm_oi=56560353017856&utm_campaign=shareopn

原创文章,作者:机器之心,如若转载,请注明出处:https://www.iaiol.com/news/%e9%a1%b6%e4%bc%9apaper%e6%84%88%e6%9d%a5%e6%84%88%e5%a4%9a%ef%bc%8c%e6%88%91%e8%af%a5%e6%80%8e%e4%b9%88%e7%9c%8b%ef%bc%9f/

(0)
上一篇 2020年 11月 29日 下午6:22
下一篇 2020年 12月 1日 上午11:12

相关推荐

  • 翻新工厂李开复:调理赛道挤泡沫,迎来“调理+X”时代

    2022年即将过半,黑天鹅仍旧满天飞,一二级市场跌宕起伏。新冠催化下的调理科技赛道,从火热到冷静,逐渐走入挤泡沫的阶段。在这之中,哪些热点将回归平静,又有哪些趋势能够穿越周期?5月11日,在翻新工厂举办的调理翻新趋势分享会上,翻新工厂董事长兼CEO李开复博士表示,在科技交织越来越频繁的当下,AI和自动化已经成为了底层的“数字基建”,跟各范畴的手艺交织带来了越来越多的翻新突破。而传统的调理大安康赛道也在两大平台手艺的推动下迎来翻新拐点,迎来“调理+X”的落地爆发时代。&

    2022年 5月 11日
  • 深度进修如炼丹,你有哪些科学做法?网友:Random seed=42结果好

    调参的苦与泪,还有那些「科学的做法」。

    2021年 12月 21日
  • baidu出席AI顶会IJCAI2020,学术创新成果全球领先

    近日,人工智能国际联合会议IJCAI2020受疫情影响延期后,顺利在线上举行。IJCAI(International Joint Conference on Artificial Intelligence)始于1969年,现为每年一次,学术水平和影响力极高,受到全球学术界和产业界高度关注。据知,IJCAI2020是史上最难的一届,论文接受率12.6%创历史最低;其中,baidu不仅贡献多篇优质论文,涵盖众多前沿领域,更有线上展台技术讲座,分享交流最新的学术突破。值得一提的是,baidu研究院量子盘算研究所所长段润尧还在会上发表

    2021年 1月 19日
  • INDEMIND: 打造标准化机器人AI方案,行业关键手艺供应商价值凸显

    4年深耕低速自动驾驶手艺,打造标准化机器人解决方案,INDEMIND已然破茧成蝶,成为国内最大的机器人关键AI手艺供应商之一。在疫情催化之下,爆发式增长的不只是办事机器人商场,根据数据统计,今年超10万家机器人相关企业成立,随着机器人公司、传统企业、新晋企业陆续进场,一场不可避免的“争夺战”已在悄然中激烈展开。根据IFR数据显示,2016 年以来,全球办事机器人商场规模年均增速达 23.8%,2021 年预计达到 125.26亿美元,到 2023 年,全球办事机器人商场有望突破 201亿美元

    2021年 12月 9日
  • google研究科学家Kevin P. Murphy几率机械进修典范教材再版,PDF免费下载

    google研究科学家 Kevin P. Murphy 的几率机械进修册本即将发行第二版了。经历了近十年的发展之后,这本人工智能畛域典范册本的实质丰富了不少(从页数上也能看出来)。

    2021年 1月 3日
  • Spark 大数据处理最佳实践

    开源大数据社区 & 阿里云 EMR 系列直播 第十一期主题:Spark 大数据处理最佳实践讲师:简锋,阿里云 EMR 数据开发平台 负责人内容框架:大数据概览如何摆脱技术小白Spark SQL 进修框架EMR Studio 上的大数据最佳实践直播回放:扫描文章底部二维码加入钉群观看回放,或进入链接https://developer.aliyun.com/live/247072一、大数据概览大数据处理 ETL (Data  → Data)大数据分析 BI   (Data &nbs

    2021年 8月 11日
  • 刷题太遭罪怎么办?这个算法基地专为小白量身打造,还带动画

    如何有效地刷算法题?刷题小白最新打卡地。算法很重要,但算法也是学起来最难,最令人生畏的。算法千千万,不知该如何下手?经常看到有人抱怨:刚开始刷题时,自己很迷茫,不知道从何刷起,也看不懂别人写的题解。思绪飞来飞去,有时候以为是这个知识点重要,但有时又认为自己走错了路,结果学了半天,越刷越乱,时间、经历都白白浪费。其实,学算法,刷题蛮干是不行的,需要遵循科学的方法。学习算法可能并不只是拼智商,可以通过后天的学习进行掌握,这就需要讲究技巧。方法找对了,可以起到事半功倍的效果。近日,在 Github 上就有人开源了一个项目

    2021年 3月 25日
  • 生物技术初创Lumen与google合作,用机械进修让螺旋藻蛋白消费力翻倍

    编辑/凯霞机械进修可以促进鉴于藻类的生物制剂消费吗?8 月 11 日,西雅图生物技术初创公司 Lumen Bioscience (以下简称「Lumen」)与google宣布合作,将利用机械进修来推进鉴于螺旋藻(一种蓝绿藻)的药物开发。Lumen 表示,该钻研由 Lumen 的信息学负责人 Caitlin Gamble 和google加速科学工程师 Drew Bryant 领导。Lumen 联合创始人 Jim Roberts 说:「google的机械进修和我们鉴于螺旋藻疗法消费的开创性结合,让我们更接近于一种完全优化的步骤,这种步骤可能对全

    2021年 9月 2日
  • 纳米孔检测特定卵白质,使细胞能够与计算机通话

    编辑 | 萝卜皮基因编码的申报卵白一直是生物技术研讨的支柱,使科学家能够跟踪基因表示、了解细胞内过程和调试工程基因回路。但依赖荧光和其他光学方法的传统申报方案存在实际局限性,可能会给该领域的未来进展蒙上阴影。因此运用纳米孔检测特定卵白质,目前具有挑战性。为了应对这一挑战,华盛顿大学的研讨人员开发了一组超过 20 个纳米孔可寻址卵白质标签,它们被设计为申报基因(NanoporeTERs,或 NTERs)。NTER 由分泌标签、折叠结构域和纳米孔靶向 C 端尾部构成,其中可以编码任意肽条码。该团队展示了运用 MinIO

    2021年 11月 9日

发表回复

您的电子邮箱地址不会被公开。 必填项已用 * 标注