机器之心ACL 2022论文分享会干货集锦,6月邀你来CVPR分享会

​作为国际最受关注的自然谈话处理顶级会议,每年的 ACL 都吸引了大量华人学者投稿、参会。今年的 ACL 大会已是第 60 届,于 5 月 22-5 月 27 日期间举办。

为了给国内 NLP 社区的从业人员搭建一个自由轻松的学术交流平台,2022 年 5 月 21 日,机器之心举办了「ACL 2022 论文分享会」线上学术交流活动。 本次 ACL 论文分享设置了 Keynote、 论文分享、企业招聘等环节,就业内关注的 Transformer、大规模预训练模型等 NLP 热门中心邀请顶级专家、论文作者与观众做学术交流。全程回放:https://jmq.xet.tech/s/2yGuAyKeynote在上午的 Keynote 环节,哈尔滨工业大学长聘传授、博士生导师秦兵以《大模型背景下可信自然谈话明白》为中心进行了分享。

机器之心ACL 2022论文分享会干货集锦,6月邀你来CVPR分享会

哈尔滨工业大学长聘传授、博士生导师秦兵。 当前,以 BERT、GPT 为代表的、数据驱动的大规模预训练自然谈话明白模型已经在多个自然谈话明白任务上取得了令人印象深刻的性能,成为自然谈话明白的新范式。然而,当前大模型给出的自然谈话处理结果在可信程度上还比较薄弱,次要体现在三个方面:模型的稳定性差、可解释性弱、泛化能力不足。 在本次报告中,秦兵介绍了如何在大模型背景下进行可信自然谈话明白的问题。首先,针对大模型稳定性差的问题,介绍因果机制引导的稳定自然谈话明白方法;其次,针对大模型可解释性弱的问题,介绍鉴于神经符号的可解释自然谈话明白方法。最后,针对大模型泛化性不足的问题,介绍面向低资源的可泛化大模型训练架构。

机器之心ACL 2022论文分享会干货集锦,6月邀你来CVPR分享会

随后,加州大学圣巴巴拉分校计算机科学系助理传授李磊分享了《大规模多谈话翻译:挑战与机遇》中心报告。

机器之心ACL 2022论文分享会干货集锦,6月邀你来CVPR分享会

加州大学圣巴巴拉分校计算机科学系助理传授李磊。 李磊认为,可翻译很多谈话的大一统翻译模型已经成为最新热点。大一统多谈话翻译模型具有翻译性能强、工程部署便利等好处,但要让一个模型在几十到上百种谈话上都能翻译较好仍有很大挑战。 在本次报告中,李磊介绍了大规模多谈话翻译的几个核心挑战,包括大语种性能下降、参数冲突、数据高度不平衡等;同时,他也概述了解决这些挑战的方法,以及未来研究的机遇。

机器之心ACL 2022论文分享会干货集锦,6月邀你来CVPR分享会

下午 Keynote 环节的嘉宾是复旦大学计算机学院传授邱锡鹏与西湖大学工学院文本智能实验室特聘研究员张岳。

机器之心ACL 2022论文分享会干货集锦,6月邀你来CVPR分享会

复旦大学计算机学院传授邱锡鹏。 邱锡鹏传授的报告中心是《迈向大规模高效自然谈话处理》。近期超大规模预训练模型将很多 NLP 任务的准确率提升到了前所未有的高度,但是大模型的次要缺点是在参数、训练、推理、部署方面都存在效率问题。在本次报告中,他次要关注模型效率,并介绍如何通过模型设计、早退、标签进修、统一模型、黑箱优化等维度来提升模型效率。

机器之心ACL 2022论文分享会干货集锦,6月邀你来CVPR分享会

张岳的分享中心是《人在闭环的自然谈话处》。随着深度进修的发展,自然谈话处理取得显著进步,在许多标准测试集上接近或超越了人类的水平。然而,深度进修模型也展现出鲁棒性和逻辑推理等方面的局限。近期研究显示,这些局限的重要原因是模型没有学到关键特征,而是依赖伪特征进行判断。

机器之心ACL 2022论文分享会干货集锦,6月邀你来CVPR分享会

西湖大学工学院文本智能实验室特聘研究员张岳。 为解决上述问题,张岳在本次报告中介绍了两个人工介入干预的办法,提升关键特征把握。实验证明,对于情感分类问题,关键特征可以让模型通过 50 个样本达到 3000 个样本的训练效果。对于机器翻译问题,人工干预不仅可以大幅提升性能,还给翻译产品提供了一个新的可能模式。

机器之心ACL 2022论文分享会干货集锦,6月邀你来CVPR分享会

论文分享论文分享环节也分为上、下午两场。在上午的分享中,腾讯 QQ 浏览器搜索技术部高级工程师唐萌、阿里达摩院算法工程师魏相鹏、清华交叉信息研究院博士生周璟、香港中文大学计算机系博士生 / 腾讯 AI Lab 研究员王文轩以及清华大学博士生泰禹嘉分享了他们的最新成果。唐萌的分享中心是「鉴于区分开关键词和意图词的文本语义匹配」,次要盘绕他们的 ACL 2022 吸收论文《Divide and Conquer: Text Semantic Matching with Disentangled Keywords and Intents》睁开。在这项工作中,他们提出了一种简单而有效的文本语义匹配训练策略,采用分而治之的方法将关键词和意图词区分开来。他们的方法可以很容易地与预训练谈话模型结合在一起,而不会影响它们的推理效率。

机器之心ACL 2022论文分享会干货集锦,6月邀你来CVPR分享会

魏相鹏的分享中心是「鉴于连续语义巩固的神经机器翻译」,次要盘绕他们的 ACL 2022 吸收论文《Learning to Generalize to More: Continuous Semantic Augmentation for Neural Machine Translation》睁开,该论文也获得了今年 ACL 杰出论文奖。在这篇论文中,他们提出了一种新的数据巩固范式连续语义巩固(CSANMT),它为每个训练实例增加一个邻接语义区域,该语义区域可以覆盖足够的相同含义下的文字表达变体。

机器之心ACL 2022论文分享会干货集锦,6月邀你来CVPR分享会

周璟的分享中心是「面向小样本进修的高效、鲁棒的数据巩固」,次要盘绕他们的 ACL 2022 吸收论文《FlipDA: Effective and Robust Data Augmentation for Few-Shot Learning》睁开。在这篇论文中,他们提出了一种用于小样本进修的数据巩固方法——FlipDA,它联合使用生成模型和分类器来生成标签翻转数据。FlipDA 的核心思想是发现生成标签翻转的数据比生成 label-preserved 的数据对性能更重要。

机器之心ACL 2022论文分享会干货集锦,6月邀你来CVPR分享会

王文轩的分享中心是「明白和改进针对机器翻译任务的序列到序列预训练」,次要盘绕他们的 ACL 2022 吸收论文《Understanding and Improving Sequence-to-Sequence Pretraining for Neural Machine Translation》睁开。在这篇论文中,他们提出了一个能够更好地明白神经机器翻译 SOTA Seq2Seq 预训练的实质性措施。通过对三种谈话对的精心设计实验,他们发现 Seq2Seq 预训练是一把双刃剑:一方面,它有助于 NMT 模型产生更多样化的翻译,减少与 和忠实度(adequacy) 相关的翻译错误。另一方面,Seq2Seq 预训练和 NMT 微调之间的差异限制了翻译质量(即 domain discrepancy),并导致了高估问题(即 objective discrepancy)。鉴于这些观察结果,他们进一步提出了简单而有效的策略——in-domain 预训练和输入适应,以弥补 domain discrepancy 和 objective discrepancy。

机器之心ACL 2022论文分享会干货集锦,6月邀你来CVPR分享会

泰禹嘉的分享中心是「面向新数据的谈话模型持续高效预训练」,次要盘绕他们的 ACL 2022 吸收论文《ELLE: Efficient Lifelong Pre-training for Emerging Data》睁开。在这篇论文中,他们提出了 ELLE,旨在利用新出现的数据对模型进行有效的终身预训练。具体而言,ELLE 包括:(1) function preserved model expansion,灵活扩展现有 PLM 的宽度和深度,提高知识获取效率;(2)pretrained domain prompts ,将预训练过程中进修到的通用知识进行分解,激发出适合下游任务的知识。

机器之心ACL 2022论文分享会干货集锦,6月邀你来CVPR分享会

在下午的分享中,小米人工智能实验室高级算法工程师李嫣然、字节跳动 AI Lab 研究员鲍宇、西安大略大学 / 矢量人工智能研究所博士生王馨頔、中科院自动化所模式识别国家重点实验室博士生林海涛、北京航空航天大学博士生王冰分享了他们的最新成果。李嫣然的分享中心是「鉴于混合策略和常识图谱的情绪疏导对话」,次要盘绕他们的 ACL 2022 吸收论文《MISC: A Mixed Strategy-Aware Model integrating COMET for Emotional Support Conversation》睁开。在这篇论文中,他们提出了一种新的情绪疏导对话模型——MISC,该模型首先推断用户的细粒度情绪状态,然后使用混合策略巧妙地做出反应。

机器之心ACL 2022论文分享会干货集锦,6月邀你来CVPR分享会

鲍宇的分享中心是「一种鉴于隐变量建模的并行文本生成模型」,次要盘绕他们的 ACL 2022 吸收论文《latent-GLAT: Glancing at Latent Variables for Parallel Text Generation》睁开。在这篇论文中,他们提出了一种名为 latent-GLAT 的模型,它利用离散隐变量来捕获词的分类信息,并调用一种高级课程进修技术,缓解了多模态问题。

机器之心ACL 2022论文分享会干货集锦,6月邀你来CVPR分享会

王馨頔的分享中心是《知识巩固的端到端生物医学文本标签》,次要盘绕他们的 ACL 2022 吸收论文《KenMeSH: Knowledge-enhanced End-to-end Biomedical Text Labelling》睁开。在这篇论文中,他们提出了一个端到端生物医学文本标签模型 KenMeSH,它结合了新的文本特性和一个动态的知识巩固的掩蔽注意力,后者集成了文档特性、MeSH 标签层次结构和期刊相关特性来索引 MeSH 术语。

机器之心ACL 2022论文分享会干货集锦,6月邀你来CVPR分享会

林海涛的分享中心是「鉴于角色交互的面向角色的对话摘要方法」,次要盘绕他们的 ACL 2022 吸收论文《Other Roles Matter! Enhancing Role-Oriented Dialogue Summarization via Role Interactions》睁开。在这篇论文中,他们提出了一种新的角色交互巩固方法,用于面向角色的对话摘要。它采用交叉注意力和解码器自注意力交互,交互获取其他角色的关键信息,这对提高摘要质量非常关键。

机器之心ACL 2022论文分享会干货集锦,6月邀你来CVPR分享会

王冰的分享中心是「Text-to-SQL 模型对真实对抗性表格扰动的鲁棒性研究」,次要盘绕他们的 ACL 2022 吸收论文《Towards Robustness of Text-to-SQL Models Against Natural and Realistic Adversarial Table Perturbation》睁开。在这篇论文中,他们提出用 Adversarial Table Perturbation (ATP) 作为一种新的攻击范式来衡量 Text-to-SQL 模型的鲁棒性。鉴于这一想法,他们策划了 ADVETA,这是第一个具有自然和真实 ATPs 的鲁棒性评估基准。

机器之心ACL 2022论文分享会干货集锦,6月邀你来CVPR分享会

除了嘉宾 Keynote 和论文分享之外,本次 ACL 论文分享会还设置了两场企业招聘宣讲,包括百亿量化对冲基金佳期投资和深耕算法交易垂直领域的卡方科技,前者提供了量化策略研究员、深度进修研究员、高性能计算工程师、技术项目经理、执行交易员等职位,后者提供了初级量化分析师、量化实习生、强化进修专家等职位。感兴趣的同学可以点开以下文章了解详情:

佳期投资春季社招火热进行中!

招聘|实战 AI 量化,卡方科技邀你入局「算法交易」

最后预告一下,机器之心举办的下一场分享会——CVPR 2022 线上论文分享会将于 2022 年 6 月 18 日 9:00-17:00 在线上举办,上下午各设置 2 场 keynote 报告、5 篇论文分享,并将在机动组视频号直播,欢迎大家关注预约。

机器之心ACL 2022论文分享会干货集锦,6月邀你来CVPR分享会

作为一场开放的学术交流活动,欢迎 CVPR 2022 的论文作者们作为嘉宾参与论文分享。点击阅读原文,提交个人与论文信息,我们将与你联系沟通相关事宜。

原创文章,作者:机器之心,如若转载,请注明出处:https://www.iaiol.com/news/ji-qi-zhi-xin-acl2022-lun-wen-fen-xiang-hui-gan-huo-ji-jin/

(0)
上一篇 2022年 5月 21日 下午4:43
下一篇 2022年 5月 31日 下午8:31

相关推荐

  • 网易云信神经网络音频降噪算法:提升瞬态噪声抑制结果,适合移动端设备

    机器之心专栏网易云信音频实验室网易云信音频实验室自主研发了一个针对瞬态噪声的轻量级网络音频降噪算法(网易云信 AI 音频降噪),对于 Non-stationary Noise 和 Transient Noise 都有很好的降噪量,并且控制了语音旗号的损伤程度,保证了语音的质量和理解度。鉴于旗号处理的传统音频降噪算法对于 Stationary Noise(平稳噪声)有比较好的降噪结果。但是对于 Non-stationary Noise(非平稳噪声),特别是 Transient Noise(突发噪声)降噪结果较差,而且

    2021年 8月 19日
  • 首次尝试!深度进修从原始视频中发明未知输出激励的动力体系的可解释物理定律

    编辑/绿萝由于深度进修的发展进步,从视频中提炼可解释的物理定律引发了计算机视觉社区的兴趣,但仍旧面临巨大的挑战。管制方程(例如 PDE、ODE)的发明可能促进我们对复杂动力体系行为的理解、建模和预测。收集数据的日益丰富和机器进修的进步带来了静态体系建模的新视角。近日,来自中国人民大学和中国科学院大学、美国东北大学的钻研团队提出了一个端到端的无监视深度进修框架,根据录制的视频提醒静止物体呈现的显式动力学管制方程。模拟静态场景的实验表明,所提出的法子能够提炼查封形式的管制方程并同时辨别视频记录的多个动力体系的未知激励输

    2022年 6月 6日
  • 逼近量化训练?块重修技术打造离线量化新极限

    模型量化技术可以有效加速推理,已经成为人工智能芯片的标配,并在工业落地中广泛应用。离线量化(Post-Training Quantization)不需要耦合训练流程,利用成本和时间成本低,往往作为生产量化模型的首选方式,但其可调整空间有限,因此面临更大的准确度挑战,尤其是在一些特殊场景和极端要求下,不得不进一步引入更为复杂的在线量化(Quantization Aware Training)流程挽救,而这极大增加了量化模型生产的复杂度。如何在享受离线量化便捷高效的同时,在有限的调整“夹缝”中提升其成果上限,成为进一步打破技术红线的关键。在ICLR2021上,商汤科技研究院Spring工具链团队、高性能计算团队和成都电子科技大学顾实老师团队合作提出了块重修技术BRECQ,重新审视量化模型的优化粒度,首次将离线量化在4bit上的成果提升到在线量化的水平,相比在线量化可以节省大于200倍的生产时间,BRECQ在多种搜集和任务上普遍取得了业界最佳成果,打造了离线量化的新极限。

    2021年 3月 26日
  • 新晋图灵奖得主Jeff Ullman受质疑,反对者:他享受了不该享受的荣誉

    他写出了传世的经典课本「龙书」,却因为出格的言论招来了争议。

    2021年 4月 6日
  • 一种多用途深度进修方法,用于CITE-seq和单细胞RNA-seq数据与细胞表面蛋白猜测和插补的集成

    编辑 | 萝卜皮CITE-seq 是一种单细胞多组学技术,可同时测量单细胞中 RNA 和蛋白质的抒发,已广泛应用于生物医学研讨,特别是免疫相关疾病和其他疾病,如流感和 COVID-19。尽管 CITE-seq 激增,但生成此类数据的成本仍然很高。尽管数据集成可以增加信息内容,但这带来了计算应战。首先,组合多个数据集容易产生需要解决的批处理效应。其次,很难组合多个 CITE-seq 数据集,因为不同数据分散的蛋白质面板可能仅部分堆叠。整合多个 CITE-seq 和单细胞 RNA 测序 (scRNA-seq) 数据集很

    2022年 10月 31日
  • 从AI小冰的迭代看AI手艺的代际演进

    「机器之心2021-2022年度AI趋势大咖说」聚焦「驱动未来的AI手艺」与「重塑产业的AI科技」,推出线上分享,共邀请近40位AI规模知名学者、产业专家及企业高管通过主题分享及多人圆桌等形式,与行业精英、读者、观众共同回顾 2021年中的重要手艺和学术热点,盘点AI产业的年度研究方位以及重大科技突破,展望2022年度AI手艺发展方位、AI手艺与产业科技融合趋势。

    2022年 7月 25日
  • Hologres揭秘:深度解析高效率分布式查问引擎

    Hologres(中文名交互式分析)是阿里云自研的一站式及时数仓,这个云原生体系融合了及时服务和分析大数据的场景,全面兼容PostgreSQL协议并与大数据生态无缝打通,能用同一套数据架构同时支持及时写入及时查问以及及时离线联邦分析。它的出现简化了业务的架构,与此同时为业务提供及时决策的能力,让大数据发挥出更大的商业价值。Hologres作为HSAP服务分析一体化的落地最佳实践,其查问引擎是一个完全自研的施行引擎,它的核心设计目标是支持所有类型的分布式分析和服务查问,并做到极致查问机能。为了做到这一点,我们借鉴了各

    2021年 8月 11日
  • 人工智能帮助创造系外行星上的份子,甚至有一天大概会创造新的物理定律

    编辑 | 萝卜皮你知道地球的大气是由什么组成的吗?你大概记得它是氧气,也大概是氮气。借助 Google 的一点帮助,您可以轻松得出更精确的谜底:78% 的氮气、21% 的氧气和 1% 的氩气。大气可以表明行星的性质,以及它们是不是可以承载生命。然而,当谈到外大气层——太阳系外行星的大气层——的组成时,谜底是未知的。由于系外行星如此遥远,已证明探测它们的大气层极其困难。研讨表明,人工智能 (AI) 大概是探索它们的最佳选择——但前提是能够证明这些算

    2021年 12月 10日
  • 过失调试精确到行、match-case模式匹配……Python 3.10正式版真的很友好

    几天前,Python 3.10 正式版终于颁布了。这次,想必每个程序员都会爱上它。

    2021年 10月 12日
  • 【重磅】世界人工智能大会——2021全世界AI财产人材高峰论坛强势来袭!

    图灵奖得主、中外院士、独角兽企业掌门人云集;智能芯片、类脑智能、双碳经济、未来医院、数字家园等热点话题荟萃;人形机械人、训练芯片等首发展品精彩纷呈;超大规模预训练模型等尖端成果竞逐大奖;还有数字人民币、无人驾驶、智慧商业等鲜活体验。

    2021年 6月 23日

发表回复

您的电子邮箱地址不会被公开。 必填项已用 * 标注