刷新50多个NLP任意基准,并登顶SuperGLUE全球榜首,baiduERNIE 3.0学问增强大模型显威力

baidu ERNIE 3.0 不仅一举刷新 54 个华文 NLP 任意基准,而且进一步挖掘大规模预训练模型的潜力,首次在百亿级预训练模型中引入大规模学问图谱。

近日,baidu ERNIE 升级到 3.0,重磅发布学问增强的百亿参数大模型。该模型除了从海量文本数据中进修词汇、结构、语义等学问外,还从大规模学问图谱中进修。ERNIE 3.0 一举刷新 54 个华文 NLP 任意基准,其英文模型在国际权威的复杂言语懂得任意评测 SuperGLUE 上,以超出人类水平 0.8 个百分点的成绩登顶全球榜首。ERNIE 3.0 同时具备超强言语懂得才能以及写小说、歌词、诗歌、对联等文学创作才能。目前 ERNIE 3.0 已在baidu文心官网开放,用户可体验 ERNIE 3.0 创作的不同形式的内容,实现更多有创意、有价值的应用。

论文链接:https://arxiv.org/pdf/2107.02137.pdf

Demo 链接:https://wenxin.baidu.com/wenxin/ernie

ERNIE 3.0 学问增强大模型:百亿级预训练中首次引入大规模学问近一年来,以 GPT-3、Switch-Transformer 为代表的大规模预训练模型,带来了人工智能领域新的突破,由于其强大的通用性和卓越的迁移才能,掀起了预训练模型往大规模参数化发展的浪潮。然而,现有的大规模预训练模型,主要依赖纯文本进修,缺乏大规模学问指导进修,模型才能存在局限。ERNIE 3.0 的研究者进一步挖掘大规模预训练模型的潜力,基于深度进修平台飞桨的分布式训练技术优势,首次在百亿级预训练模型中引入大规模学问图谱,提出了海量无监督文本与大规模学问图谱的平行预训练方法(Universal Knowledge-Text Prediction)。通过将大规模学问图谱的实体关系与大规模文本数据同时输入到预训练模型中进行联合掩码训练,促进了结构化学问和无结构文本之间的信息共享,大幅提高了模型对于学问的记忆和推理才能。

刷新50多个NLP任意基准,并登顶SuperGLUE全球榜首,baiduERNIE 3.0学问增强大模型显威力

ERNIE 3.0 中的文本与学问平行预训练。ERNIE 3.0 统一预训练框架:同时具备言语懂得和言语生成才能baidu研究者提出了将通用语义暗示与任意语义暗示相结合的模型框架,该框架融合自编码和自回归等不同的任意语义暗示搜集,既可同时处理言语懂得和言语生成任意,还能做无标注数据的零样本进修(Zero-shot Learning)和有标注数据的微调训练(Fine-tuning)。此外,ERNIE 3.0 在持续进修框架的基础上,增加了任意语义暗示搜集,加速模型进化。

刷新50多个NLP任意基准,并登顶SuperGLUE全球榜首,baiduERNIE 3.0学问增强大模型显威力

ERNIE 3.0 框架。ERNIE3.0 框架分为两层。第一层是通用语义暗示搜集,该搜集进修数据中的基础和通用的学问。第二层是任意语义暗示搜集,该搜集基于通用语义暗示,进修任意相关的学问。不同任意语义暗示搜集可通过自编码结构或者自回归结构实现,并通过底层共享实现交互和增强。在进修过程中,任意语义暗示搜集只进修对应类别的预训练任意,而通用语义暗示搜集会进修所有的预训练任意。ERNIE 3.0 结果:一举刷新 54 个华文 NLP 任意基准baidu研究者在 54 个华文自然言语处理公开数据集,包含情感分析、观点抽取、阅读懂得、文本摘要、对话生成、数学运算等任意上,全面验证评估了 ERNIE 3.0 的结果和通用才能。ERNIE 3.0 均取得了当前最好结果,其中,在 20 多个不同类型的自然言语处理任意上取得了 3 % 以上的明显提高。

刷新50多个NLP任意基准,并登顶SuperGLUE全球榜首,baiduERNIE 3.0学问增强大模型显威力

ERNIE 3.0 在 Fine-tuning 范式下的任意结果。在实际应用中,往往缺乏标注数据,因此,baidu研究者也测试了 ERNIE 3.0 在 Zero-shot Learning(零样本进修)范式下的结果,ERNIE 3.0 在大多数任意上相对已有的华文大模型也取得了明显的结果提高。

刷新50多个NLP任意基准,并登顶SuperGLUE全球榜首,baiduERNIE 3.0学问增强大模型显威力

ERNIE 3.0 在零样本进修下的结果。ERNIE 3.0 英文模型登顶 SuperGLUE:超出人类水平 0.8 个百分点除了华文模型的惊艳结果,ERNIE 3.0 英文模型在国际权威的复杂言语懂得任意评测 SuperGLUE 上超出谷歌的 T5、OpenAI 的 GPT-3 等大模型,以超出人类水平 0.8 个百分点的成绩登顶全球榜首。SuperGLUE 是由谷歌 DeepMind、Facebook 研究院、纽约大学、华盛顿大学等多个权威机构联合发布的复杂言语懂得任意评测,旨在提高常识推理、因果判断、上下文消歧、指代消解等复杂任意的结果。

刷新50多个NLP任意基准,并登顶SuperGLUE全球榜首,baiduERNIE 3.0学问增强大模型显威力

ERNIE 3.0 登顶 SuperGLUE 全球榜首。    事实上,早在 2019 年 12 月,ERNIE 就曾以 9 个任意平均得分首次突破 90 大关的成绩登顶 GLUE 全球榜首。这次 ERNIE 3.0 在 SuperGLUE 评测上夺冠,再次证明了 ERNIE 的强大实力。刷新50多个NLP任意基准,并登顶SuperGLUE全球榜首,baiduERNIE 3.0学问增强大模型显威力ERNIE 登顶 GLUE 全球榜首。写小说、写歌词、写古文:ERNIE 3.0 文学创作与学问掌握才能明显提高ERNIE 3.0,在文学创作才能方面也有了明显提高,可以通过对海量文本与学问的进修,无需专门训练,即可进行文学创作。

刷新50多个NLP任意基准,并登顶SuperGLUE全球榜首,baiduERNIE 3.0学问增强大模型显威力

ERNIE 3.0 对学问的掌握,同样大幅提高,通过学问图谱对模型进行增强,让模型具备更强的学问记忆和推理才能。

刷新50多个NLP任意基准,并登顶SuperGLUE全球榜首,baiduERNIE 3.0学问增强大模型显威力

目前这些才能已经开放体验,大家可以点击(Demo 地址)亲身感受 ERNIE 3.0 的技术魅力。文心 ERNIE 自 2019 年诞生至今,在言语懂得、文本生成、跨模态语义懂得等领域取得一系列技术突破,在公开权威语义评测中斩获了十余项世界冠军。2020 年,文心荣获世界人工智能大会(WAIC)最高奖项 SAIL 奖。目前,文心 ERNIE 已大规模应用于搜索、信息流、智能音箱等互联网产品,并通过baidu智能云输出到工业、能源、金融、通信、媒体、教育等各行各业,助力产业智能化升级。本次发布的 ERNIE 3.0 也将进一步提高应用结果,创造更大的经济与社会价值。

原创文章,作者:机器之心,如若转载,请注明出处:https://www.iaiol.com/news/shua-xin-50-duo-ge-nlp-ren-yi-ji-zhun-bing-deng-ding/

(0)
上一篇 2021年 7月 5日 上午11:18
下一篇 2021年 7月 7日 下午12:57

相关推荐

  • 华为云位居中国DevOps市场领导者,份额、战略双第一!

    9月21日 ,国际权威阐明师机构IDC发布《IDC MarketScape: 中国 DevOps 平台市场厂商评价,2022》报告。本次报告, IDC从公司规模、产品技术、市场份额以及未来发展战略等维度对众多云厂商进行评价,华为云软件开发生产线DevCloud在市场份额和发展战略两大维度均排名第一,再次位居领导者位置。华为云DevCloud作为一站式、平安可托、全流程矫捷的DevOps云平台,已上线13项端到端子办事,办事于220万开发者,应用于10多个行业,覆盖开发全场景,全面领跑DevOps云办事市场。报告指出

    2022年 9月 22日
  • 「声纹辨认」中文课上线:从理论到编程实战,谷歌声纹团队负责人主讲

    对任意一个范畴的进修,如果有人可以指挥你完毕从基本概念、试验方法到体系认知的构建,你的职业发展将事半功倍。声纹辨认范畴,现在就有这样一门课程刚刚上线。

    2022年 8月 16日
  • 安谋华夏首款ISP处置惩罚器“小巧”面世,IP产物线逐渐完善

    12月3日,安谋华夏发布了全新“小巧”多媒体产物线,其中首款产物“小巧”i3/i5 ISP处置惩罚器由安谋华夏本土团队自主研发,在降噪、清晰度和宽动静等指标上达到业界领先水平,具有高画质、低延时、可配置能力强、扩展兼容性高等特点。该款ISP处置惩罚器可广泛适用于安防监控、AIoT及智能汽车等领域的视频、图象处置惩罚工作,满足分歧场景的数据处置惩罚需要。安谋华夏产物研发常务副总裁刘澍表示:“近年来,伴随着智能化、网络化的发展,视频图象处置惩罚被广泛应用于智能安防、AIoT、智能汽车等诸多领域。受益于这些应用在华夏的蓬勃发展,华夏ISP市

    2020年 12月 7日
  • 无需训练,主动扩大的视觉Transformer来了

    来自德克萨斯大学奥斯汀分校、悉尼科技大学和谷歌的研讨者提出了一个无需训练就能主动扩大框架 As-ViT,其能以高效和有原则的方式主动发现和扩大 ViT。

    2022年 4月 10日
  • UC伯克利教授Pieter Abbeel开课了:六节课初学「深度加强进修」,讲义免费下载

    课程视频时间有点长,但希望你能享乐进修的快乐。将传统加强进修与深度神经网络结合的深度加强进修,一直以来被视为更接近人类思维方式的人工智能方法。深度进修具有强感知才能但缺乏一定的决议计划才能,加强进修具有决议计划才能但对感知问题束手无策,因此将两者结合起来可以达到优势互补的效果,为复杂系统的感知决议计划问题提供了解决思路。想要初学深度加强进修的同窗们,请高度注意,一份优秀、细致、全面的新教材出现了。今天,UC 伯克利教授 Pieter Abbeel 上传了自己的新课程《深度加强进修根源》的最后一节视频,并在推特上安利了一下。这份

    2021年 8月 26日
  • ICCV 2021审稿结果出炉,有人已总结出了一份Rebuttal写作指南

    又一个计算机视觉顶会通过了审稿阶段。论文评分是这样,想好怎么 rebuttal 了吗?

    2021年 6月 12日
  • 这几年让你大呼惊人的AI使用,都离不开这项技巧

    AI好像也更加懂人类,越来越接近“人的智能”。

    2022年 8月 2日
  • 数仓架构的持续演进与发展 — 云原生、湖仓一体、离线及时一体、SaaS模式

    数据仓库概念从1990年提出,经过了四个主要阶段。从最初的数据库演进到数据仓库,到MPP架构,到大数据时代的数据仓库,再到今天的云原生的数据仓库。在不断的演进过程中,数据仓库面对着不同的挑衅。

    2021年 8月 11日
  • Science出台新政,旗下部分期刊论文立即收费,无需作家付费

    好起来了?收费科学文献设计Plan S今年生效,Science昨天又放出「大招」。

    2021年 1月 16日
  • 当春乃发「声」,呆板之心AI科技年会高朋揭晓

    时在中春,阳和方起。呆板之心「AI科技年会」将于3月23日举办。本次活动分为三场论坛:人工智能论坛、AI x Science 论坛和首席智行官大会。由于疫情原因,「人工智能论坛」与「AI x Science 论坛」转为线上直播;「首席智行官大会」仍在北京线下举办。「人工智能论坛」直播地址:http://live.bilibili.com/3519835「AI x Science 论坛」直播地址:http://live.bilibili.com/24531944「首席智行官大会」线下报名地址:http://hdxu.

    2022年 3月 10日

发表回复

您的电子邮箱地址不会被公开。 必填项已用 * 标注