体会过baidu文心一言,也许真会超出你的预期

baidu文心一言动机到底怎样呢?我们亲自试了试,结果发现……

数天前,GPT-4 的发布可以说给全球科技巨头都带来了巨大的压力,即使是谷歌,都似乎被压的有些抬不起头。

而在国内,一直闷头打造文心一言的baidu昨日站到了聚光灯下。

顶着 GPT-4 带来的压力,昨日baidu正式发布了常识巩固大谈话模型「文心一言」。

体会过baidu文心一言,也许真会超出你的预期

在当天的 Demo 环节,baidu创始人、董事长兼 CEO 李彦宏展示了文心一言在文学创作、商业文案创作、数理逻辑推算、华文了解和多模态生成五大方面的本领。

中国俗话说,是骡子是马拉出来遛遛。在拿到测试资格后,机器之心立即体会了一把文心一言。

体会过baidu文心一言,也许真会超出你的预期

图:文心一言的对话界面

初体会带来的惊喜

在获得体会资格后,很多读者期待我们用这些问题来测试文心一言。

下图中为 GPT-4 为文心一言设计的测试题,从文学、翻译、创作、逻辑推理等多个角度测试,在网上也广为流传。

体会过baidu文心一言,也许真会超出你的预期

那么结果如何?我们挑选了几个有代表性的回答来看。

首先是翻译问题,要求翻译成「优美」的华文诗句。动机确实很赞。

体会过baidu文心一言,也许真会超出你的预期

然后是量子纠缠的科学问题,从结果来看常识性的回答动机不错。

体会过baidu文心一言,也许真会超出你的预期

最后的逻辑推理问题:回答有缺陷。但从结果中我们明显可以看出文心一言是的确进行分析了,有思维链,但是结果不对。

体会过baidu文心一言,也许真会超出你的预期

然后,我们也测试了一个在 ChatGPT 上经常玩的梗,文心一言也能拿捏。

体会过baidu文心一言,也许真会超出你的预期

另外,文心一言也具备多模态生成本领,包括生成图片、生成语音(包括方言)以及生成视频的本领。

以生成图片为例,我们让文心一言生成了一张湖心亭看雪的水墨画,生成速度、动机都挺令人满意的。

体会过baidu文心一言,也许真会超出你的预期

现场李彦宏 Demo 的生成视频的本领给观众留下深刻印象。但目前还未开放,期待后续的更新。

体会过baidu文心一言,也许真会超出你的预期

一番体会下来, 文心一言真的超乎了我们的预期。目前来看,脑暴的题目答的很好;翻译和文生图的动机真的很赞;写代码本领还有很大的提升空间。虽然有的问题也会和 ChatGPT 一样「胡说八道」,但毕竟崭新出炉,相信后续迭代会有提升。

专注华文了解与生成

揭秘文心一言背后的关键手艺

体会完文心一言,我们来了解下其背后的手艺。在昨天的发布会上,baidu CTO 王海峰总结介绍了文心一言背后的关键手艺。

从整体来看,baidu文心一言鉴于常识巩固千亿大模型 ERNIE,同时借鉴了文心对话大模型 PLATO,二者的手艺都在文心一言身上得到了延伸,在训练过程中不断改进。

具体来讲,文心一言包含了六个核心手艺模块,分别是有监督精调、人类反应的加强进修、提醒以及常识巩固、检索巩固和对话巩固。其中前三类手艺是对话大模型都会用到的,后三类手艺为baidu已有手艺优势的再创新,它们共同构筑了文心一言的手艺根基,并在对话动机上得到充分释放和呈现。

体会过baidu文心一言,也许真会超出你的预期

持续优化对话大模型通用手艺

针对有监督精调,除了标准的有监督精调手艺,baidu也做了针对性的优化。首先文心一言做了更多华文标注数据,鉴于对中国谈话文化和华文利用场景的了解来选择数据,因而在华文任务上更好用。其次服务利用,baidu在为其个人用户和企业客户服务中积累了大量对利用需求的了解,在精调数据时发挥了作用。最后富含常识,除了将常识图谱利用在常识巩固过程中,还鉴于常识图谱产生了很多事实证明有效的数据来用于数据精调。

体会过baidu文心一言,也许真会超出你的预期

我们知道,OpenAI 在调优 ChatGPT 时使用了监督进修和加强进修的组合,其中加强进修组件用到了人类反应的加强进修(RLHF)训练机制,使得模型在训练中使用人类反应以最小化无益、失真或偏见的输出。

baidu也非常看重 RLHF 机制在训练中的重要性,提出了一套完整的手艺,也被证明非常有效。首先接收人类反应,然后使用反应数据来训练奖励模型,最后再做加强进修的策略优化。但应看到,由于文心一言刚刚上线,用户需求和反应数据尚不充分,因而后续一定会鉴于更多真实反应获得进化。

体会过baidu文心一言,也许真会超出你的预期

提醒(prompt)已经成为与大模型尤其是对话大模型互动最自然直观的方式。千亿以上参数的大模型往往蕴含了极其丰富的数据和常识,如何快速准确找到并利用这些数据和常识变得至关重要。这时提醒建立得好不好将直接影响谈话模型表现出的本领,因此文心一言在这方面下了大功夫

当用户输入提醒时可以鉴于很多自动建立的方法来提升动机,比如补充实例(解题时给出示例)、创作时给出提纲、规范等。此外大谈话模型也会出现错误,这时加入已知的准确常识点也能提升回答准确性。最后在建立提醒时加入思维链也会使答案更合理,逻辑更清晰。

体会过baidu文心一言,也许真会超出你的预期

独特优势构成文心一言强大根基

除了继续加强打磨大谈话模型的通用手艺,baidu还针对常识巩固、检索巩固和对话巩固三个已有优势进行再创新。

常识巩固是文心大模型的核心特色之一,通过从海量的常识和数据中融合进修,模型能够实现更高的效率、更好的动机、更强的可解释性。做到这些需要两方面的手艺 —— 常识内化和常识外用。常识内化是从大规模常识和无标注数据中,鉴于语义单元进修,利用常识构造训练数据,将常识进修到模型参数中;常识外用是指常识在模型参数中未内化进去,但在推理过程中引入外部多源异构常识,做常识推理、提醒建立等。

此外通过常识图谱来建立训练数据,达到常识内化的动机。baidu拥有世界上最大的多源异构常识图谱,包含了 50 亿实体和 5500 亿事实,并在不断演进和更新。除了鉴于常识图谱进行常识推理,还可以鉴于常识来建立提醒。

体会过baidu文心一言,也许真会超出你的预期

baidu在搜寻领域拥有很多领先手艺,每天响应几十亿次真实的用户使用需求。发展到了今天,baidu新一代搜寻架构已经发展到了鉴于语义了解和匹配,其华文心大模型分别了解用户输入和文档,形成双塔模型,然后鉴于了解进行匹配。

这套搜寻架构与包括文心一言在内的文心大模型有着天然不可分的关联,在做生成模型时可以进行联合优化,将检索中一些有价值的结果(如精准的信息)带入生成过程。通过引入搜寻结果,为大模型提供时效性强、准确率高的参考信息,更好地满足用户需求。

体会过baidu文心一言,也许真会超出你的预期

baidu在对话领域同样拥有很多对话手艺和利用积累。我们知道,对话很多时候不是一个问题和一个答案,有上下文的多轮对话才是常态,因此记忆机制和上下文了解都很重要。同时长对话还要考虑对话规划,这些结合起来才能实现更好的对话连贯性、合理性和逻辑性。

体会过baidu文心一言,也许真会超出你的预期

可以看到,打造出一个出色的大模型哪有那么容易,在手艺上需要持续创新。AI 研发就像烧一壶开水,比 100℃更难的是从 0℃到 99℃。王海峰表示,文心一言是baidu多年手艺积累和产业实践的水到渠成。

这一切可以追溯到 2010 年,彼时深度进修尚未大火,baidu即开始全面布局人工智能,是全球为数不多、进行全栈布局的人工智能公司。从底层芯片到框架、模型和利用,baidu都拥有领先的自研手艺和产品,通过层与层之间的相互反应、端到端优化提升效率,贯通整个 AI 全产业链。

尤其飞桨深度进修平台和文心大模型的联合优化为文心一言提供了坚实的手艺支撑。飞桨支撑了文心一言从开发训练到推理部署的整个流程,在开发训练层面,飞桨动静统一的开发范式和自适应分布式架构,实现大模型的灵活开发和高效训练;在推理部署层面,飞桨支持大模型高效推理,提供服务化部署本领,包括计算融合、软硬协同的稀疏量化、模型压缩等。

体会过baidu文心一言,也许真会超出你的预期

同时,文心大模型自 2019 年发布 ERNIE 1.0 以来,已经全面涵盖了 NLP、CV、跨模态、生物计算以及行业大模型,并鉴于大模型推出了 AI 作画产品文心一格和产业级搜寻系统文心百中。

飞桨深度进修平台和文心大模型是支撑文心一言的底气。文心一言还延续了文心大模型常识巩固的特色,通过了解和生成本领的集成获得极大助益。

作为国内搜寻领域的头号玩家,在可预见的未来,baidu或将凭借文心一言引领华文搜寻市场的代际变革,为用户带来更便捷友好的搜寻体会。此外以文心一言为契机的大谈话模型和生成式 AI 也将助力金融、能源、媒体、政务等千行百业的智能化变革。

正如李彦宏在会上所说,「baidu希望和大家一起,推动人工智能手艺进步,让所有人都能使用最先进的生产力工具,让所有人都能从中受益。」

最后感慨一句,ChatGPT、GPT-4 的连番发布,让我们一直忧心中国 AI 手艺能否跟上海外的步伐。昨天baidu的新闻发布会,我们能看到有人调侃吐槽,但也看到更多人愿意抱着宽容的态度看待baidu勇敢迈出的第一步。期待在baidu的这一步之后,更多中国企业能够走的更远。

读者福利:机器之心获得了 5 个邀请码,请大家留言自己想和文心一言互动的问题,今天24点前点赞高的5个读者将获得。

给TA打赏
共{{data.count}}人
人已打赏
AI

光学算法简化摹拟人工智能训练

2023-3-15 16:27:00

AI

GPT-4为通过人机验证,试图雇人给自己打工,还骗了对方

2023-3-18 15:09:00

0 条回复 A文章作者 M管理员
    暂无讨论,说说你的看法吧
个人中心
今日签到
有新私信 私信列表
搜索