baidu李士岩:两年内,每个人有望实行「数字人自由」

元宇宙无疑是2021年的概念顶流,在巨头下场、web 3.0加速构建过程中,虚构数字人作为元宇宙的场景入口与连接纽带也备受瞩目。今年的江苏卫视跨年晚会上,周深与邓丽君跨时空合唱《大鱼》刷屏。

面对数字人展现出的众多可能性,2022年1月14日,baidu科技沙龙《AI呀,我去!》第四期以数字人为主题,为百余位媒体、专家学者展现了数字人财产的全景。

会上,baidu智能云AI人机交互实验室负责人李士岩鉴于多年经验,围绕当前数字人财产的发展款式、技能难点和底层驱动力进行了系统分享。李士岩表示,虚构数字人财产款式中,提供建模、渲染、动态捕捉等办事于数字人制造的基础设施办事商已形成稳固款式,大多由海外巨头把持。但在工具、应用层,中国企业已开始崭露头角。

不过,数字人规模化落地还面临三大难点:财产链割裂、办事场景与演艺场景没有有效打通、满足高频需要成本高。为系统解决这些难题,baidu推出数字人平台「曦灵」,未来数字人生产、内容创作、业务配置办事将可以在一个平台上实行全链路制造和调优,降本增效。「我们近两年的奋斗目标是,通过baidu智能云曦灵平台的开放,让每个人实行数字人自由。」李士岩表示。

数字人大规模落地要突破三大难题

目前,数字人经历了以「纸片人」为代表的1.0阶段,以Vtuber主播为代表的2.0时代,已进化至3.0阶段,具有模型高精、人工智能驱动特点的数字人3.0成为行业主流。李士岩介绍,第三代数字人的建模和内容生产均有AI参与,这使得数字人的制造效率更高,也更智能,能面向更多应用场景。可面向全群体用户,可由视频、直播、chatbot等载体承载,更具有千人千面的互动威力。

数字人3.0已展现出巨大的市场空间。根据次元光谱不完全统计,2021年国内虚构偶像/数字人领域里至少发生19笔融资,2021年财产上下游也纷纷从自己擅长的角度切入市场。虚构数字人财产款式中,提供建模、渲染、动态捕捉等办事于数字人制造的基础设施办事商已形成稳固款式,大多由海外巨头把持。不过,在工具、应用层,中国企业已开始崭露头角。

中国企业中,数量最多的是资产制造和策划运营类的公司,比如推出超写实数字人的AYAYI燃麦科技,推出虚构人物柳夜熙的创壹视频,但这类公司面临的挑战是门槛较低、可替代性高。此外,掌握技能和场景的互联网公司则扮演综合性技能办事商的角色,一边推出鉴于自身优势场景的数字人,打造应用标杆;一边推出数字人平台,将产品继续落地到更细化的场景中,点、线互相推进。

baidu李士岩:两年内,每个人有望实行「数字人自由」

李士岩表示,数字人财产有三大核心推动力,第一级火箭是用户需要与技能升级、第二级是政策支持与资本涌入、第三级是计算平台的迭代。「每一次数字人发展本质上都是技能推动的,用户从平面的图文影音获取信息与交互,向实时3D交互反馈的需要转变,将成为数字人长期发展的根本动能,未来也将创造大量需要。」李士岩说。

虽然数字人行业拥有强劲的驱动力,但李士岩认为,当下国内数字人要大规模财产落地还面临三大难题。

首先,数字人财产链各个节点相对割裂,不能高效协同,导致数字人在制造和调优上存在较高壁垒,目前行业中大多数公司只是数字人制造与运营全流程上的一环或其中几环。其次,办事场景与演艺场景没有有效打通,表现为演艺型数字人不具有客户所需的业务威力,而办事型数字人缺乏人设,难以与用户进行情感交流。第三是满足高机动性、高频需要的成本依旧很高,这一问题归根结底还是数字人的生产效率问题。

baidu推出数字人平台「曦灵」

面对当前数字人制造的高门槛,2021年12月,baiducreate大会(baiduAI开发者大会)上,baiduCTO王海峰正式发布了「baidu智能云曦灵数字人平台」, 搭建集数字人生产、内容创作、业务配置办事为一体的平台级产品。目前该产品已具有标准平台的快速交付威力,帮助不同领域客户快速实行敏捷型需要,降本增效。baidu的数字人平台曦灵具有全场景、一站式、平台化的特点,能支持从最初数字人形象定制、人设管理再到业务编排、内容创作,最后到多种驱动模式下与用户互动的全部需要,这也意味着在一个平台上即可实行数字人的全链路调优,从而将效果做到最好。

李士岩以数字人生成环节为例,演示了baidu智能云曦灵平台的功能。用户在baidu智能云曦灵平台上传一张照片,就能快速生成一个可被AI驱动的2D数字人像,以前需要两三个月时间做出来的3D数字人,现在可以压缩到小时级,同时还可以通过一句话语音描述或简单捏脸等多种形式快速生产数字人。数字人个性化功能开发也较之前更加完善,以baidu刚刚发布的3D超写实口语数字人为例,其口型合成准确率高达98.5%。

baidu李士岩:两年内,每个人有望实行「数字人自由」

在技能催生的数字人3.0阶段,虚构人可与不同行业产生更紧密的融合。鉴于市场使用场景,数字人可以分为演艺型数字人、办事型数字人两类。

演艺术型数字人包括虚构主播、虚构偶像以及数字孪生的虚构品牌代言人。目前baidu已经打造了AI手语主播、央视网虚构主持人小C、航天局火星车数字人祝融号、baidu虚构代言人希加加、baiduAPP代言人龚俊数字人。

baidu李士岩:两年内,每个人有望实行「数字人自由」

办事型数字人包括数字员工、虚构员工、虚构业务员等,可以帮助金融、运营商、政府、零售等行业提供鉴于数字人的新一代客户办事威力,解决排队长、回应慢、人力成本大等问题。目前,baidu已经和浦发银行、光大银行、中国联通合作,推出了一对一办事型数字人。 baidu李士岩:两年内,每个人有望实行「数字人自由」

baidu在数字人技能上的突破也得益于其在行业内的持续布局。早在2019年,baidu就开始了「虚构数字人战略」。鉴于多年的AI技能沉淀, AI威力已成为baidu智能云曦灵平台的核心威力,现在baidu也在把这种威力开放给外界。李士岩表示,「我们近两年的奋斗目标是通过baidu智能云曦灵平台的开放,让每个人实行数字人自由。」

原创文章,作者:机器之心,如若转载,请注明出处:https://www.iaiol.com/news/baidu-li-shi-yan-liang-nian-nei-mei-ge-ren-you-wang-shi/

(0)
上一篇 2022年 1月 13日 下午2:48
下一篇 2022年 1月 17日 下午2:46

相关推荐

  • 纯PyTorch语音工具包SpeechBrain开源,Kaldi:我压力有点大

    距离 Mirco Ravanelli 宣布打造新的语音工具包过去了一年多,SpeechBrain 真的如期而至。

    2021年 3月 16日
  • 英伟达研讨生奖学金名单公布:多位华人获选,每人5万美元

    共有 10 位博士生获得 2022-2023 学年英伟达研讨生奖学金。

    2021年 12月 16日
  • 集结云产业核心成员建立分布式智囊团 安迈云受邀助推新一代云盘算

    2021年5月28日,由中关村数智人工智能产业联盟指导,51CTO主办的“云响力Web3.0新一代云盘算大会”在北京圆满落幕,这次峰会集结了来自华为云、腾讯云、京东云、海潮信息等众多一线云盘算厂商,此外,以安迈云为代表的去中心化云盘算企业也受邀参与这次峰会,共同针对Web3.0期间云盘算的成长,探索新的利用场景。汇集云产业链核心成员 建立“分布式智囊团”这次大会不仅在于对新一代云盘算技巧、利用上的实践分享,更是由大会主办方51CTO发起,海潮信息、安迈云、Datenl

    2021年 5月 31日
  • Hologres揭秘:深度解析高效率分布式查问引擎

    Hologres(中文名交互式分析)是阿里云自研的一站式及时数仓,这个云原生体系融合了及时服务和分析大数据的场景,全面兼容PostgreSQL协议并与大数据生态无缝打通,能用同一套数据架构同时支持及时写入及时查问以及及时离线联邦分析。它的出现简化了业务的架构,与此同时为业务提供及时决策的能力,让大数据发挥出更大的商业价值。Hologres作为HSAP服务分析一体化的落地最佳实践,其查问引擎是一个完全自研的施行引擎,它的核心设计目标是支持所有类型的分布式分析和服务查问,并做到极致查问机能。为了做到这一点,我们借鉴了各

    2021年 8月 11日
  • 时空智能新赛道是怎样炼成的?千寻地位引领自立技巧创新突破

    2020年10月,华为推出Mate 40系列旗舰手机,在全球范围内首次完成车道级导航功能,及时显示用户所在车道地位。2020年11月,小鹏汽车智能轿跑P7,通过OTA升级,在深圳、重庆、杭州等高速公路上,可完成NGP高速自立导航驾驶。2020年初,武汉火神山医院在建设中,一次性完成放线测量,精确标绘,与病魔赛跑,向世界展示“十几天建一所医院”的壮举。这一年,人们离自动驾驶更近了,手机导航有了不同的体验,战疫的身影中有了科技力量。在这背后,是时空智能这项中国自立研发的技巧在消费级场景全方位渗透。作为千寻地位开创的硬核

    2021年 5月 27日
  • 3D传感器芯片技能全球率先,灵明光子完成数亿元C轮融资

    新一代全球率先的3D传感器芯片服务商灵明光子完成数亿元C轮融资,领投方为美团龙珠,老股东昆仲资本和高榕资本继续加注,光源资本担任独家财务顾问。融资完成后,公司将加速推进产物量产,并继续在先进领域投入研发,保持技能率先性。灵明光子致力于用国际率先的单光子探测器(SPAD)技能,为手机、激光雷达、机器人、AR装备等提供自主研发的高性能dToF深度传感器芯片。自2018年成立以来,灵明光子已迅速完成多轮融资,并引入小米、OPPO、欧菲光等产业资本,显示出商场对于灵明光子dToF芯片研发能力和运用前景的看好。dToF(di

    2022年 4月 11日
  • 关于人工智能的未来,张亚勤、张宏江在聊什么

    “我们打造一个规模庞大的体系时,更需要具备体系思维,同时拥有动手能力、喜欢搭体系的能人……诞生至今,智源一直肩负着三项重要任务:一是构筑一个社区。二是打造一个真正适合青年科学家成长的平台。三是专注于一些可能产生原始革新与长期影响的畛域。”张宏江 北京智源人工智能钻研院理事长“在AIR,所有人的工作目标,是确定我们的钻研和技巧能够对家当有影响力, 或者赋能现有家当,或者孵化新的企业。在数据和AI的世界里, 钻研员和工程师的界限更加模糊, 因此我们会跟拥有大量数据和真实场景的企业合作。”张亚勤 清华大学智能家当钻研院院

    2021年 3月 30日
  • AI模型被「骗」怎么破?《燃烧吧!天才程序员》冠军团队解决方案出炉

    前段时间,一档名为《燃烧吧!天才程序员》的竞赛类综艺让「程序员」这一群体成功破圈,也呈现了 AI 在解决实际问题的过程中面临的一些挑战,如数据集中存在对立样本、图象中存在噪声等。在本文中,CLS 战队(大赛头名团队)的优秀选手、奥比中光算法工程师埼玉详细解读了他们在竞争中用到的解决方案。近日,由蚂蚁集团、清华大学等组织共同协办的首届「Inclusion|A-tech 科技精英赛」(以下简称 A-tech 大赛)圆满落幕。奥比中光科技集团股份有限公司 (以下简称「奥比中光」) 研究院 SDK 组负责人小蛮腰、算法工程

    2021年 1月 21日
  • IDEA钻研院工程总监谢育涛谈AI创新的对象:工欲善其事必先利其器

    AI 领域有没有好用的科研对象?谢育涛团队打造 AI 对象显著提升 AI 科研效率。

    2022年 4月 3日
  • 抖音「神曲」那么多,字节跳动是如何玩转亿级曲库的?

    在今年的音乐科技顶会 ISMIR 2021(International Society for Music Information Retrieval)上,字节跳动海外手艺团队有 7 篇论文入选,涵盖了音乐分类、音乐标签、音源别离、音乐构造综合等多个手艺方向。如今抖音已经成为音乐宣发的一个重要渠道。一支支音乐先在抖音上以短视频 BGM 火起来,再扩散到各大音乐平台上。抖音神曲甚至成了很多音乐平台的一个重要分类。有人说神曲能火是因为歌词和旋律简单,听得多了就印在脑子里。但是对一个有着海量用户、复杂多样内容场

    2021年 8月 12日

发表回复

您的电子邮箱地址不会被公开。 必填项已用 * 标注