WAIC 2021 | 云天励飞副总裁肖嵘:创「芯」时代 打造自进化都市智能体

在 WAIC 2021 AI 开发者论坛上,肖嵘发表主题演讲《创「芯」时代 打造自进化都市智能体》,在演讲中,他主要介绍了自进化都市智能体,并介绍了云天励飞最新研究成果及成功案例。

以下为肖嵘在 WAIC 2021 AI 开发者论坛上的演讲内容,机器之心进行了不改变原意的编辑、整理:

图片

现在,人工智能快速运用的过程中会遇到大量的长尾运用算法,不少开发者忙着做调参,如今有许多新的调参方法,使调参这件事变得越来越简单、方便。另外还有标注题目,做新场景、新场景适应模型等都面临不少困难。在这些情况下,人工智能整个运用研发最后会变成什么?是大量标注数据、调参吗?显然不是。未来智能如何发展?可以说未来整个智能的发展是往自进修、自进化方面进行的。我今天演讲的主要内容是关于自进化都市智能体的相关内容。智慧都市的发展与面临题目首先智慧都市的发展可分为几个阶段,2008 年 IBM 提出智慧都市的观点,同时提出了一些行业解决方案,但是当时整个网络、算力都有题目,智慧都市还处于初级阶段,即理念上的观点;2.0 观点大约开始于 2012 年,云的观点开始发展,例如阿里云开始有云上贵州这样的平台,这一阶段主要是平台的解决方案;真正的智能发展其实是 2015、2016 年,当时标志性事件,例如 AlphaGo 打败人类,研究者对智能掀起了很大的热情。实际上智能也解决了不少题目,当时阿里在智慧交通这一块做了不少工作。

图片

到目前为止,时间已经过去了 5 年,在这过去的 5 年之中,人工智能运用越来越多,但同时带来的题目也随之增加,目前主要面临三个重要题目,此外还有硬件方面题目。三个运用方面题目之中,主要是需求多样,以及两个大的运用部署题目。首先当场景发生变化时,人工智能模型可能不工作。此外相似的场景、相似的需求不少,例如今天要去检测路上有没有积水,明天要去检测垃圾桶有没有满,这种类似的检测题目不少、识别题目也不少,目前像这种长尾需求不能得到很好满足。以至于到后来大家发现,所有的公司都在招 AI 人才,因为 AI 运用范围太广。市场上所有人工智能企业最痛苦的事情就是招不到人,人才招聘也是一个困境。第二是可靠性题目,现在不少运用都是在云端部署的,如果端侧网络出现题目,那么用户服务体验就会出现很大题目。还有就是安全性题目,如果架构都在云端部署,未来所有的数据、端侧的海量数据往云端传,这样就会带来安全性题目。另外,还有数据收集有效性题目,海量数据往云端传,数据流量会不会特别大?此外,还有一个题目,就是端侧是不是真具有这么大的智能,能不能用端侧智能把这些题目解决掉,这同样也是一个很大的题目。端侧智能还存在部署难等题目。

图片

AI 的普适性虽然有这么多题目,但是我们可以看到智能的发展趋势基本上还是在往自进化都市智能体发展,原因在哪?首先自进化都市智能体应该具备两个要素:

第一是 AI 的普适性,普适性就是 AI 像电力一样无处不在;

第二是 AI 整个运用的研发和部署环节,一定是自进修、自进化,可以自主地演化。

图片

关于普适性题目,相对的就是较量争论无处不在的题目。普适较量争论这个观点讲了不少年,它背后的隐藏逻辑是算力的快速提高。以 1999-2020 年的 GeForce256 显卡到最新的 RTX3090 为例,算力提高了约 400 倍。CPU 的性能提高很大,网络速度提高也无比明显。2000 年时大家还在用 ADSL,而现在比较快的 5G 网络已达到 20Gb/s 了。以此为背景,运用研发也发生了很大变化,最早单机较量争论、网络较量争论、云较量争论、雾较量争论,此外还有边缘较量争论,较量争论其实已经开始从云向雾普及。

图片

端侧智能智能在云端已经无比普及,未来智能往端侧发展会遇到什么挑战?目前来看已经万事俱备,以最经典的 AlexNet 网络为例,AlexNet 大约在 2012 年被提出,精度达到 60% 左右,同样的 EfficientNet 模型精度可以提高 1.37 倍,而模型尺寸差不多缩小了 71 倍。从中我们可以得出模型越来越小、效率却越来越高。在端侧运用方面,硬件速度提高也无比大,以英伟达端侧芯片为例,2011 年芯片速度跟 2020 年芯片速度进行比较,速度提高了三百多倍。可以说端侧整个运用万事俱备。

图片

与端侧智能相对比的是云端智能,云端智能面临的题目是高时延、网络的低可靠性,数据中心大、不好扩充,存在安全隐患以及隐私隐患。而端侧智能优势很大,可以很好地解决这些题目,端侧智能可以实时访问、进行智能的数据筛选和过滤,数据隐私保护的也很好。

图片

目前端侧智能普及还面临一些题目、一些挑战,可总结为四个方面:芯片指令级效率还需要继续持续提高,不够高效;芯片架构不够灵活;处理工具链不易用,例如端侧异构性、工具不统一;算法研发周期长、部署困难。

图片

云天励飞端侧部署云天励飞的端侧部署以算法芯片化部署为例,包括算法结合场景,打造一系列开放工具链,以及开放的架构和高效指令集。这些可扩展的指令集、软件可定义的较量争论架构等使得端侧智能研发和部署周期大幅度提高。

图片

云天励飞产品部署从第一代的 NNP100 已经研发到第三代芯片,从最早 22 纳米芯片到 14 纳米芯片,同时算力的提高也无比大。目前云天励飞在端、边、云都有产品部署,并将产品直接运用到结构化端边设备,比如抓拍机、监控相机;边缘端有智能网关、智能盒子;云端有高性能的推理卡等,云天励飞已经开始全面的端、边、云产品部署。

图片

都市边缘智能平台对于长尾算法和都市治理题目,我们以都市治理为例,可以看到有无比复杂的长尾运用:

都市管理方面,包括重点车辆的监控、游滩小贩等;

安全生产方面,包括是否符合工艺流程、是否符合防疫标准、是否有非法人员进入等;

综合治理方面,包括是否有人群聚集、是否有水涝、机动车有没有违停等;

生态环境方面,包括可以查看水上有没有漂浮物等。

这样复杂的环境,使得研发无比困难,同时还有场景适配性题目。

图片

云天励飞提出了都市边缘智能平台观点,主要包括三个方向的部署:积极进修;半监视、弱监视进修;超大规模预训练模型。从这三个部署可以看到,人工智能程度越来越高,人工参与就会越来越低。以积极进修为例,在进行机器进修时,我们都知道数据应该是越多越好,如果大家进修过统计学理论就会了解,以分类为例,越位于分类边缘的样本越有信息量,反而那些很容易进行分类的样本,其实对分类贡献不大。

图片

积极进修的观点就是在无监视样本中,积极寻找对分类最有帮助的样本,就如同人看一些东西、去进修一些单词,大家背单词都会采用积极进修的观点,如果背的很熟的单词就不用再去复习了,更多的是去复习似是而非、记不住的单词。积极进修可以显著通过少量人工参与,快速完成模型迭代。对于弱监视、半监视进修而言,当有大量无标注样本时,是否可以学到无标注样本分类特性,我们可以积极的引入到进修之中去,这样一来就不需要去标注这些数据。我们发现真正在都市治理之中处理的是视频数据,视频流中隐含了无比多的信息。举例来说,视频具有时空一致性,如果用分类模型做预测,大家会观测到什么?如果对人的衣着做分类判断,相信在相邻帧的同一个人,他的衣着发生变化的概率很低,可以认为他的衣着是一致的。如果模型预测相邻的二十帧之中,发现有十帧是一样的,还有十帧预测的无比不好,可能这是有题目的样本,我们把这个样本拿出来,判断是否将这种样本引入,去进行进修。通过这类引入样本的方法会积极找到有题目样本,甚至可以打上伪标签直接用来进修,这是无比有效率的方法。另外空间运动也存在一致性,在追踪之中看到一个人,从东往西走,如果之中有一帧预测是运动轨迹反过来的,就说明运动预测有题目,一致性也可以用来帮助研究者自动矫正模型。在弱监视、半监视的进修之中,通过视频有不少事情可以做。另外云天励飞正在做大规模视频预训练模型。从 2020 年开始,Open AI 推出了不少重要研究,比如 GPT-3 等大规模自然语言预训练模型的发布,云天励飞提出的大规模视频预训练模型,也是无比有价值的。视频之中有无比丰富的信息,一个人在移动的时候,如果是静态相机,我们就可以知道哪是背景、哪是前景,如此就不需要人工做详细标注,例如这个人在哪、边缘在哪。我们都知道,在做视频分割时要标出物体的每个边缘,标注量很大,通过视频大规模进修,我们就可以自动进修分割模型,甚至能找出物体的运动逻辑,这是我们着力研究的方向。云天励飞大规模自进修运用云天励飞大规模自进修运用,以龙岗区 12345 政府便民热线为例,市民向市政府部门求助的时候会拨打 12345,接通之后,接线人员会将拨打电话的市民分发到合适部门进行处理。但是这个工作有一定的困难,一般的二级处理单位可能有八百多个处理单位,对于人来说,很难将用户精准的分配到准确的位置,人工分配的准确率可能有 60% 多。模型上线后,在持续迭代过程中,比如电话打错、用户分发不对等信息,这些反馈信息都是无比有价值的,根据这些反馈信息重新优化这个模型,经过短期迭代,模型性能超过 80%。

图片

另外,云天励飞在龙华区参与了都市治理的项目,大约有 20 多个项目场景,覆盖 78 类算法,其中云天励飞整个平台完成了算法调度、管理、智能运维,可以在复杂长尾运用之中快速的进行落地。

图片

云天励飞算法平台基于四个准则:平台开放、算法开源、标准开放、成果共享。目前云天励飞生态环境已有不少生态伙伴一起合作,一起协同构建都市的智能赋能底座。

图片

原创文章,作者:机器之心,如若转载,请注明出处:https://www.iaiol.com/news/waic2021-yun-tian-li-fei-fu-zong-cai-xiao-rong-chuang-xin/

(0)
上一篇 2021年 7月 12日 下午6:21
下一篇 2021年 7月 20日 上午11:01

相关推荐

  • Byte Lab | 小鹏G9评测:一半超出预期,一半不如人意

    全新800V高压SiC平台、XPower 3.0能源系统、首个3D人机交互系统、新一代智能驾驭系统XNGP……作为全新旗舰车型,G9几近汇集了小鹏的全部最新技术,再加上上市之后的配置调整,让这款车持续占据焦点。虽然本次试驾的小鹏G9还只是PT版本,部分功效还未达到最终的交付状态,多个智能功效也未打开。但既然可供媒体评测,说明这已是比较成熟的版本。此次Auto Byte就对PT车进行了基本感触,并对其优缺点均进行了梳理。「最大彩蛋」:能源表现在小鹏G9上,能源和悬架是造成如此大价格跨度的最

    2022年 11月 8日
  • 百分点数据科学实验室:产物生命周期料理创新应用落地实践

    编者按产物生命周期料理在数字经济发展过程中是必不可少的,在零售快消行业可用来指导产物的以销定采和精准投放,在IT行业可辅佐软件应用等产物的开发进程料理,同时还也会对环境料理产生影响,对建筑业在节能减排、减轻环境污染层面起到辅佐作用。因此,及时把控产物生命周期进程,用数据智能技术赋能料理至关重要。百分点数据科学实验室鉴于产物生命周期理论在多个行业的落地实践,总结了如何准确把握产物生命周期的四个阶段及辨别方法论。众所周知,一种产物在商场上的销售情况和获利能力并非是一成不变的,因此,任何一家企业的产物不可能永远畅销,但企

    2021年 3月 25日
  • 元宇宙虚构数字人的建立与将来身份系统

    「机器之心2021-2022年度AI趋势大咖说」聚焦「启动将来的AI技术」与「重塑产业的AI科技」,推出线上分享,共邀请近40位AI领域知名学者、产业专家及企业高管通过主题分享及多人圆桌等形式,与行业精英、读者、观众共同回顾 2021年中的重要技术和学术热点,盘点AI产业的年度研究方向以及重大科技突破,展望2022年度AI技术发展方向、AI技术与产业科技融合趋势。

    2022年 8月 1日
  • 影响众多编程语言、引发供应链袭击,剑桥大学发布「木马源」缝隙

    最近,剑桥大学的研讨者公布了一种名为 Trojan-Source 缝隙,可能危及软件和第一手供应链。

    2021年 11月 23日
  • 详解AI加速器(三):架构基础离不开ISA、可重构处置惩罚器……

    在上一篇文章中,前苹果工程师、普林斯顿大学博士 Adi Fuchs 解释了为什么现在是 AI 加速器的黄金时代。在这篇文章中,我们将聚焦 AI 加速器的秘密基石——指令集架构 ISA、可重构处置惩罚器等。

    2022年 2月 13日
  • 清华来了第二位菲尔兹奖得主,是丘成桐力荐的老朋友Caucher Birkar

    丘成桐的老朋友 Caucher Birkar 即将到任,清华来了第二位菲尔茨奖得主。

    2021年 6月 17日
  • 百分点认知智能尝试室:基于不完全标注样本集的信息抽取实践

    编者按信息抽取是从文本数据中抽取一定信息的一种技能,命名实体识别(Named Entity Recognition, NER)是信息抽取的基础任务之一,其目标是抽取文本中具有基本语义的实体单元,在知识图谱构建、信息抽取、信息检索、机器翻译、智能问答等体系中都有广泛应用。基于监督学习的NER体系通常需要大规模的细粒度、高精度标注数据集,一旦数据标注质量下降,模型的表现也会急剧下降。利用不完全标注的数据从事NER体系的建立,越来越受到专家学者们的关注。第九届国际自然语言处理与中文计算会议(NLPCC 2020)针对此业

    2021年 3月 25日
  • TOG 2020 | 基于骨骼一致性的单目视频人体静止重建

    本文是对 2020 年 9 月发表于计算机图形学顶级期刊 ACM Transactions on Graphics(ToG)的论文《基于骨骼一致性的单目视频人体静止重建(MotioNet: 3D Human Motion Reconstruction from Monocular Video with Skeleton Consistency)》的解读。
    该论文由北京大学与山东大学、北京电影学院、以色列特拉维夫与耶路撒冷大学合作,针对从单目视频中提取人体静止的问题,区别于直接回归枢纽坐标的法子,作者在神经搜集中利用正向静止学,猜测出时序一致的人体骨架及所对应的枢纽扭转,减小了搜集猜测的空间搜索范围,搜集输出的结果也能直接运用于角色动画的驱动。

    2022年 7月 18日
  • DeepMind联合UCL,推出2021加强进修最新课程

    DeepMind 的研讨科学家和工程师亲身讲授了一套加强进修课程,目前已全部上线。DeepMind 作为全球顶级 AI 研讨机构,自 2010 年创建以来已有多项世界瞩目的研讨成果,例如击败世界顶级围棋玩家的 AlphaGo 和今年高效展望的蛋白质结构的 AlphaFold。近几年,DeepMind 联合伦敦大学学院(UCL)推出了一些人工智能线上课程,今年他们联合推出的「2021 加强进修系列课程」现已全部上线。该课程由 DeepMind 的研讨科学家和工程师亲身讲授,旨在为学生提供对现代加强进修的全面介绍。课程

    2021年 9月 16日
  • 达摩院发布AI遥感分解云平台,助力提升地球科学研究作用

    3月3日,达摩院发布AI Earth地球科学云平台,平台集成了PB级开源卫星遥感数据、十余种遥感AI算法、云端高性能估计和存储资源,助力研究者开展农业灾害分解、气候变化分解、水体水质分解等科研工作。卫星遥感影象是人类对地观察的重要信息来源,但获取、处理以及分解应用卫星遥感数据的链路较长、成本较高。研究人员需要向卫星数据运营机构申请获取数据或者下载行业公开数据,在本地估计机存储配置后才能进行数据分解。而分解环节对机器的估计和存储资源要求较高,普通估计机无法满足大规模影象数据分解的需求。另外,现有分解方法自动化程度低、

    2022年 3月 3日

发表回复

您的电子邮箱地址不会被公开。 必填项已用 * 标注