WAIC 2021 | 云天励飞副总裁肖嵘:创「芯」时代 打造自进化乡村智能体

在 WAIC 2021 AI 开发者论坛上,肖嵘发表主题演讲《创「芯」时代 打造自进化乡村智能体》,在演讲中,他主要介绍了自进化乡村智能体,并介绍了云天励飞最新研究成果及成功案例。

以下为肖嵘在 WAIC 2021 AI 开发者论坛上的演讲内容,机器之心进行了不改变原意的编辑、整理:

WAIC 2021 | 云天励飞副总裁肖嵘:创「芯」时代 打造自进化乡村智能体

现在,人工智能快速使用的过程中会遇到大量的长尾使用算法,无数开发者忙着做调参,如今有许多新的调参方法,使调参这件事变得越来越简单、方便。另外还有标注课题,做新场景、新场景适应模型等都面临无数困难。在这些情况下,人工智能整个使用研发最后会变成什么?是大量标注数据、调参吗?显然不是。未来智能如何发展?可以说未来整个智能的发展是往自进修、自进化方面进行的。我今天演讲的主要内容是关于自进化乡村智能体的相关内容。

智慧乡村的发展与面临课题

首先智慧乡村的发展可分为几个阶段,2008 年 IBM 提出智慧乡村的观念,同时提出了一些行业解决方案,但是当时整个网络、算力都有课题,智慧乡村还处于初级阶段,即理念上的观念;2.0 观念大约开始于 2012 年,云的观念开始发展,例如阿里云开始有云上贵州这样的平台,这一阶段主要是平台的解决方案;真正的智能发展其实是 2015、2016 年,当时标志性事件,例如 AlphaGo 打败人类,研究者对智能掀起了很大的热情。实际上智能也解决了无数课题,当时阿里在智慧交通这一块做了无数工作。

WAIC 2021 | 云天励飞副总裁肖嵘:创「芯」时代 打造自进化乡村智能体

到目前为止,时间已经过去了 5 年,在这过去的 5 年之中,人工智能使用越来越多,但同时带来的课题也随之增加,目前主要面临三个重要课题,此外还有硬件方面课题。三个使用方面课题之中,主要是需求多样,以及两个大的使用规划课题。

首先当场景发生变化时,人工智能模型可能不工作。此外相似的场景、相似的需求无数,例如今天要去检测路上有没有积水,明天要去检测垃圾桶有没有满,这种类似的检测课题无数、识别课题也无数,目前像这种长尾需求不能得到很好满足。以至于到后来大家发现,所有的公司都在招 AI 人才,因为 AI 使用范围太广。市场上所有人工智能企业最痛苦的事情就是招不到人,人才招聘也是一个困境。第二是可靠性课题,现在无数使用都是在云端规划的,如果端侧网络出现课题,那么用户服务体验就会出现很大课题。还有就是安全性课题,如果架构都在云端规划,未来所有的数据、端侧的海量数据往云端传,这样就会带来安全性课题。另外,还有数据收集有效性课题,海量数据往云端传,数据流量会不会特别大?此外,还有一个课题,就是端侧是不是真具有这么大的智能,能不能用端侧智能把这些课题解决掉,这同样也是一个很大的课题。端侧智能还存在规划难等课题。

WAIC 2021 | 云天励飞副总裁肖嵘:创「芯」时代 打造自进化乡村智能体

AI 的普适性

虽然有这么多课题,但是我们可以看到智能的发展趋势基本上还是在往自进化乡村智能体发展,原因在哪?首先自进化乡村智能体应该具备两个要素:

第一是 AI 的普适性,普适性就是 AI 像电力一样无处不在;

第二是 AI 整个使用的研发和规划环节,一定是自进修、自进化,可以自主地演化。

WAIC 2021 | 云天励飞副总裁肖嵘:创「芯」时代 打造自进化乡村智能体

关于普适性课题,相对的就是盘算无处不在的课题。普适盘算这个观念讲了无数年,它背后的隐藏逻辑是算力的快速提拔。以 1999-2020 年的 GeForce256 显卡到最新的 RTX3090 为例,算力提拔了约 400 倍。CPU 的性能提拔很大,网络速度提拔也十分明显。2000 年时大家还在用 ADSL,而现在比较快的 5G 网络已达到 20Gb/s 了。以此为背景,使用研发也发生了很大变化,最早单机盘算、网络盘算、云盘算、雾盘算,此外还有边缘盘算,盘算其实已经开始从云向雾普及。

WAIC 2021 | 云天励飞副总裁肖嵘:创「芯」时代 打造自进化乡村智能体

端侧智能

智能在云端已经十分普及,未来智能往端侧发展会遇到什么挑战?目前来看已经万事俱备,以最经典的 AlexNet 网络为例,AlexNet 大约在 2012 年被提出,精度达到 60% 左右,同样的 EfficientNet 模型精度可以提拔 1.37 倍,而模型尺寸差不多缩小了 71 倍。从中我们可以得出模型越来越小、效率却越来越高。

在端侧使用方面,硬件速度提拔也十分大,以英伟达端侧芯片为例,2011 年芯片速度跟 2020 年芯片速度进行比较,速度提拔了三百多倍。可以说端侧整个使用万事俱备。

WAIC 2021 | 云天励飞副总裁肖嵘:创「芯」时代 打造自进化乡村智能体

与端侧智能相对比的是云端智能,云端智能面临的课题是高时延、网络的低可靠性,数据中心大、不好扩充,存在安全隐患以及隐私隐患。而端侧智能优势很大,可以很好地解决这些课题,端侧智能可以实时访问、进行智能的数据筛选和过滤,数据隐私保护的也很好。

WAIC 2021 | 云天励飞副总裁肖嵘:创「芯」时代 打造自进化乡村智能体

目前端侧智能普及还面临一些课题、一些挑战,可总结为四个方面:芯片指令级效率还需要继续持续提拔,不够高效;芯片架构不够灵活;处理工具链不易用,例如端侧异构性、工具不统一;算法研发周期长、规划困难。

WAIC 2021 | 云天励飞副总裁肖嵘:创「芯」时代 打造自进化乡村智能体

云天励飞端侧规划

云天励飞的端侧规划以算法芯片化规划为例,包括算法结合场景,打造一系列开放工具链,以及开放的架构和高效指令集。这些可扩展的指令集、软件可定义的盘算架构等使得端侧智能研发和规划周期大幅度提拔。

WAIC 2021 | 云天励飞副总裁肖嵘:创「芯」时代 打造自进化乡村智能体

云天励飞产品规划从第一代的 NNP100 已经研发到第三代芯片,从最早 22 纳米芯片到 14 纳米芯片,同时算力的提拔也十分大。目前云天励飞在端、边、云都有产品规划,并将产品直接使用到结构化端边设备,比如抓拍机、监控相机;边缘端有智能网关、智能盒子;云端有高性能的推理卡等,云天励飞已经开始全面的端、边、云产品规划。

WAIC 2021 | 云天励飞副总裁肖嵘:创「芯」时代 打造自进化乡村智能体

乡村边缘智能平台

对于长尾算法和乡村治理课题,我们以乡村治理为例,可以看到有十分复杂的长尾使用:

乡村管理方面,包括重点车辆的监控、游滩小贩等;

安全生产方面,包括是否符合工艺流程、是否符合防疫标准、是否有非法人员进入等;

综合治理方面,包括是否有人群聚集、是否有水涝、机动车有没有违停等;

生态环境方面,包括可以查看水上有没有漂浮物等。

这样复杂的环境,使得研发十分困难,同时还有场景适配性课题。

WAIC 2021 | 云天励飞副总裁肖嵘:创「芯」时代 打造自进化乡村智能体

云天励飞提出了乡村边缘智能平台观念,主要包括三个方向的规划:积极进修;半监视、弱监视进修;超大规模预训练模型。从这三个规划可以看到,人工智能程度越来越高,人工参与就会越来越低。

以积极进修为例,在进行机器进修时,我们都知道数据应该是越多越好,如果大家进修过统计学理论就会了解,以分类为例,越位于分类边缘的样本越有信息量,反而那些很容易进行分类的样本,其实对分类贡献不大。

WAIC 2021 | 云天励飞副总裁肖嵘:创「芯」时代 打造自进化乡村智能体

积极进修的观念就是在无监视样本中,积极寻找对分类最有帮助的样本,就如同人看一些东西、去进修一些单词,大家背单词都会采用积极进修的观念,如果背的很熟的单词就不用再去复习了,更多的是去复习似是而非、记不住的单词。积极进修可以显著通过少量人工参与,快速完成模型迭代。

对于弱监视、半监视进修而言,当有大量无标注样本时,是否可以学到无标注样本分类特性,我们可以积极的引入到进修之中去,这样一来就不需要去标注这些数据。

我们发现真正在乡村治理之中处理的是视频数据,视频流中隐含了十分多的信息。举例来说,视频具有时空一致性,如果用分类模型做预测,大家会观测到什么?如果对人的衣着做分类判断,相信在相邻帧的同一个人,他的衣着发生变化的概率很低,可以认为他的衣着是一致的。如果模型预测相邻的二十帧之中,发现有十帧是一样的,还有十帧预测的十分不好,可能这是有课题的样本,我们把这个样本拿出来,判断是否将这种样本引入,去进行进修。通过这类引入样本的方法会积极找到有课题样本,甚至可以打上伪标签直接用来进修,这是十分有效率的方法。另外空间运动也存在一致性,在追踪之中看到一个人,从东往西走,如果之中有一帧预测是运动轨迹反过来的,就说明运动预测有课题,一致性也可以用来帮助研究者自动矫正模型。在弱监视、半监视的进修之中,通过视频有无数事情可以做。

另外云天励飞正在做大规模视频预训练模型。从 2020 年开始,Open AI 推出了无数重要研究,比如 GPT-3 等大规模自然语言预训练模型的发布,云天励飞提出的大规模视频预训练模型,也是十分有价值的。视频之中有十分丰富的信息,一个人在移动的时候,如果是静态相机,我们就可以知道哪是背景、哪是前景,如此就不需要人工做详细标注,例如这个人在哪、边缘在哪。我们都知道,在做视频分割时要标出物体的每个边缘,标注量很大,通过视频大规模进修,我们就可以自动进修分割模型,甚至能找出物体的运动逻辑,这是我们着力研究的方向。

云天励飞大规模自进修使用

云天励飞大规模自进修使用,以龙岗区 12345 政府便民热线为例,市民向市政府部门求助的时候会拨打 12345,接通之后,接线人员会将拨打电话的市民分发到合适部门进行处理。但是这个工作有一定的困难,一般的二级处理单位可能有八百多个处理单位,对于人来说,很难将用户精准的分配到准确的位置,人工分配的准确率可能有 60% 多。模型上线后,在持续迭代过程中,比如电话打错、用户分发不对等信息,这些反馈信息都是十分有价值的,根据这些反馈信息重新优化这个模型,经过短期迭代,模型性能超过 80%。

WAIC 2021 | 云天励飞副总裁肖嵘:创「芯」时代 打造自进化乡村智能体

另外,云天励飞在龙华区参与了乡村治理的项目,大约有 20 多个项目场景,覆盖 78 类算法,其中云天励飞整个平台完成了算法调度、管理、智能运维,可以在复杂长尾使用之中快速的进行落地。

WAIC 2021 | 云天励飞副总裁肖嵘:创「芯」时代 打造自进化乡村智能体

云天励飞算法平台基于四个准则:平台开放、算法开源、标准开放、成果共享。目前云天励飞生态环境已有无数生态伙伴一起合作,一起协同构建乡村的智能赋能底座。

WAIC 2021 | 云天励飞副总裁肖嵘:创「芯」时代 打造自进化乡村智能体

给TA打赏
共{{data.count}}人
人已打赏
AI

Hologres揭秘:高功能原生减速MaxCompute核心原理

2021-7-12 18:21:00

AI

Triton推理效劳器在阿里云机器进修PAI-EAS公测啦!!!

2021-7-20 11:01:00

0 条回复 A文章作者 M管理员
    暂无讨论,说说你的看法吧
个人中心
今日签到
搜索