从AI小冰的迭代看AI手艺的代际演进

「机器之心2021-2022年度AI趋势大咖说」聚焦「驱动未来的AI手艺」与「重塑产业的AI科技」,推出线上分享,共邀请近40位AI规模知名学者、产业专家及企业高管通过主题分享及多人圆桌等形式,与行业精英、读者、观众共同回顾 2021年中的重要手艺和学术热点,盘点AI产业的年度研究方位以及重大科技突破,展望2022年度AI手艺发展方位、AI手艺与产业科技融合趋势。

本文为小冰公司手艺副总裁曾敏于「重塑产业的AI科技」系列主题,「手艺代际更迭」专场的分享实质节选。点击进入「机器之心Pro」,查看更多优质实质。

从AI小冰的迭代看AI手艺的代际演进

曾敏表示,小冰是从2013年底,2014年初就开始研发的一款AI产品,最开始的时候,我们比较关注IOP对话零碎相关部门。随着业务的迭代探索、创新,我们逐步探索了跟CV、speech相关的规模。所以全部小冰的迭代演化史,基本上也代表深度进修等AI相关的手艺,在小冰全部生命周期里面的演化过程。

用小冰来举例,小冰公司重点关注Conversational AI规模。简单来讲,关于Conversation AI,主要有三个不同层次的划分:Task Completion、Information & Answers、General  Conversation。现在市场上不管是手艺还是产品,或多或少是这三层的一部门,或者其中的组合。 

图片

第一大类是Task Completion,像Siri ,国内的小爱同学,小度等都是比较有代表性的Conversational AI,也囊括不少像IOT规模做林林总总的Task Completion的AI。Task Completion最主要的问题就是,它的全部Scalability 存在较大的瓶颈。比如上一位嘉宾孙总讲到的RPA 、IPA等相关的部门,针对每一个场景,我们需要定制化的部门还是挺多的,不管是从流程上,还是全部输入输出的定义上,大概每个场景都会不一样。

第二大类是偏Information & Answers ,它类似于做信息获取的环节,更多的是偏QA问答的这一类,Information & Answers 的主要瓶颈取决于全部KG,囊括Index的limitation、逻辑推理的推演部门的可拓展性等。

第三大类是General Conversation,它也是小冰2014年开始做的就一直在攻坚的方位,它也是全部封闭域对话的部门,它存在的瓶颈是整体的Context非常动态的变化,以及上下文记忆的部门。记忆部门大概不仅仅囊括当前session的Memory,也囊括大概昨天前天,甚至很长时间之前的AI跟用户之间的互动实质等。

从某种程度上看,小冰从最开始的General Conversation逐步把Task  Conversation、Information& Answers等等囊括进来。小冰零碎和其他零碎的区别就是,整体上小冰大概会关注Long-range的conversation experience。小冰内部有一个指标叫做conversation per session ,大概的意思是用户在一个session里整体的对话长度。session指如果用户跟AI互动,用户的两个turn之间的这个时间超过30分钟,小冰会认为它是两个不同的session,如果用户和AI的对话长度小于30分钟的话,小冰会认为他们是同一个session。整体而言,小冰的conversation零碎正是基于这个session建立的。

小冰的全部结构分为四层,最底层是Data Layer,包含小冰的知识库、Index、生成模型等,往上是它的引擎层。引擎主要囊括QU、QA、FAQ、Chat Engine等,Workflow Dispatcher主要应用于封闭域对话,它需要有节奏地去协调各个模块,扮演零碎中控的角色,可以针对林林总总Emotion Scenarios 做出响应,最上层是林林总总的前端场景交互界面。

图片

从2014年到2021年,在小冰的迭代过程中,小冰在今年九月份的发布会上推出第九代小冰,在每一代的迭代演化过程中,小冰不断在小冰的手艺栈里面去叠加不少新的手艺。在最开始在做的时候,行业里面不少的企业也同时在做,比如说像封闭域对话部门,刚开始的时候,大家对它熟视无睹,会觉得封闭域对话大概是一个非常无聊无意义的部门,甚至有大概把封闭对话当作不少零碎模块当中的一个很小的组成部门。  图片

小冰则认为封闭域对话的价值被大多数人给忽略了,不管是我们从最开始的检索模型,再到后边的生成模型,文本生成,小样本进修等。不管是国内外的Research、Production部门,其实都在逐渐的往封闭域对话方位走,囊括最近逐步兴起的元宇宙,虚拟人等概念。大家会发现封闭式的对话,反倒成为一个非常重要的基建的部门。 

再比如做多模态交互部门,小冰在2016年开始研发全双工对话零碎,全双工好比两个人用电话打电话模式。AI跟用户在互动,不像之前单向模式,需要等AI给出响应才能给下一个输入,现在的全双工交互双向都能进行输入,并且双方能随时进行打断。

Google在2017年推出了全双工手艺布局,而小冰在2016年开始做全双工手艺,所以全双工,手艺栈,上线产品的体验,小冰都是走在世界的前沿。此外,在2015年,业界做TTS的时候,普遍追求文本准确读出,咬字清晰的标准,而小冰则从虚拟人平台出发,不仅要让虚拟人吐字清楚、正确,还需要让AI以自然地声音说话。在真人真实交互过程中,可以表现出卡顿、停顿、说错话等。

对于小冰的工作及发展方位,曾敏表示,近期小冰正在研发Diversity方位。小冰认为,我们大概不仅仅追求真实自然的AI声音,因为未来的虚拟世界里将有大量的AI beings和真人去交互,在跟众多的AI beings交互过程中怎么才能体现出各自的记忆点,他们各自区分度其实有非常大的不同的挑战。

最近两年的研究的热点,即所谓的part of learning,研究人员通过构造林林总总的part,达到小样本进修,甚至零样本的进修状态,该种AI手艺不需要研究人员过多地去关注下个任务应该做什么,而是把更多的精力放在我怎么样去构造好林林总总的基础模型部门,使全部模型的可拓展性,小样本进修能力等都会有极大的提升。 

在虚拟人部门,小冰在做不少跟交互的部门,比如大家比较熟知的闲聊对话。事实上,小冰也在不少偏实质规模、偏虚拟人的规模做了大量的尝试,如我们新研发的XNR的Xiaoice Neural Rendering的手艺也是其中之一。

机器之心2021-2022年度AI趋势大咖说」是机器之心出品的跨年特别策划活动,围绕「驱动未来的AI手艺」与「重塑产业的AI科技」两大主题举办了为期10天的线上分享及趋势圆桌,实质覆盖「手艺升级」、「产业革新」等方位;洞察AI手艺在「AI算法理论」、「ML模型架构」、「AI算法工程化」等方面的发展趋势,探讨「构建元宇宙基础设施的AI手艺」和「通向可信人工智能的手艺路径」等热点话题。

从AI小冰的迭代看AI手艺的代际演进

原创文章,作者:机器之心Pro发布,如若转载,请注明出处:https://www.iaiol.com/news/cong-ai-xiao-bing-de-die-dai-kan-ai-shou-yi-de-dai-ji-yan/

(0)
上一篇 2022年 7月 23日 下午5:39
下一篇 2022年 7月 25日 下午5:42

相关推荐

  • 华人一作统一「视觉-谈话」理解与天生:一键天生图象标注,完成视觉问答,Demo可玩

    这个 BLIP 模型可以「看图说话」,提取图象的主要内容,不仅如此,它还能回答你提出的关于图象的问题。

    2022年 2月 6日
  • 中科院图协作进修模型,从空间分辨转录组学数据中阐明肿瘤异质性

    编辑 | 萝卜皮空间解析转录组学 (SRT) 技术使钻研职员可以或许获得对构造结构和细胞发育的新见解,尤其是在肿瘤中。然而,缺乏对生物背景和多视图特点的计算开发严重阻碍了构造异质性的阐明。在这里,中国科学院的钻研团队提出了 stMVC,这是一种多视图图协作进修模型,它在通过注意力分析 SRT 数据时集成了构造学、基因表白、空间地位和生物学背景。具体来说,采用半监督图注意力自动编码器的 stMVC 分别进修构造学相似性图或空间地位图的特定视图表示,然后在生物上下文的半监督下通过注意力同时整合两个视图图以获得鲁棒表示。st

    2022年 10月 14日
  • 「声纹辨认」中文课上线:从理论到编程实战,谷歌声纹团队负责人主讲

    对任意一个范畴的进修,如果有人可以指挥你完毕从基本概念、试验方法到体系认知的构建,你的职业发展将事半功倍。声纹辨认范畴,现在就有这样一门课程刚刚上线。

    2022年 8月 16日
  • 他发明了通用数据压缩算法:Jacob Ziv获2021 IEEE名誉勋章

    今年的 IEEE 名誉勋章,颁给了一位 90 岁老人:Jacob Ziv。

    2021年 1月 19日
  • 国内首届AI宁静大赛圆满收官,上交大、北交大、北理工等夺得三项赛道冠军

    从长远看,人工智能的宁静问题,还需从算法模型的原理上突破,唯有持续加强基础钻研,才能破解核心科学问题。

    2022年 9月 16日
  • NeurIPS 2020 | 微软亚洲研究院论文摘录之方针检测篇

    编者按:12月6日至12日,国际人工智能顶级会议 NeurIPS 2020(Conference and Workshop on Neural Information Processing Systems,神经信息处理系统大会)将在线上举办。相比前几年,2020年 NeurIPS 会议不管从论文投稿数量还是接收率都创下了记录:论文投稿数量创历史最高记录,比2019年增长了38%,但接收率却为史上最低。

    2020年 12月 3日
  • MIT 10年研究总结数字化转型:仅15%用数字化创建新商业模式;一线职工是转型最大推动者

    2014年,《麻省理工斯隆办理评论》发表了名为《数字化转型的九大因素》的一篇文章,在业界引起轩然大波,不少企业就此认识到数字化转型的重要性。 6年后,数字化转型需求的技巧和方法都发生了很大的变化,作家经过大量的调研更新了数字化转型的因素,使之更契合时代状况,更具有实操性。 本篇文章将数字化转型分为客户体会转型、运营转型、商业模式转型、数字化平台转型,覆盖到企业运作的方方面面。文章表示,数字化转型并不仅仅是技巧上的,还有构造和商业模式上的,尤其强调一线职工在转型中的重要作用。文章同时也提到了大量优

    2020年 12月 18日
  • 耶鲁大学教授亲自授课,教你EM算法的全局收敛

    Online Seminar on Mathematical Foundations of Data Science (Math for DS) [1]是在线的、每周举办的系列研讨会。研讨会旨在讨论数据科学、机器学习、统计以及优化背后的数学原理,邀请了北美诸多知名学者进行中心演讲。『运筹OR帷幄』和『机器之心』作为合作媒体,将在B站发布往期的回放视频。本期,受邀佳宾将为我们带来中心为“Global Convergence of EM?”的演讲。

    2021年 4月 8日
  • INDEMIND: 打造标准化机器人AI方案,行业关键手艺供应商价值凸显

    4年深耕低速自动驾驶手艺,打造标准化机器人解决方案,INDEMIND已然破茧成蝶,成为国内最大的机器人关键AI手艺供应商之一。在疫情催化之下,爆发式增长的不只是办事机器人商场,根据数据统计,今年超10万家机器人相关企业成立,随着机器人公司、传统企业、新晋企业陆续进场,一场不可避免的“争夺战”已在悄然中激烈展开。根据IFR数据显示,2016 年以来,全球办事机器人商场规模年均增速达 23.8%,2021 年预计达到 125.26亿美元,到 2023 年,全球办事机器人商场有望突破 201亿美元

    2021年 12月 9日

发表回复

您的电子邮箱地址不会被公开。 必填项已用 * 标注