DeepMind联合UCL,推出2021加强进修最新课程

DeepMind 的研讨科学家和工程师亲身讲授了一套加强进修课程,目前已全部上线。DeepMind 作为全球顶级 AI 研讨机构,自 2010 年创建以来已有多项世界瞩目的研讨成果,例如击败世界顶级围棋玩家的 AlphaGo 和今年高效展望的蛋白质结构的 AlphaFold。近几年,DeepMind 联合伦敦大学学院(UCL)推出了一些人工智能线上课程,今年他们联合推出的「2021 加强进修系列课程」现已全部上线。该课程由 DeepMind 的研讨科学家和工程师亲身讲授,旨在为学生提供对现代加强进修的全面介绍。课程

DeepMind 的研讨科学家和工程师亲身讲授了一套加强进修课程,目前已全部上线。

DeepMind 作为全球顶级 AI 研讨机构,自 2010 年创建以来已有多项世界瞩目的研讨成果,例如击败世界顶级围棋玩家的 AlphaGo 和今年高效展望的蛋白质结构的 AlphaFold。近几年,DeepMind 联合伦敦大学学院(UCL)推出了一些人工智能线上课程,今年他们联合推出的「2021 加强进修系列课程」现已全部上线。该课程由 DeepMind 的研讨科学家和工程师亲身讲授,旨在为学生提供对现代加强进修的全面介绍。

DeepMind联合UCL,推出2021加强进修最新课程

课程主页:https://deepmind.com/learning-resources/reinforcement-learning-series-2021课程介绍本次课程共囊括 13 节,涵盖了顺序决策问题中加强进修和布局的基础知识,并进一步解说了现代深度加强进修算法。其中详细解说了加强进修的多个主题,囊括马尔科夫决策过程(MDP)、基于样本的进修算法(例如双 Q 进修、SARSA)、深度加强进修等,还探讨了一些更高级的主题,囊括 off-policy 进修、多步更新和资格迹(eligibility traces),以及实现 Rainbow DQN 等深度加强进修算法需要的理论和现实条件。下面我们来看一下各节课程的具体内容。第 1 讲 加强进修简介:DeepMind 研讨科学家 Hado van Hasselt 首先简单介绍了本次加强进修课程的内容,然后解说了加强进修与 AI 的关系。

DeepMind联合UCL,推出2021加强进修最新课程

第 2 讲 探索与控制:Hado van Hasselt 解说了为什么进修智能体必须同时做到平衡探索和利用所获的知识。第 3 讲 MDP 和动静布局:DeepMind 研讨科学家 Diana Borsa 解说了如何使用动静布局解决 MDP 以提取准确的展望和良好的控制方略。

DeepMind联合UCL,推出2021加强进修最新课程

第 4 讲 动静布局算法的理论基础:Diana Borsa 解说了动静布局算法的扩展和收缩映射定理(contraction mapping)。第 5 讲 无模型展望:Hado van Hasselt 仔细解说了无模型展望及其与蒙特卡罗和时间差分算法的关系。第 6 讲 无模型控制:Hado van Hasselt 解说了用于方略改进的展望算法,以产生可以从采样经验中进修良好行为方略的算法。第 7 讲 函数相似:Hado van Hasselt 解说了如何将深度进修与加强进修结合,以实现「深度加强进修」。第 8 讲 布局与模型:DeepMind 研讨工程师 Matteo Hessel 解说了如何进修和使用模型,囊括 Dyna 、蒙特卡洛树搜索 (MCTS) 等算法。

DeepMind联合UCL,推出2021加强进修最新课程

第 9 讲 方略梯度和 Actor-Critic 方法:Hado van Hasselt 讲述了可以直接进修方略的方略算法,并进一步解说了结合价值展望以提高进修效率的 actor critic 算法。第 10 讲 相似动静布局:Diana Borsa 解说了相似动静布局算法,探讨了如何从理论的角度分析相似算法的性能。第 11 讲 多步和 off-policy:Hado van Hasselt 解说了多步和 off-policy 算法,囊括多种减小方差的方法。第 12 讲 深度加强进修 #1:Matteo Hessel 解说了深度加强进修的实际要求和具体算法,以及如何使用自动微分(Jax)来实现。第 13 讲 深度加强进修 #2:Matteo Hessel 解说了通用价值函数(general value functions)、基于 GVF 的辅助任务,并进一步解说了如何处理算法中的扩展问题。DeepMind 研讨者亲身授课该系列课程的讲师是 DeepMind 的研讨科学家和工程师 Hado van Hasselt、Diana Borsa 和 Matteo Hessel。Hado van Hasselt

DeepMind联合UCL,推出2021加强进修最新课程

Hado van Hasselt 是 DeepMind 的一名研讨科学家,也是伦敦大学学院(UCL)的光荣教授。Hado van Hasselt 博士毕业于世界顶尖公立研讨型大学和百强名校乌得勒支大学,他的研讨兴趣囊括人工智能、机器进修、深度进修,并重点研讨加强进修。Diana Borsa

DeepMind联合UCL,推出2021加强进修最新课程

Diana Borsa 是 DeepMind 的研讨科学家,也是 UCL 的光荣讲师。她的研讨兴趣主要是加强进修、机器进修、统计进修和通用人工智能(AGI),涵盖智能体进修、交互系统、多智能体系统、概率建模、表征进修等。Matteo Hessel

DeepMind联合UCL,推出2021加强进修最新课程

Matteo Hessel 是 DeepMind 的一位研讨工程师,也是 UCL 的光荣讲师。他的研讨重点是加强进修及其与深度进修的结合。Hessel 曾在 NeurIPS、ICML、ICLR、AAAI 和 RLDM 上发表过十余篇论文,这些论文的引用次数超过 4000 次,并获得了 2 项注册专利。

原创文章,作者:机器之心,如若转载,请注明出处:https://www.iaiol.com/news/deepmind-lian-he-ucl-tui-chu-2021-jia-qiang-jin-xiu-zui-xin/

(0)
上一篇 2021年 9月 14日 下午3:01
下一篇 2021年 9月 16日 下午2:12

相关推荐

  • 在了解通用类似定理之前,你可能都不会了解神经搜集

    通用类似定理很好地解释了为什么神经搜集能工作以及为什么它们经常不起作用。

    2021年 9月 7日
  • 欧洲投资银行供应1.5亿欧元反对欧洲人工智能企业

    欧洲投资银行团体(EIB Group)启动了一项高达1.5亿欧元的新的融资东西,反对人工智能及与人工智能直接相干/互补的区块链、物联网和机器人技能。与新的融资东西相干的资金反对将在将来四年内布置,供应给欧盟和Horizon 2020相干国家与地区,重点投资开发突破性人工智能应用的晚期和成长阶段的公司。这项东西是EIB团体和欧盟委员会更大计划的一部分,旨在反对高性能计算、量子技能和网络安全等规模的欧洲数字将来倒退。12月3日,在2020年Web峰会上,欧洲投资银行团体(EIB Group)启动了一项新的融资东西,以支

    2020年 12月 9日
  • IJCAI-21三大奖项公布,加强进修之父、CMU助理传授方飞、德扑AI之父获奖

    「加强进修之父」Richard Sutton、CMU 助理传授方飞、「德扑 AI 之父」 Tuomas Sandholm 分别获得了今年 IJCAI-21 的杰出钻研奖、计算机与思惟奖、约翰麦卡锡奖。

    2021年 7月 8日
  • 「Hello World」中的「bug」

    Hello World 可能是许多人编写的第一个次序。这么简单的次序按理说应该没有 bug 吧?一位叫「sunfishcode」的开发者给出了令人意外的结论。

    2022年 3月 23日
  • 可对药物份子举行表征的若干深度进修

    编辑 | 萝卜皮若干深度进修(GDL)基于包罗和处理对称信息的神经网络架构。GDL 为依赖于具有不同对称性和抽象级别的份子体现的份子建模利用程序带来了希望。苏黎世联邦理工学院的研讨人员对份子 GDL 举行了结构化和统一概述,重点介绍了其在药物发现、化学合成猜测和量子化学中的利用。它包罗对 GDL 原理的介绍,以及相关的份子体现,例如份子图、网格、曲面和字符串,以及它们各自的属性。讨论了份子科学中 GDL 当前面临的挑战,并尝试猜测未来的机会。该综述以「Geometric deep learning on molec

    2021年 12月 27日
  • 时隔243年,欧拉的「三十六军官」布列课题,在量子态中得到解决

    量子在解决数学课题中发挥了它们的魔法。

    2022年 1月 11日
  • Nature子刊:科学家在类脑芯片上实现类似LSTM的功能,能效高1000倍

    格拉茨技术大学的计算机科学家在 Nature 子刊上发表的一篇论文表明,他们找到了一种在神经形状芯片上放荡 LSTM 的方案,可以让类脑神经形状芯片上的 AI 算法能效提高约 1000 倍。随着智能手机的普及,手机游戏也越来越受欢迎。但视频游戏等程序会大量耗电耗能。与 GPU 等标准硬件相比,基于 spike 的神经形状芯片有望实现更节能的深度神经收集(DNN)。但这需要我们理解如何在基于 event 的稀疏触发机制(sparse firing regime)中放荡 DNN,否则神经形状芯片的节能优势就会丧失。比如

    2022年 5月 21日
  • 墨芯获评《财产》中国最具社会影响力的守业公司

    近日,墨芯人工智能获评2022《财产》“中国最具社会影响力的守业公司”。这是过去1个月墨芯因稀少化盘算的家产发展获得的第3个奖项。《财产》(Fortune Magazine)于1930年由亨利·卢斯创办,是全球最有影响力的商业杂志之一,财产全球500强排行榜是世界上最具影响的企业排名之一。中国最具社会影响力的守业公司榜单不仅记录守业公司在中国商业世界中的作为与贡献,也是观察和审阅当前中国经济与社会发展的窗口之一。财产在描述评选标准时提到,尽管外部环境对翻新与守业施加着无法预知的

    2022年 10月 9日
  • 降低门槛,全平台运用,昇腾还会手把手地教你如何用AI

    机械之心报道作者:泽南如何才能做到 AI 运用一次开发,全场景布署?昇腾给出了答案。如今的大多数 AI 运用程序都必要跑在多种类型的处理器上,覆盖数十个版本的操作系统,运行在从端侧到云计算集群的各种设备上。这样复杂的环境,对软件的适应性和模型的可裁剪、可伸缩性提出了极高要求。AI 开源框架也在顺应这股潮流,昇腾发布的 CANN、MindSpore、MindX 等对象,可以让开发者实现「统一端边云,全端自动布署」,开启了机械进修开发的新时代,一直被人们寄予厚望。昇腾的 AI 全栈软件平台。其中,基础架构作为连接硬件与

    2021年 3月 19日
  • MIT 10年研究总结数字化转型:仅15%用数字化创建新商业模式;一线职工是转型最大推动者

    2014年,《麻省理工斯隆办理评论》发表了名为《数字化转型的九大因素》的一篇文章,在业界引起轩然大波,不少企业就此认识到数字化转型的重要性。 6年后,数字化转型需求的技巧和方法都发生了很大的变化,作家经过大量的调研更新了数字化转型的因素,使之更契合时代状况,更具有实操性。 本篇文章将数字化转型分为客户体会转型、运营转型、商业模式转型、数字化平台转型,覆盖到企业运作的方方面面。文章表示,数字化转型并不仅仅是技巧上的,还有构造和商业模式上的,尤其强调一线职工在转型中的重要作用。文章同时也提到了大量优

    2020年 12月 18日

发表回复

您的电子邮箱地址不会被公开。 必填项已用 * 标注