UC伯克利教授Pieter Abbeel开课了:六节课初学「深度加强进修」,讲义免费下载

课程视频时间有点长,但希望你能享乐进修的快乐。将传统加强进修与深度神经网络结合的深度加强进修,一直以来被视为更接近人类思维方式的人工智能方法。深度进修具有强感知才能但缺乏一定的决议计划才能,加强进修具有决议计划才能但对感知问题束手无策,因此将两者结合起来可以达到优势互补的效果,为复杂系统的感知决议计划问题提供了解决思路。想要初学深度加强进修的同窗们,请高度注意,一份优秀、细致、全面的新教材出现了。今天,UC 伯克利教授 Pieter Abbeel 上传了自己的新课程《深度加强进修根源》的最后一节视频,并在推特上安利了一下。这份

课程视频时间有点长,但希望你能享乐进修的快乐。

将传统加强进修与深度神经网络结合的深度加强进修,一直以来被视为更接近人类思维方式的人工智能方法。深度进修具有强感知才能但缺乏一定的决议计划才能,加强进修具有决议计划才能但对感知问题束手无策,因此将两者结合起来可以达到优势互补的效果,为复杂系统的感知决议计划问题提供了解决思路。想要初学深度加强进修的同窗们,请高度注意,一份优秀、细致、全面的新教材出现了。今天,UC 伯克利教授 Pieter Abbeel 上传了自己的新课程《深度加强进修根源》的最后一节视频,并在推特上安利了一下。

UC伯克利教授Pieter Abbeel开课了:六节课初学「深度加强进修」,讲义免费下载

这份课程主要介绍了马尔科夫决议计划过程(MDP)根源、值迭代 & 策略迭代、最大熵模型(Maxent)、Deep Q-Learning(DQN)、策略梯度、TRPO、PPO、DDPG、SAC、基于模型的加强进修等内容。该系列课程总共分为六讲,目前已经全部在 Youtube 上发布,而且每一讲的课件都提供免费下载。

UC伯克利教授Pieter Abbeel开课了:六节课初学「深度加强进修」,讲义免费下载

视频地址:https://youtube.com/playlist?list=PLwRJQ4m4UJjNymuBM9RdmB3Z9N5-0IlY0Pieter Abbeel 特别强调了:「这可能会是一个新奇未知的领域,而且课程视频时间很长,但希望你能享乐其中。」这再次提醒匆匆下载课件的同窗们,尽量不要让这些知识一直躺在收藏夹吃灰。

UC伯克利教授Pieter Abbeel开课了:六节课初学「深度加强进修」,讲义免费下载

Pieter Abbeel 教授是伯克利机器人进修实验室的主任和伯克利人工智能 (BAIR) 实验室的联合主任,该实验室深度加强进修、深度模仿进修、深度无监视进修、迁移进修、元进修和的前沿,以及人工智能研究的社会影响等。

UC伯克利教授Pieter Abbeel开课了:六节课初学「深度加强进修」,讲义免费下载

此前,Abbeel 的 Intro to AI 课程在 edX 上吸引了 10 万多名学生进修,他的深度加强进修和深度无监视进修教材是 AI 研究者的经典进修资料,包括 CS294-158(Deep Unsupervised Learning)、CS188(Introduction to Artificial Intelligence)、CS287(Advanced Robotics)等。当然,如果你学完以后还有余力,这里有一些同样有价值的课程推荐给你:

「机器进修根源与趋势」系列丛书最新成员:140 页《深度加强进修初学》发布

深度加强进修初学难?这份资料手把手教会你 

UC 伯克利出品,深度加强进修最新课程已上线

B 站学加强进修?港华文周博磊变身 up 主,华文课程已上线

原创文章,作者:机器之心,如若转载,请注明出处:https://www.iaiol.com/news/uc-bo-ke-li-jiao-shou-pieterabbeel-kai-ke-le-liu-jie-ke-chu/

(0)
上一篇 2021年 8月 25日 下午2:48
下一篇 2021年 8月 31日 下午2:38

相关推荐

  • 优必选科技四上春晚,“垦荒牛”机器人展现硬科技革新力量

    2月11日,在央视2021牛年春晚的舞台上,优必选科技全新研发的首款大型四足机器人化身“垦荒牛”,与刘德华、王一博、关晓彤等一起呈现了科技感十足的创意表演《牛起来》。它们以拼搏进取的深圳 “垦荒牛”为设计原形,融合祥云及华夏红等传统文化元素,以绚丽的灯光及机械结构诠释科技美感,伴随激昂的音乐奔腾向前。从2016年春晚540台Alpha机器人登台齐舞到2018年春晚24台Jimu汪汪组队拜年,再到2019年春晚6台Walker机器人与演员同台表演歌舞《青春畅想》……优必选科技已经四次登上春晚舞台,展示华夏人工智能和机

    2021年 2月 12日
  • 墨芯携手海潮|稠密化生态释放积极变革力量

    近日,墨芯人工智能与海潮信息签订元脑计谋合营协议。这是在海潮计谋投资墨芯之后,双方进一步计谋合营。 墨芯将携手海潮信息,以超过的稠密化估计技巧和产品,广阔的生态潜能,融合资源与算法,共创全栈AI解决方案,为各行各业AI利用供给强大算力引擎和生态支撑,为企业降本增效,并加速产业的人工智能化进程。AI估计的新锐势力—稠密化估计墨芯人工智能是稠密化估计的全球引领者,供给云端和终端AI加速方案,可广泛利用于互联网、运营商、生物医药等数据中心AI推理场景,并积极致力于稠密化生态建设。 在AI时代算力需求

    2022年 10月 9日
  • 周志华、李航、邱锡鹏、李沐、Aston Zhang 5位专家指导,机械之心发布ML术语中英对照词表

    几年前机械之心发布了一个旨在构建 AI 范围术语库的开源项目「Artificial-Intelligence-Terminology-Database」(简称「AITD」)。最近,该项目迎来了第三版。除了常规的更新之外,机械之心还在周志华教授、李航博士、邱锡鹏教授、李沐博士、Aston Zhang 博士等范围专家的指导及帮助下形成了「机械进修」专题篇。未来,机械之心还将会持续完善术语的收录和扩展阅读的构建,另外我们也希望更多 AI 技术社区成员参与到术语库的构建之中,具体的参与方式可以查看文章详情。2017 年,机

    2021年 8月 19日
  • 崭新x86内核架构、XeSS神经网络超采样、千亿晶体管SoC,这次英特尔诚意满满

    2021 年英特尔架构日上,英特尔发布一系列重大技术架构的改变和创新:两款崭新的 x86 内核架构(能效核与机能核)、代号为 Alder Lake 的首个机能混合架构、英特尔硬件线程调剂器、专为数据中心设计的下一代英特尔至强可扩大处理器 Sapphire Rapids 以及基础设施处理器(IPU)等内容。

    2021年 8月 20日
  • 智能汽车的事变数据,都会是抓不住的「幽魂」吗?

    特斯拉仍然深陷于舆论漩涡。纵使业界呼吁理性看待特斯拉「刹车门」事务,但这场风波很难在短时间内消弭,包括说服大众的究竟也很难一锤定音。为了寻找究竟,我们须要跨过两座大山。第一座大山是数据。目前,特斯拉向媒体公开的数据不全。多方隔靴搔痒,也只能在迷雾中分析造成事变的可能原因。下一步,只有等待更全的行车数据,以及车内EDR的纪录信息。第二座大山是检测机构。在行业内,暂时还不出台针对智能汽车检测的标准规范。同时,也很难找到有对应检测能力的第三方检测机构,他们既不审定智能电动汽车的设备,也缺乏相应的审定标准。在这件事情上

    2021年 5月 11日
  • 悲观智能文档批阅系统,推动证券非结构化文档处理提质提效

    悲观智能批阅系统,实行相关场景非结构化文档的辨别剖析、智能考核及与交易对接等,并通过平台化建设提供一定的可拓展性和泛化能力。

    2022年 1月 11日
  • Mistral AI新模型对标GPT-4,不开源且与微软分工,网友:忘了初心

    「欧洲版 OpenAI」的「最强开源大模型」,被微软收编了。生成式 AI 领域,又有重量级产品出现。周一晚间,Mistral AI 正式颁布了「旗舰级」大模型 Mistral Large。与此前的一系列模型不同,这次 Mistral AI 颁布的版本功能更强,体量更大,直接对标 OpenAI 的 GPT-4。而新模型的出现,也伴随着公司大方向的一次转型。随着 Mistral Large 上线,Mistral AI 推出了名为 Le Chat 的聊天助手(对标 ChatGPT),任何人都可以试试效果。试用链接:htt

    2024年 2月 27日
  • 亚马逊资深首席科学家李沐:工作这五年

    自CMU机器学习博士毕业至今,亚马逊资深首席科学家李沐的业界之路已经走过了五年空儿。期间,李沐博士对技巧、产物、管理、升职加薪等工作中的方方面面都有了更深的感悟。「专一于最有代价的工作」是他对过往五年工作历程的最好总结。

    2021年 5月 25日
  • 新版Linux在M2 MacBook Air可用,Linus Torvalds发布最新内核

    更多人应用 Arm 硬件将带来更好的 Arm 软件。

    2022年 8月 2日
  • 手把手教你,从零开始实现一个稀少混合大师架构语言模型(MoE)

    本文介绍了实现一个稀少混合大师语言模型(MoE)的方法,详细解释了模型的实施过程,包括采用稀少混合大师取代传统的前馈神经网络,实现 top-k 门控和带噪声的 top-k 门控,以及采用 Kaiming He 初始化技术。作者还说明了从 makemore 架构保持不变的元素,比如数据集处理、分词预处理和语言建模任务。最后还提供了一个 GitHub 仓库链接,用于实现模型的整个过程,是一本不可多得的实战教科书。内容简介在混合大师模型 Mixtral 发布后,混合大师模型(MoE)越来越受到人们的关注。在稀少化的混合专

    2024年 2月 16日

发表回复

您的电子邮箱地址不会被公开。 必填项已用 * 标注