是时候进修机械进修零碎安排了!斯坦福CS 329S开课,课件、笔记同步更新

这是一门新的课程——在进修了算法、框架等内容后,是时候深入了解一下「机械进修零碎安排」了!

是时候进修机械进修零碎安排了!斯坦福CS 329S开课,课件、笔记同步更新

近日,斯坦福大学宣布开设一门全新课程:CS 329S《机械进修零碎安排》。课程主页:https://stanford-cs329s.github.io/这门课程的主讲人、计算机科学家 Chip Huyen 也在推特上认真宣传了一波(很多人应该都读过她的博客文章,因为这位小姐姐确实很有名气)。

是时候进修机械进修零碎安排了!斯坦福CS 329S开课,课件、笔记同步更新

机械进修零碎安排的概念是指,为了满足特定要求,针对机械进修零碎对软件体系架构、基础架构、算法和数据进行定义的过程。虽然现有的零碎也可以满足大部分模型搭建的需求,但我们必须承认:首先,工具空间是不断革新的;其次,交易需求是不断变化的;最后,数据分布也是持续更替的。因此,「零碎」是很容易过时的。如果不能及时更新,那么出错、崩溃都是可以预料的。这也是本门课程开设的初衷。本门课程旨在为现实中的机械进修零碎提供一个迭代框架,该框架的指标是构建一个可摆设、可信赖、可扩展的零碎。首先要考虑的是每个 ML 项目的利益相关者及指标,不同的指标则需要不同的安排采用,且要考虑如何权衡。课程涵盖了从项目界定、数据管理、模型开发、摆设、基础架构、团队架构到交易分析的所有步骤,在每个步骤中,都会探讨不同解决方案的动机、挑战和局限性。在课程的最后一部分,将会探讨机械进修生产生态零碎的未来。门生们还将进修关于隐私、公平、安全方面的常识。进修这门课程的门生应该满足以下条件:

具备基本的计算机科学原理和技能常识,能够编写一般的计算机程序(比如实现了 CS106B / X 等课程);

对机械进修算法有着良好的掌握(比如实现了 CS229、CS230、CS231N、CS224N 等课程);

熟悉至少一个框架,比如 TensorFlow,PyTorch,JAX;

熟悉基本的概率论(比如实现 CS109 或 Stat116 等课程)

鉴于大多数课程都会使用 Python,因此也建议采用这门课程的门生了解一点 Python 常识。这门课程没有教科书,主要依赖于课堂讲义和一些阅读材料。课程视频都会被录制保存,目前仅开放给校内门生,暂未决定是否公开发布。讲师介绍

是时候进修机械进修零碎安排了!斯坦福CS 329S开课,课件、笔记同步更新

课程讲师 Chip Huyen 来自越南,是一位作家和计算机科学家,本科和硕士均就读于斯坦福大学计算机科学专业,此前曾在英伟达、Netflix 等公司工作。Chip Huyen 开设过一些受欢迎的课程,比如《TensorFlow for Deep Learning Research》,在 GitHub 平台也有很多热点项目。

是时候进修机械进修零碎安排了!斯坦福CS 329S开课,课件、笔记同步更新

Chip Huyen 主页:https://github.com/chiphuyen此前,Chip Huyen 还撰写过很多热点文章,比如《机械进修零碎安排指南》、《十大优质免费机械进修课程资源》、《202 个热点机械进修工具评测》等教程。课程纲要最后我们来了解一下课程进度。根据现有计划,课程纲要如下(具体以实际讲课情况为准)第 1 周:机械进修零碎安排概述

何时使用机械进修

研究中的机械进修与生产中的机械进修

机械进修零碎与传统软件

机械进修生产中「虚构」的那些事儿

机械进修应用

Case Study

第 2 周:迭代过程

好的机械进修零碎的原理

迭代过程

计划范围

第 3 周:数据管理

现实世界的数据挑战

如何收集、存储和处理海量数据

数据 pipeline 的不同层

数据处理器 & 显示器

数据控制器

数据存储

数据提取:数据库引擎

第 4 周:创建训练数据集

特征工程

数据标签

数据泄露

数据分区、切片和采样

第 5 周:构建和训练机械进修模型

Baseline

模型采用

训练、调试和实验跟踪

分布式训练

评估和基准

AutoML

第 6 周:摆设

推理约束

模型压缩与优化

训练服务偏差

概念漂移

服务器端 ML & 客户端 ML

缓释策略

摆设评估

第 7 周:项目节点讨论

道德问题

第 8 周:监控及维护

监控内容

指标、日志记录、标签、警报

更新和回滚

迭代改进

第 9 周:硬件和基础架构

架构采用

硬件安排

边缘设备

云私人数据中心

高性能计算的未来

第 10 周:将 ML 整合到交易中

模型性能与交易指标与用户体验

团队架构

为什么机械进修项目会失败

最佳实践

机械进修生产现状

目前实现讲课的部分均已上传笔记和 PPT 资料,需要的自取:

是时候进修机械进修零碎安排了!斯坦福CS 329S开课,课件、笔记同步更新

是时候进修机械进修零碎安排了!斯坦福CS 329S开课,课件、笔记同步更新

是时候进修机械进修零碎安排了!斯坦福CS 329S开课,课件、笔记同步更新

是时候进修机械进修零碎安排了!斯坦福CS 329S开课,课件、笔记同步更新

传送门:https://stanford-cs329s.github.io/syllabus.html

原创文章,作者:机器之心,如若转载,请注明出处:https://www.iaiol.com/news/shi-shi-hou-jin-xiu-ji-xie-jin-xiu-ling-sui-an-pai-le-si/

(0)
上一篇 2021年 1月 26日 上午10:22
下一篇 2021年 1月 29日 下午4:13

相关推荐

  • 中国队夺金幕后的「AI手语翻译官」:初次上岗,手语可懂度超90%

    有了腾讯 3D 手语数智人主播「聆语」的精彩讲授,即使是身处「无声世界」的群体也能实时感受冰雪赛事的每一份激情。

    2022年 2月 9日
  • 网易云信神经网络音频降噪算法:提升瞬态噪声抑制结果,适合移动端设备

    机器之心专栏网易云信音频实验室网易云信音频实验室自主研发了一个针对瞬态噪声的轻量级网络音频降噪算法(网易云信 AI 音频降噪),对于 Non-stationary Noise 和 Transient Noise 都有很好的降噪量,并且控制了语音旗号的损伤程度,保证了语音的质量和理解度。鉴于旗号处理的传统音频降噪算法对于 Stationary Noise(平稳噪声)有比较好的降噪结果。但是对于 Non-stationary Noise(非平稳噪声),特别是 Transient Noise(突发噪声)降噪结果较差,而且

    2021年 8月 19日
  • 开源!港中文、MIT、复旦提出首个RNA基石模型

    本文中 RNA-FM 模型的出现一定程度上缓解了 RNA 带标注数据紧张的现状,为其他钻研者提供了访问大批量无标签数据的便捷接口。并且,该模型将以 RNA 范围基础模型的身份,为该范围的各种各样的钻研提供强有力的支援与帮助。

    2022年 7月 16日
  • 每次放一个细胞,打印心脏或上千年,斯坦福大学如何加快3D打印心脏?

    使用先进的 3D 打印技术,斯坦福大学钻研者将由活细胞制成的糊状物转化为心脏和其他器官。

    2022年 3月 27日
  • 元宇宙虚构数字人的建立与将来身份系统

    「机器之心2021-2022年度AI趋势大咖说」聚焦「启动将来的AI技术」与「重塑产业的AI科技」,推出线上分享,共邀请近40位AI领域知名学者、产业专家及企业高管通过主题分享及多人圆桌等形式,与行业精英、读者、观众共同回顾 2021年中的重要技术和学术热点,盘点AI产业的年度研究方向以及重大科技突破,展望2022年度AI技术发展方向、AI技术与产业科技融合趋势。

    2022年 8月 1日
  • 无监督训练用重叠自编码器是否落伍?ML博士对比了8个自编码器

    柏林工业大学深度学习方向博士生 Tilman Krokotsch 在多项任意中对比了 8 种自编码器的性能。

    2021年 2月 17日
  • 纯PyTorch语音工具包SpeechBrain开源,Kaldi:我压力有点大

    距离 Mirco Ravanelli 宣布打造新的语音工具包过去了一年多,SpeechBrain 真的如期而至。

    2021年 3月 16日
  • Creator 面对面 | 昇腾异构盘算架构 CANN 的技巧进展和未来展望

    在 2021 年的最后一个季度, CANN 5.0 版本正式发布。昇腾 CANN 作为平台级的异构盘算架构,已经经过了 3 年多的优化,迭代了 4 个大版本,CANN 5.0 在性能方面,AI 模型训练/推理性能大幅提升,用时更短;在功能方面:推理引擎 ATC Suite1.0 首次发布,AI 模型推理性能更高、功能更全面;在便捷性方面:代码开发和调试进一步简化,包括支持混合编程等,使用门槛更低。在性能上,无论是训练规模大小、场景类型,还是推理效率,均有较大提升。实验数据显示,原本需要 6.25 分训练的 BERT 模型,在 CANN 5.0 的加持下缩短了一倍多,只需2.69分钟就能完成训练;至于在 3.0 版本上需要 28 秒训练的 ResNet ,5.0 版本则是“再进化”到 16 秒。

    2022年 7月 15日
  • 百分点数据科学实验室:产物生命周期料理创新应用落地实践

    编者按产物生命周期料理在数字经济发展过程中是必不可少的,在零售快消行业可用来指导产物的以销定采和精准投放,在IT行业可辅佐软件应用等产物的开发进程料理,同时还也会对环境料理产生影响,对建筑业在节能减排、减轻环境污染层面起到辅佐作用。因此,及时把控产物生命周期进程,用数据智能技术赋能料理至关重要。百分点数据科学实验室鉴于产物生命周期理论在多个行业的落地实践,总结了如何准确把握产物生命周期的四个阶段及辨别方法论。众所周知,一种产物在商场上的销售情况和获利能力并非是一成不变的,因此,任何一家企业的产物不可能永远畅销,但企

    2021年 3月 25日
  • 对抗图象变幻进犯,腾讯OVB-AI手艺中心获NeurIPS2021图象近似度寻衅赛季军

    近日,在 AI 顶会 NeurIPS 2021 的图象近似度寻衅赛中(Image Similarity Challenge),来自腾讯在线视频 BU-AI 手艺中心的团队,在 Matching Track 赛道战胜来自全球 1000 多支队伍,荣获季军。

    2022年 1月 9日

发表回复

您的电子邮箱地址不会被公开。 必填项已用 * 标注