佐治亚理工学院硕士建议:2022年你应该掌握这些呆板进修算法

2022 年你应该知道的所有呆板进修算法。

想要成为一名合格的 AI 工程师,并不是一件简单的事情,需求掌握各种呆板进修算法。对于小白来说,入行 AI 还是比较困难的。为了让初学者更好的进修 AI,网络上出现了各种各样的进修资料,也不乏很多 AI 大牛提供免费的授课视频提供帮助。近日,来自佐治亚理工学院的理学硕士 Terence Shin 在博客发布平台 Medium 撰文《2022 年你应该知道的所有呆板进修算法》。文中涵盖了 5 类最重要的呆板进修算法:集成进修算法;可说明算法;聚类算法;降维算法;近似性算法。佐治亚理工学院硕士建议:2022年你应该掌握这些呆板进修算法目前,Terence Shin 在 Medium 显示为 Top 1000 作者,有 62K 关注者,目前这篇文章已经有 1.4K 点赞。佐治亚理工学院硕士建议:2022年你应该掌握这些呆板进修算法2022 年,你需求掌握的呆板进修算法集成进修算法为了了解什么是集成进修算法,你首先需求知道什么是集成进修。简单来讲,集成进修是一种同时应用多个模型以获得比单个模型性能更好的方法。更形象的说明,我们以一个先生和一个班级的先生为例:佐治亚理工学院硕士建议:2022年你应该掌握这些呆板进修算法想象一下,一个先生解决一个数学问题 VS 一个班级先生解决相同的问题。作为班级,所有先生可以相互检查彼此的谜底,并一致找出正确谜底解决问题。另一方面,作为先生的个人,如果他 / 她的谜底是错误的,那么没有其他人可以验证他 / 她的谜底正确与否。因此,由先生组成的班级类似集成进修算法,其中几个较小的算法协同工作以制定最终响应。关于集成进修的更多信息请参考:https://towardsdatascience.com/ensemble-learning-bagging-and-boosting-explained-in-3-minutes-2e6d2240ae21集成进修算法对于回归和分类问题或监视进修问题最有用。由于其固有的性质,它优于传统的朴素贝叶斯、支持向量机、决策树等呆板进修算法。集成进修的代表方法有:Random Forests、XGBoost、LightGBM、CatBoost.可说明算法可说明算法帮助我们识别和了解与结果有显著关系的变量。因此,与其创建一个模型来预测响应变量的值,我们可以创建可说明模型来了解模型中变量之间的关系。佐治亚理工学院硕士建议:2022年你应该掌握这些呆板进修算法当你想要了解模型为什么做出这个决策、或者你想要了解两个或多个变量是如何相互关联的,可说明模型能够提供帮助。在实践中,说明呆板进修模型能够实现的性能和呆板进修模型本身一样重要。如果你不能说明一个模型是如何工作的,那么将不会有人愿意应用它。目前基于假设检验的传统可说明模型主要包括:线性回归、逻辑回归;此外,可说明模型还包括 SHAP 和 LIME 这两种流行技术,它们被用来说明呆板进修模型。聚类算法聚类是按照某个特定标准 (如间隔) 把一个数据集分割成不同的类或簇,使得同一个簇内的数据对象的近似性尽量大,同时不在同一个簇中的数据对象的差异性也尽量地大。也即聚类后同一类的数据尽量聚集到一起,不同类数据尽量分离。佐治亚理工学院硕士建议:2022年你应该掌握这些呆板进修算法聚类的一般过程包括数据准备、特征选择、特征提取、聚类、聚类结果评估。聚类算法可用于进行聚类分析,它是一项无监视进修任务,可以将数据分组到聚类中。与目标变量已知的监视进修不同,聚类分析中没有目标变量。聚类能够发现数据中的自然模式和趋势。k-means 聚类和层次聚类是最常见的两种聚类算法。降维算法数据降维算法是呆板进修算法中的大家族,它的目标是将向量投影到低维空间,以达到可视化、分类等目的。佐治亚理工学院硕士建议:2022年你应该掌握这些呆板进修算法降维技术在很多情况下都很有用:在数据集中有数百甚至数千个特征并且用户需求选择少数特征时,需求用到降维;当 ML 模型过度拟合数据也需求降维,这意味着用户需求减少输出特征的数量。目前已经存在大量的数据降维算法,可以从不同的维度进行分类。按照是否有应用样本的标签值,可以将降维算法分为有监视降维和无监视降维;按照降维算法应用的映射函数,可以将算法分为线性降维与非线性降维。其中,主成分分析 PCA、线性判别分析 LDA 为线性降维。近似性算法佐治亚理工学院硕士建议:2022年你应该掌握这些呆板进修算法在呆板进修中,我们经常需求知道个体间差异的大小,进而评价个体的近似性和类别。近似性算法是计算节点、数据点、文本对近似性的算法,如欧几里得间隔,也有计算文本近似度的近似度算法,如 Levenshtein 算法。近似性算法主要包括:K 隔壁算法、欧几里得间隔、余弦近似度、奇异值分解等。其中,K 隔壁算法,即是给定一个训练数据集,对新的输出实例,在训练数据集中找到与该实例最邻近的 K 个实例,这 K 个实例的多数属于某个类,就把该输出实例分类到这个类中。欧几里得间隔是欧几里得空间中两点间普通(即直线)间隔。余弦近似度是通过计算两个向量的夹角余弦值来评估他们的近似度。原文链接:https://towardsdatascience.com/all-machine-learning-algorithms-you-should-know-in-2022-db5b4ccdf32f

原创文章,作者:机器之心,如若转载,请注明出处:https://www.iaiol.com/news/zuo-zhi-ya-li-gong-xue-yuan-shuo-shi-jian-yi-2022-nian-ni/

(0)
上一篇 2021年 12月 7日 下午2:54
下一篇 2021年 12月 9日 上午9:41

相关推荐

  • TensorFlow 2.4来了:上线对分布式训练和混合精度的新功能反对

    今天,谷歌正式发布了 TensorFlow 2.4,带来了多项新特性和功能改进。

    2020年 12月 15日
  • 首次尝试!深度进修从原始视频中发明未知输出激励的动力体系的可解释物理定律

    编辑/绿萝由于深度进修的发展进步,从视频中提炼可解释的物理定律引发了计算机视觉社区的兴趣,但仍旧面临巨大的挑战。管制方程(例如 PDE、ODE)的发明可能促进我们对复杂动力体系行为的理解、建模和预测。收集数据的日益丰富和机器进修的进步带来了静态体系建模的新视角。近日,来自中国人民大学和中国科学院大学、美国东北大学的钻研团队提出了一个端到端的无监视深度进修框架,根据录制的视频提醒静止物体呈现的显式动力学管制方程。模拟静态场景的实验表明,所提出的法子能够提炼查封形式的管制方程并同时辨别视频记录的多个动力体系的未知激励输

    2022年 6月 6日
  • 可微分骨架树:基于梯度的份子优化算法

    这周我们简单介绍一个高效份子优化的方法。该工作由UIUC的Jimeng Sun组合MIT的Connor Coley组合作完成,对应的文章题目是Differentiable Scaffolding Tree for Molecule Optimization[1],被2022年ICLR接受,主要的代码和数据发布在https://github.com/futianfan/DST。内容:思路:基于梯度的份子优化份子的可微分骨架树类梯度上升的优化算法优化效果测试由可微性失掉的可解释性思路:基于梯度的份子优化在药物发现中,分

    2022年 2月 21日
  • Nature | 电动汽车间接排放超过燃油车?实际比预想的更绿色

    长期以来,电动汽车制造商一直打着节能减排的口号来宣传。然而,一些分析师对电动汽车行业的实际绿色程度意味担忧。他们认为,电力和电池生产过程中的间接排放量可能会增加,而这些排放不仅总量不小还往往容易被忽视。但耶鲁大学环境学院最近一项发表在Nature Communications 上的研讨发现,与化石燃料汽车的间接排放相比,电动汽车的间接排放总量相形见绌。这是对燃烧化石燃料的间接排放的补充,也就是说,无论是从汽车的排气管中排出的还是从发电厂的烟囱内排出的,数据表明电动汽车在排放方面比内燃机汽车具有明显的优势。&nbsp

    2022年 1月 10日
  • 是时候进修机械进修零碎安排了!斯坦福CS 329S开课,课件、笔记同步更新

    这是一门新的课程——在进修了算法、框架等内容后,是时候深入了解一下「机械进修零碎安排」了!

    2021年 1月 26日
  • 邢波任校长的大学迎来机械进修鼻祖:Michael Jordan加盟MBZUAI任名誉老师

    提起 Michael Jordan,我们总能想起一连串的称号,比如「人工智能畛域泰斗」、「机械进修鼻祖」、「美国三院院士」、「全世界最有影响力的计算机科学家」等等。

    2022年 1月 20日
  • 华人一作统一「视觉-谈话」理解与天生:一键天生图象标注,完成视觉问答,Demo可玩

    这个 BLIP 模型可以「看图说话」,提取图象的主要内容,不仅如此,它还能回答你提出的关于图象的问题。

    2022年 2月 6日
  • 硬科技起飞,这家成立仅三年的AI钻研院已颇具国际风范

    摘要:「我认为历史上多数突破性钻研成果的出现都是偶然事件,而钻研机构所有努力都是为了提升这类偶然事件发生的概率。」张宏江说道。他所牵头的「革新型钻研院」,即是一种积极探索,短短3年已展现一派生机。

    2022年 1月 11日
  • 墨芯首席科学家严恩勖:为什么说茂密化是AI计较的将来

    主讲人:严恩勖墨芯人工智能联合创始人 & 首席科学家卡内基梅隆大学 机器学习博士神经网络动态茂密算法发明者视频简介:10年前,AI计较优化大多提防在优化算法的计较复杂度上,近年来随着AI产业化,AI计较优化更多注重在硬件的算力提拔上。当前,硬件所能带来的算力提拔已贴近限度,AI优化计较的将来将是算法与硬件架构的共同优化,以及建立相应的软件生态。茂密化计较,带来数量级的算力提拔,将成为将来AI计较优化的领航者。视频内容:

    2022年 7月 18日

发表回复

您的电子邮箱地址不会被公开。 必填项已用 * 标注