AI在线 AI在线

机器学习

2025年机器学习十大算法全景解析:从理论到实践的深度指南

在人工智能驱动的2025年,机器学习算法已成为科技革命的核心引擎。 从自动驾驶的实时决策到医疗诊断的精准预测,从金融风控的智能分析到个性化推荐的千人千面,十大经典算法持续进化,构建起智能社会的数字基石。 一、线性回归:数据建模的基石算法原理通过最小化预测值与实际值的平方误差,建立自变量与因变量的线性关系模型:Y=β0 ∑i=1nβiXi ϵ其中β为回归系数,ϵ为误差项。
8/4/2025 2:25:00 AM
幻风magic

谷歌通过机器学习判断用户年龄:你的搜索行为、观看内容都可作为依据

AI在线 7 月 31 日消息,据外媒 TechCrunch 今晚报道,谷歌正在美国测试一项基于机器学习的技术,旨在判断用户年龄,并在旗下所有产品中据此筛选内容。 谷歌表示,该系统会参考 Google 账户中的多种数据,例如用户的搜索行为和在 YouTube 上观看的视频类型,以估算用户年龄。 一旦判断用户未满 18 岁,谷歌会发送邮件告知其产品功能可能发生的变化。
7/31/2025 9:22:26 PM
清源

机器学习特征工程的最佳实践

特征工程是模型训练之前运行的关键过程,因为输入数据的质量直接决定了模型输出的质量。 虽然深度学习模型擅长从图像或文本等非结构化数据中自动学习特征,但明确的特征工程对于表格数据集仍然至关重要。 在本文中,云朵君将展示特征工程对回归任务的影响,特别关注具有混合数字、分类和基于时间的特征的大型表格数据集。
7/31/2025 1:22:00 AM
云朵君

自主式AI如何颠覆营销技术决策规则

要点概述:• 旧规则失效。 传统的基于规则的系统缺乏学习或适应能力,限制了实时营销中的决策制定。 • 分析技术陷入瓶颈。
7/29/2025 7:07:00 AM
Jonathan

老黄自曝皮衣口袋藏“秘密期权池”!随时准备奖励员工,团队亿万富翁数量世界第一

黄仁勋亲口承认:他随身带着“秘密期权池”,随时奖励表现出色的员工。 在最新采访的结尾,主持人问起这个传闻,老黄开玩笑式的回答“现在就装在我的口袋里”。 这位掌管着全球市值最高科技公司之一的CEO,把奖励员工这件事做得如此随性又直接。
7/25/2025 10:11:10 AM

十年六万引!BatchNorm 封神,ICML 授予时间检验奖

一篇发表于2015年的论文,在十年后,于国际机器学习大会(ICML)2025上,被授予了“时间检验奖”(Test of Time Award)。 这篇论文就是深度学习领域无人不晓的《Batch Normalization: Accelerating Deep Network Training by Reducing Internal Covariate Shift》。 它的出现,从根本上改变了研究者们训练深度神经网络的方式,成为AI技术发展进程中的一座关键里程碑。
7/18/2025 7:00:00 AM

使用 SHAP 使机器学习模型变的可解释

大家好,我是小寒今天给大家分享机器学习中的一个关键概念,SHAPSHAP 是一种用于解释机器学习模型输出的统一框架。 它基于博弈论中的 Shapley 值,用来量化每个特征对模型预测结果的贡献度。 帮助我们理解模型为什么做出这样的预测。
7/15/2025 10:29:17 AM
程序员小寒

「流匹配」成ICML 2025超热门主题!网友:都说了学物理的不准转计算机

众所周知,第 42 届国际机器学习大会(ICML)将于 7 月 13 日至 19 日在加拿大温哥华盛大举行。 在生成式 AI 领域,最新的前沿热点已经转向探索更高质量,更稳定,更简洁,更通用的模型形态。 流匹配(Flow Matching)技术正完美的踩中了每一个热点要素。
7/14/2025 9:12:00 AM

人类增强子突变敏感性图谱首次绘制:AI 与体内实验揭示发育调控密码

编辑丨&ENCODE 计划(Encyclopedia of DNA Elements)中提到,人类基因组中仅 2% 序列编码蛋白质,其余 90% 非编码区的调控功能长期成谜。 了解人类生物学需要的不仅仅是绘制基因图谱,还必须了解基因表达是如何被调节的,以指导身体系统的健康发育、生长和维系。 对于作为远端调控元件的增强子,其突变与先天性心脏病、肢体畸形等发育疾病密切相关。
7/10/2025 3:02:00 PM
ScienceAI

ICML 2025 | 给AI装上「智能升级插件」!阿里安全-清华大学D-MoLE让模型在持续学习中动态进化

本文第一作者为清华大学计算机系的硕士二年级研究生葛晨笛,研究方向为多模态大语言模型、自动机器学习和图机器学习。 主要合作者为来自阿里巴巴集团安全部的樊珈珮、黄龙涛和薛晖。 通讯作者为清华大学的朱文武教授、王鑫副研究员。
7/10/2025 2:50:24 PM

Ilya尘封10年录音曝光!大二入Hinton门下,竟坦言机器学习反直觉

Ilya Sutskever因在深度学习方面的远见卓识而闻名。 他现在许多广为流传的言论其实都来自于他在2023年参加Dwarkesh播客时的发言。 此后,直到2025年Ilya创办SSI后,几乎不再有公开的言论,此前曾探讨过Ilya的去向。
7/4/2025 4:39:56 PM

机器学习实战:糖尿病预测及可视化分析

你一生中可能已经多次听说过糖尿病。 它如此普遍地流行。 根据国际糖尿病联合会的数据,2024年有超过340万人死于糖尿病。
7/3/2025 1:45:00 AM
云朵君

分布式机器学习的五大流行框架

译者 | 布加迪审校 | 重楼使用这些框架可以优化内存和计算资源,扩展你的机器学习工作流程,加快流程速度并降低总体成本。 分布式机器学习(DML)框架使你能够跨多台机器(使用 CPU、GPU 或 TPU)训练机器学习模型,从而大大缩短训练时间,同时高效处理原本内存无法容纳的大型复杂工作负载。 此外,这些框架还允许你处理数据集、调整模型,甚至使用分布式计算资源来给模型提供服务。
6/30/2025 8:21:58 AM
布加迪

ByteBrain团队VLDB25 | 面向不完美工作负载的无数据访问基数估计方法

导读本文基于ByteBrain团队实际生产场景,提出一项新的研究问题,即如何在无数据访问条件下,从不完美的查询工作负载中学习一个具备泛化能力与鲁棒性的基数估计模型;同时提出创新技术方案 GRASP (Generalizable and Robust, data-AgnoStic cardinality Prediction) ,借助组合式设计(Compositional Design)解决这一颇具挑战性的问题。 论文目前已经被VLDB25接收。 论文标题:Data-Agnostic Cardinality Learning from Imperfect Workloads论文作者:Peizhi Wu, Rong Kang, Tieying Zhang*, Jianjun Chen, Ryan Marcus, Zachary G.
6/26/2025 9:22:33 AM
ByteBrain

PyTorch 从 0 到 1:超详细的安装与入门实战指南

PyTorch 是一个由 Meta (Facebook) AI 研究实验室主导开发的开源机器学习库。 它以其灵活性、易用性和强大的GPU加速功能而闻名,已成为学术界和工业界进行深度学习研究和应用开发的首选框架之一。 PyTorch 的两大核心特性:张量 (Tensor) 计算:类似于 NumPy 的多维数组,但提供了强大的 GPU 加速能力,使得大规模数值计算变得极其高效。
6/23/2025 10:20:00 AM
用户007

​OpenAI 宣布 GPT-4.5 将在 API 中下线,开发者感到困惑与失落

近日,OpenAI 向开发者发送了一封电子邮件,通知他们将在2025年7月14日从官方 API 中移除 GPT-4.5预览版。 这一消息迅速在 AI 和机器学习社区引发热议。 虽然 OpenAI 的发言人表示,GPT-4.5仍将可供个人 ChatGPT 用户使用,但对于依赖于这一强大模型的第三方开发者来说,这无疑是一项重大的打击。
6/18/2025 10:01:54 AM
AI在线

iPhone上也能跑Qwen3了!阿里一口气开源32款MLX模型,适配苹果全家桶!千问打入苹果生态,国行版苹果智能即将落地?!

编辑 | 伊风出品 | 51CTO技术栈(微信号:blog51cto)“源神”千问,又一次闷声干大事! 今天刷 Reddit 才发现:昨晚,阿里千问一口气开源了 32 款,适配苹果 MLX 架构的 Qwen3 模型。 没错,32 款,就是这么量大实惠。
6/17/2025 5:54:25 PM
伊风

AI 黑话太多看不懂?一文帮你打通:AI, 机器学习, 大模型, LLM, Agent 都是啥关系?

最近是不是感觉整个世界都在聊AI? 从ChatGPT、Sora、到Cursor… 人工智能正以前所未有的速度和广度渗透进我们的生活和工作。 伴随而来的是一堆高频词汇:大模型(Large Model)、LLM(Large Language Model)、机器学习(Machine Learning)、深度学习(Deep Learning,虽然你没问,但它太重要了,我们也会提一下)、还有最新的智能体(Agent)……哎呀,听得多了,感觉脑袋都成了一锅粥。
6/16/2025 10:05:00 AM
徐述