AI在线 AI在线

机器学习

Ilya尘封10年录音曝光!大二入Hinton门下,竟坦言机器学习反直觉

Ilya Sutskever因在深度学习方面的远见卓识而闻名。 他现在许多广为流传的言论其实都来自于他在2023年参加Dwarkesh播客时的发言。 此后,直到2025年Ilya创办SSI后,几乎不再有公开的言论,此前曾探讨过Ilya的去向。
7/4/2025 4:39:56 PM

机器学习实战:糖尿病预测及可视化分析

你一生中可能已经多次听说过糖尿病。 它如此普遍地流行。 根据国际糖尿病联合会的数据,2024年有超过340万人死于糖尿病。
7/3/2025 1:45:00 AM
云朵君

分布式机器学习的五大流行框架

译者 | 布加迪审校 | 重楼使用这些框架可以优化内存和计算资源,扩展你的机器学习工作流程,加快流程速度并降低总体成本。 分布式机器学习(DML)框架使你能够跨多台机器(使用 CPU、GPU 或 TPU)训练机器学习模型,从而大大缩短训练时间,同时高效处理原本内存无法容纳的大型复杂工作负载。 此外,这些框架还允许你处理数据集、调整模型,甚至使用分布式计算资源来给模型提供服务。
6/30/2025 8:21:58 AM
布加迪

ByteBrain团队VLDB25 | 面向不完美工作负载的无数据访问基数估计方法

导读本文基于ByteBrain团队实际生产场景,提出一项新的研究问题,即如何在无数据访问条件下,从不完美的查询工作负载中学习一个具备泛化能力与鲁棒性的基数估计模型;同时提出创新技术方案 GRASP (Generalizable and Robust, data-AgnoStic cardinality Prediction) ,借助组合式设计(Compositional Design)解决这一颇具挑战性的问题。 论文目前已经被VLDB25接收。 论文标题:Data-Agnostic Cardinality Learning from Imperfect Workloads论文作者:Peizhi Wu, Rong Kang, Tieying Zhang*, Jianjun Chen, Ryan Marcus, Zachary G.
6/26/2025 9:22:33 AM
ByteBrain

PyTorch 从 0 到 1:超详细的安装与入门实战指南

PyTorch 是一个由 Meta (Facebook) AI 研究实验室主导开发的开源机器学习库。 它以其灵活性、易用性和强大的GPU加速功能而闻名,已成为学术界和工业界进行深度学习研究和应用开发的首选框架之一。 PyTorch 的两大核心特性:张量 (Tensor) 计算:类似于 NumPy 的多维数组,但提供了强大的 GPU 加速能力,使得大规模数值计算变得极其高效。
6/23/2025 10:20:00 AM
用户007

​OpenAI 宣布 GPT-4.5 将在 API 中下线,开发者感到困惑与失落

近日,OpenAI 向开发者发送了一封电子邮件,通知他们将在2025年7月14日从官方 API 中移除 GPT-4.5预览版。 这一消息迅速在 AI 和机器学习社区引发热议。 虽然 OpenAI 的发言人表示,GPT-4.5仍将可供个人 ChatGPT 用户使用,但对于依赖于这一强大模型的第三方开发者来说,这无疑是一项重大的打击。
6/18/2025 10:01:54 AM
AI在线

iPhone上也能跑Qwen3了!阿里一口气开源32款MLX模型,适配苹果全家桶!千问打入苹果生态,国行版苹果智能即将落地?!

编辑 | 伊风出品 | 51CTO技术栈(微信号:blog51cto)“源神”千问,又一次闷声干大事! 今天刷 Reddit 才发现:昨晚,阿里千问一口气开源了 32 款,适配苹果 MLX 架构的 Qwen3 模型。 没错,32 款,就是这么量大实惠。
6/17/2025 5:54:25 PM
伊风

AI 黑话太多看不懂?一文帮你打通:AI, 机器学习, 大模型, LLM, Agent 都是啥关系?

最近是不是感觉整个世界都在聊AI? 从ChatGPT、Sora、到Cursor… 人工智能正以前所未有的速度和广度渗透进我们的生活和工作。 伴随而来的是一堆高频词汇:大模型(Large Model)、LLM(Large Language Model)、机器学习(Machine Learning)、深度学习(Deep Learning,虽然你没问,但它太重要了,我们也会提一下)、还有最新的智能体(Agent)……哎呀,听得多了,感觉脑袋都成了一锅粥。
6/16/2025 10:05:00 AM
徐述

使用FastAPI和Redis缓存加速机器学习模型服务

译者 | 李睿审校 | 重楼本文介绍了如何使用FastAPI和Redis缓存加速机器学习模型服务。 FastAPI作为高性能Web框架用于构建API,Redis作为内存中的数据结构存储系统作为缓存层。 通过集成FastAPI和Redis,系统能快速响应重复请求,避免冗余计算,显著降低延迟和CPU负载。
6/16/2025 7:55:29 AM
李睿

告别中心云:构建分布式联邦AI的三大技术支柱​

译者 | 朱先忠审校 | 重楼传统云计算依赖集中式数据训练模型,但边缘计算的普及催生了新范式——去中心化机器学习。 其核心代表——联邦学习正在颠覆传统流程。 本文将对联邦学习概念及其三个关键技术展开讨论。
6/11/2025 8:32:44 AM
朱先忠

XRobotics 推出新型比萨机器人,每月生产 2.5 万张披萨

在旧金山,一家名为 XRobotics 的机器人公司正以其最新的厨房助手 ——xPizza Cube 引起关注。 这款比萨机器人体积相当于一个叠放的洗衣机,运用机器学习技术,能够将酱料、奶酪和香肠快速、准确地涂抹在比萨饼上。 每台机器每月租赁费用为1300美元,合同期为三年,能够在一小时内制作高达100张比萨。
6/10/2025 2:00:46 PM
AI在线

机器学习轻量化加速的五大核心技术突破​

译者 | 朱先忠审校 | 重楼简介无论你是在准备面试,还是在工作中构建机器学习系统,模型压缩都已成为一项必备技能。 在大语言模型(LLM)时代,模型规模越来越大,如何压缩这些模型以使其更高效、更小巧、更易于在轻量级机器上使用,这一挑战从未如此严峻。 在本文中,我将介绍每位机器学习从业者都应该理解和掌握的四种基本压缩技术。
6/3/2025 8:45:25 AM
朱先忠

Gartner:到2029年,50%的云计算将用于AI工作负载

全球著名咨询调查机构Gartner在官网公布了,未来4年影响云计算增长的几大趋势。 分别包括对云的不满、AI/机器学习需求增加、多云和跨云、行业解决方案、数字主权和可持续性。 对云的不满尽管云采用仍在增长,但并非所有实施都成功。
5/26/2025 9:22:00 AM

使用FastAPI和Redis Caching加快机器学习模型推理

译者 | 布加迪审校 | 重楼Redis 是一款开源内存数据结构存储系统,是机器学习应用领域中缓存的优选。 它的速度、耐用性以及支持各种数据结构使其成为满足实时推理任务的高吞吐量需求的理想选择。 我们在本教程中将探讨Redis缓存在机器学习工作流程中的重要性。
5/14/2025 8:16:46 AM
布加迪

连续思维机器来了!Transformer八子之一创企推出,让AI不再「一步到位」拍脑袋做决定

科学界的一个共识是:即使是最复杂的现代人工智能,也难以媲美人类大脑的表现和效率。 研究者经常从大自然中寻找灵感,了解如何在人工智能领域取得进步,例如利用进化来合并模型、为语言模型进化出更高效的记忆或探索人工生命的空间。 虽然人工神经网络近年来让人工智能取得了非凡的成就,但它们仍然是其生物对应物的简化表征。
5/13/2025 8:56:54 AM

100个Python机器学习小技巧,让你速通ML

构建机器学习模型是数据科学的关键环节,涉及运用算法进行数据预测或挖掘数据中的模式。 本文分享一系列简洁的代码片段,涵盖机器学习过程的各个阶段,从数据准备、模型选择,到模型评估和超参数调优。 这些代码示例能帮助你使用诸如Scikit-Learn、XGBoost、CatBoost、LightGBM等库,完成常见的机器学习任务,还包含使用Hyperopt进行超参数优化、利用SHAP值进行模型解释等高级技术。
5/7/2025 7:17:18 AM
学研君

数据科学家必备:从回归到CNN,简明概述常见机器学习模型

机器学习是现代人工智能的核心,支撑着从推荐系统到自动驾驶汽车等各类应用。 但每一个智能应用背后,都离不开那些奠定基础的模型。 本文将为你简明而全面地梳理关键的机器学习模型,帮助你系统掌握核心概念与应用。
4/30/2025 1:40:00 AM
新叔

Orange:一个免费的交互式数据挖掘与机器学习平台

Orange 是一款开源的数据分析与可视化工具,专注于数据挖掘和机器学习领域。 它提供了直观的图形化界面,用户无需编程和数学知识即可完成数据科学工作流程,同时也支持通过 Python 脚本实现高级功能。 功能简介Orange 图形化编程对于初学者非常友好,他们可以专注于数据分析本身,而不是耗时的编程工作。
4/29/2025 9:26:34 AM
不剪发的Tony老师