AI在线 AI在线

机器学习

使用FastAPI和Redis Caching加快机器学习模型推理

译者 | 布加迪审校 | 重楼Redis 是一款开源内存数据结构存储系统,是机器学习应用领域中缓存的优选。 它的速度、耐用性以及支持各种数据结构使其成为满足实时推理任务的高吞吐量需求的理想选择。 我们在本教程中将探讨Redis缓存在机器学习工作流程中的重要性。
5/14/2025 8:16:46 AM
布加迪

连续思维机器来了!Transformer八子之一创企推出,让AI不再「一步到位」拍脑袋做决定

科学界的一个共识是:即使是最复杂的现代人工智能,也难以媲美人类大脑的表现和效率。 研究者经常从大自然中寻找灵感,了解如何在人工智能领域取得进步,例如利用进化来合并模型、为语言模型进化出更高效的记忆或探索人工生命的空间。 虽然人工神经网络近年来让人工智能取得了非凡的成就,但它们仍然是其生物对应物的简化表征。
5/13/2025 8:56:54 AM

100个Python机器学习小技巧,让你速通ML

构建机器学习模型是数据科学的关键环节,涉及运用算法进行数据预测或挖掘数据中的模式。 本文分享一系列简洁的代码片段,涵盖机器学习过程的各个阶段,从数据准备、模型选择,到模型评估和超参数调优。 这些代码示例能帮助你使用诸如Scikit-Learn、XGBoost、CatBoost、LightGBM等库,完成常见的机器学习任务,还包含使用Hyperopt进行超参数优化、利用SHAP值进行模型解释等高级技术。
5/7/2025 7:17:18 AM
学研君

数据科学家必备:从回归到CNN,简明概述常见机器学习模型

机器学习是现代人工智能的核心,支撑着从推荐系统到自动驾驶汽车等各类应用。 但每一个智能应用背后,都离不开那些奠定基础的模型。 本文将为你简明而全面地梳理关键的机器学习模型,帮助你系统掌握核心概念与应用。
4/30/2025 1:40:00 AM
新叔

Orange:一个免费的交互式数据挖掘与机器学习平台

Orange 是一款开源的数据分析与可视化工具,专注于数据挖掘和机器学习领域。 它提供了直观的图形化界面,用户无需编程和数学知识即可完成数据科学工作流程,同时也支持通过 Python 脚本实现高级功能。 功能简介Orange 图形化编程对于初学者非常友好,他们可以专注于数据分析本身,而不是耗时的编程工作。
4/29/2025 9:26:34 AM
不剪发的Tony老师

字节跳动启动 “Top Seed” 计划,面向 2026 届博士生招募 AI 人才

字节跳动近日宣布正式启动2026届 “Top Seed” 大模型顶尖人才校招计划,计划招募约30位优秀博士生。 这一项目专注于前沿的人工智能领域,涵盖大语言模型、机器学习算法与系统、多模态生成与理解、语音处理等研究方向。 字节跳动希望通过此举,吸引那些在大模型研究领域具备极强潜力和热情的年轻才俊。
4/28/2025 12:00:40 PM
AI在线

一行代码不用写,AI看论文自己「生」出代码库!科研神器再+1

这几年,AI领域的科研人员遇到一个问题。 那就是机器学习的论文实在是多到看不过来,更别说还要用代码实现论文中逻辑。 HuggingFace上的「每日论文」板块每天都有十几篇新出的研究论文这导致一个问题,研究者往往「重视结果」而没有精力来用用代码验证,并且复现很多先前的工作有点「重复造轮子」,浪费研究者的精力。
4/28/2025 9:06:00 AM
新智元

大模型何以擅长小样本学习?ICLR 2025这项研究给出详细分析

近年来,大语言模型(LLM)在人工智能领域取得了突破性进展,成为推动自然语言处理技术发展与通用人工智能实现的核心力量。 上下文学习能力(In-Context Learning, ICL)是 LLM 最显著且重要的能力之一,它允许 LLM 在给定包含输入输出示例的提示(prompt)后,直接生成新输入的输出,这一过程仅通过前向传播而无需调整模型权重。 这种能力使得 LLM 能够基于上下文中的示例快速理解并适应新任务,展现出强大的小样本学习和泛化能力。
4/27/2025 9:10:00 AM
机器之心

不要小看线性回归!

在数据领域初学时,大家常听到的一个建议是:不要试图把整个机器学习都学透——因为它实在太庞大且变化太快,根本不现实;而更应该聚焦在少数几个与数据工作日常紧密相关的模型,比如决策树、支持向量机,当然,还有线性回归。 线性回归本身就是一个非常实用的模型,更有意思的是,许多其他机器学习模型其实都是在它的基础上稍作改动而来。 本文的目的,就是想让大家看到这一点。
4/27/2025 4:02:00 AM

AI模型蒸馏:大语言模型的“瘦身革命”​

译者 | 朱先忠审校 | 重楼简介模型蒸馏是一种机器学习新技术,其基本思想是让较小的模型(学生)模仿较大的模型(老师)的行为。 当前,已经存在几种方法可以实现这一技术(将在下文中展开具体介绍),但其目标都是在学生模型中获得比从头开始训练更好的泛化能力。 模型蒸馏示例:学生(较小)模型使用蒸馏损失函数从教师模型中学习,该函数使用“软标签”和预测(使用OpenAI GPT4o生成的图表)一、为什么模型蒸馏很重要?
4/22/2025 8:08:37 AM
朱先忠

围绕多智能体黑箱非凸优化共识难题,华南理工大学团队发表系列研究

多智能体系统分布式共识优化的一系列研究来了! 在智能城市、智能电网、无人系统等前沿应用不断扩展的今天,多智能体系统(Multi-Agent Systems, MAS)作为新一代智能协同的技术基础,正迎来前所未有的发展机遇。 在这些系统中,多个具备计算与通信能力的智能体需要在没有中心协调、通信受限的条件下实现任务协作、资源共享与一致性决策。
4/17/2025 8:55:24 AM
量子位

​全球人工智能市场预测到 2034 年将达到 3680 亿美元

全球人工智能(AI)市场在2024年的规模预计为6382.3亿美元,到2034年将增长至3680.47亿美元,年均增长率(CAGR)为19.20%。 人工智能技术正在快速发展,成为各行业数字化转型的重要组成部分。 从自动化日常任务到智能决策,机器学习、深度学习、计算机视觉和自然语言处理等 AI 技术正在广泛应用于医疗、金融、零售、汽车和制造等领域。
4/15/2025 12:02:18 PM
AI在线

机器学习|从0开发大模型之复现DeepSeek的aha moment

前面一篇文章介绍了《从0开发大模型之DeepSeek的GRPO》,并且实现了一个简单版本的 GRPO 代码,不过从工程领域来看,并没有复现DeepSeek-R1,于是最近申请了48G的显存,结合一些开源的方案复现aha monent,并给出完整的代码和工具链。  1、什么是 aha monent DeepSeek-R1 论文中提到,模型让作者「见证了强化学习的力量和美感」,在DeepSeek-R1-Zero的中间版本,「顿悟时刻」来了:模型学会了以人类的语气进行反思。 aha monent 2、使用什么的基座模型和训练数据 由于显卡只有48G,可以用基座模型Qwen2.5,模型大小:0.5B,1.5B,3B训练数据有很多:(可以直接在huggingface上找到)    a.AI-MO/NuminaMath-TIR:包括72K行的数学问题,解决方案和答案,是从 NuminaMath-CoT 数据集提炼出来的   b.
4/3/2025 3:46:53 PM
周末程序猿

机器学习|从0开发大模型之DeepSeek的GRPO

DeepSeek-R1的发布为国产大模型争光了(太强了),不过 GRPO 算法源自 DeepSeekMath 7B 模型,该模型在 MATH 基准测试中取得了优异成绩,论文发表于2024年2月份:,以下是该论文的摘要原文:复制翻译如下:复制对比数据1、什么是GRPOGRPO 是一种在线学习算法,核心思想是通过组内相对奖励来估计基线,从而避免使用额外的价值函数模型。 通过在训练期间使用受训模型自身生成的数据来迭代改进,GRPO 旨在最大化生成补全的优势,同时确保模型保持接近参考策略,下图是论文中的算法流程图:GRPOGRPO 是 PPO (Proximal Policy Optimization,近端策略优化,是一种强化学习算法,由OpenAI于2017年提出,旨在解决策略梯度方法中的训练不稳定问题) 的变体,主要区别是:GRPO 省略 value function modelGRPO 奖励计算,改成了一个 q 生成多个 r,然后 reward 打分GRPO算法流程:采样一组输出并计算每个输出的奖励对组内奖励进行归一化处理使用归一化后的奖励计算优势函数通过最大化目标函数更新策略模型迭代训练,逐步优化策略模型论文中的伪代码2、奖励设计huggingface 库提供 GRPOTrainer 可以直接使用 GRPO 训练,参数包括定义奖励模型和函数。 2.1 奖励模型复制这里的 reward_funcs 参数可以传入奖励模型。
4/3/2025 3:40:41 PM
周末程序猿

谷歌 AI 发布 TxGemma:全新大规模语言模型助力药物开发

药物开发是一个复杂且成本高昂的过程,伴随着高失败率和漫长的开发周期。 传统的药物发现过程需要从靶点识别到临床试验的各个阶段进行大量的实验验证,这往往消耗大量的时间和资源。 然而,随着计算方法,特别是机器学习和预测建模的兴起,这一过程有望得到优化。
3/28/2025 2:32:00 PM
AI在线

大多数人工智能项目为何失败:应避免的十个错误

令人震惊的事实:70-80%的人工智能项目都失败了! 尽管人工智能 (AI) 及其彻底改变行业的潜力备受关注,但令人惊讶的是,70-80% 的 AI 项目都失败了——这真是一个现实的考验! 为什么这么多充满希望和潜力的人工智能计划最终都以失败告终?
3/28/2025 10:21:50 AM
晓晓

时间序列异常检测:MSET-SPRT组合方法的原理和Python代码实现

在异常检测领域,尤其针对工业机械、核反应堆和网络安全等复杂系统,传统方法往往难以有效处理高维度且相互关联的数据流。 多元状态估计技术(MSET) 与序贯概率比检验(SPRT) 的组合方法在此类场景中展现出显著优势。 MSET-SPRT是一种结合机器学习状态估计与统计假设检验的混合技术框架,通过其高精度和稳健性,被广泛应用于关键任务系统的监控与分析。
3/28/2025 10:10:30 AM
Abish Pius

2025苹果AI学者名单公布,黄子琪、孔令东、北大吉嘉铭、清华顾煜贤等12位年轻华人入选

刚刚,苹果机器学习研究中心(Apple Machine Learning Research)正式公布了 2025 年 AI(人工智能)、ML(机器学习)领域获得博士生奖学金的「苹果学者」名单。 今年共有 21 位年轻学者获得了苹果学者计划的资助,华人占了一半多。 苹果博士奖学金旨在奖励和支持计算机科学与工程领域极具潜力的博士研究生开展研究,每年颁发一次,今年已是第六年。
3/27/2025 1:02:21 PM
机器之心