AI在线 AI在线

理论

让GPU不再摸鱼!清华蚂蚁联合开源首个全异步RL,一夜击穿14B SOTA

还记得今年初DeepSeek‑R1系列把纯强化学习(RL)训练开源,点燃社区对于RL的热情吗? 不久后,来自清华蚂蚁联合开源项目AReaL(v0.1)也通过在DeepSeek-R1-Distill-Qwen-1.5B上进行RL训练,观察到模型性能的持续提升。 AReaL(v0.1)在40小时内,使用RL训练的一个1.5B参数模型,在数学推理方面就超越了o1-Preview版本。
6/6/2025 9:10:00 AM

真实联网搜索Agent,7B媲美满血R1,华为盘古DeepDiver给出开域信息获取新解法

大型语言模型 (LLM) 的发展日新月异,但实时「内化」与时俱进的知识仍然是一项挑战。 如何让模型在面对复杂的知识密集型问题时,能够自主决策获取外部知识的策略? 华为诺亚方舟实验室研究团队提出了 Pangu DeepDiver 模型,通过 Search Intensity Scaling 实现了 LLM 搜索引擎自主交互的全新范式,使得 Pangu 7B 模型在开域信息获取能力上可以接近百倍参数的 DeepSeek-R1,并优于 DeepResearcher、R1-Searcher 等业界同期工作!
6/6/2025 9:07:00 AM

推理时间减少70%!前馈3DGS「压缩神器」来了,浙大Monash联合出品

在增强现实(AR)和虚拟现实(VR)等前沿应用领域,新视角合成(Novel View Synthesis,NVS)正扮演着越来越关键的角色。 3D高斯泼溅(3D Gaussian Splatting,3DGS)凭借其革命性的实时渲染能力和卓越的视觉质量,迅速成为NVS领域备受关注的技术方案。 现有的前馈3D高斯泼溅(Feed-Forward 3D Gaussian Splatting,3DGS)模型,虽然在实时渲染和高效生成3D场景方面取得了显著进展,但仍存在一些关键缺陷。
6/6/2025 9:07:00 AM

AI摧毁就业?DeepMind CEO:这是一场比互联网更猛的职业洗牌

AI需要重大突破才能实现AGI吗? 是的,但已经在路上! 它会摧毁现有就业市场吗?
6/6/2025 9:04:00 AM

DeepMind揭惊人答案:智能体就是世界模型!跟Ilya 2年前预言竟不谋而合

就在刚刚,DeepMind科学家Jon Richens在ICML 2025上发表的论文,一石激起千层浪。 实现人类水平的智能体(即AGI),是否需要世界模型,还是存在无模型的捷径? 他们从第一性原理出发,揭示了一个令人惊讶的答案——智能体就是世界模型!
6/6/2025 9:02:00 AM

大模型结构化推理优势难复制到垂直领域!最新法律AI评估标准来了,抱抱脸评测集趋势第一

大模型推理,无疑是当下最受热议的科技话题之一。 但在数学和物理等STEM之外,当LLM落到更多实际应用领域之中,大模型的推理能力又有多大的潜能和局限? 比如,如何评估大模型的推理能力在法律领域的应用,就在当前备受关注。
6/6/2025 9:00:00 AM

LLM 协作革命:Group Think 如何重塑推理边界

大家好,我是肆〇柒。 今天和大家聊聊 Group Think。 顾名思义,它通过让单个 LLM 模拟多个并行推理智能体,并以 token 级别的细粒度协作,提出了推理协作的新范式。
6/6/2025 8:57:42 AM
肆零柒

RL后训练步入超节点时代!华为黑科技榨干算力,一张卡干俩活

在大模型竞赛白热化的当下,「强化学习后训练」已成为突破LLM性能天花板的核心路径。 爆火出圈的OpenAI o1、DeepSeek-R1等模型,背后都是依靠RL后训练点石成金。 相较于预训练阶段的「广撒网」式知识获取,RL 后训练通过驱动模型与外部环境进行动态交互,直接塑造了LLM在复杂任务中的推理效能。
6/6/2025 8:55:00 AM

上海AI实验室造出首个「通才」机器人大脑:看懂世界+空间推理+精准操控全拿下

机器人的新大脑框架来了! 上海人工智能实验室联合多家单位提出了一种全新的通用具身智能大脑框架:Visual Embodied Brain,简称VeBrain。 该模型通过同时集成视觉感知、空间推理和机器人控制能力,可实现多模态大模型(MLLM)对物理实体的直接操控,使机器人能像人类一样“看到-思考-行动”。
6/6/2025 8:52:00 AM

RAG、向量数据库和LLM搜索:人工智能驱动商业智能的未来

译者 | 李睿审校 | 重楼本文对RAG、向量数据库和LLM搜索如何塑造人工智能驱动的商业智能未来进行探讨。 RAG通过集成知识检索提升LLM性能,解决其无法及时纳入最新或专有信息的问题,尤其在客户服务领域影响显著。 向量数据库则支持快速相似性搜索,理解查询语义。
6/6/2025 8:39:15 AM
李睿

如何重构复杂的代码库 – 面向开发人员的实用指南​

译者 | 刘涛审校 | 重楼目录重构概述重构前期准备争取管理层支持通过自动化测试确保安全保障识别高风险区域设定明确的重构目标复杂代码库的重构技巧识别并隔离问题区域渐进式重构与大爆炸式重构拆分单体代码确保向后兼容性处理依赖关系与紧密耦合测试策略(自信地安全重构)在不降低性能的前提下进行重构使用人工智能工具自动化代码审查总结一、重构概述重构是一种对代码开展持续优化的重要手段,其核心目标在于降低代码的复杂程度,削减技术债务。 通过不断完善代码库来解决项目推进过程中出现的代码结构恶化问题,它能将杂乱无章或低效的代码转变为结构良好、便于维护的解决方案。 二、重构前期准备在着手进行代码重构之前,搭建一个坚实稳固的基础有着举足轻重的意义。
6/6/2025 8:36:21 AM
刘涛

Cursor 1.0 终于来了

自2023年首次发布以来,Cursor终于迎来了它的第一个重大版本更新——Cursor 1.0正式发布了! 这次更新令人非常兴奋,因为Cursor已经成为我一年多来最常用的AI编程工具。 OpenAI曾多次尝试收购这款应用,但交易最终未能达成。
6/6/2025 8:13:47 AM
前端小智

如何利用AI改造智能电网

2023年,能源和公用事业领域的AI全球市场规模达到了105.6亿美元,预计到2030年将激增至457.8亿美元,这标志着AI将在重塑未来电力系统方面发挥关键作用。 与此同时,非洲城市正处于能源转型的关键节点,整个非洲大陆仍有近6亿人无法用电,若不首先对基础电网设施进行现代化改造,建设包容性且可持续的智慧城市的目标将难以实现。 随着对老旧资产的升级改造以及对服务不足社区的电力接入扩展工作的加强,AI正迅速成为这一转型的催化剂。
6/6/2025 7:02:00 AM
Satyajit

OpenAI付费企业用户猛增至300万 直击微软谷歌AI腹地

OpenAI周三宣布,自2月份以来,其企业用户群激增了50%,付费企业客户已达300万,与此同时,这家AI公司推出了一系列全新的工作场所工具,旨在与微软的企业级AI产品展开直接竞争。 这一里程碑是在推出几项新的面向企业的功能时公布的,凸显了OpenAI在可靠、安全的AI工具能够收取高价的企业市场中的积极扩张,该公司推出了新的“连接器”,这些连接器将ChatGPT与流行的商业应用程序集成在一起,还推出了一项名为“记录模式”(Record Mode)的会议转录功能,并对其深度研究(Deep Research)和Codex编码工具进行了增强。 “ChatGPT正在帮助企业转型,帮助员工更高效、更战略性地工作,”OpenAI的一位发言人告诉记者,“在过去的几个月里,我们一直在不断将ChatGPT发展成为一个对工作越来越有影响力的平台,提供了连接器、与ChatGPT集成的记录模式、Codex、图像生成、深度研究等商业产品。
6/6/2025 7:00:00 AM
Michael

LLM 的 SFT 与 RL:差异几何?

在大型语言模型(LLM)的训练领域,监督微调(SFT)和强化学习(RL)是两种备受瞩目的训练策略。 尽管它们各自有着独特的机制和侧重点,但笔者经过深入研究和实践观察发现,二者之间的差别并非如表面上那般显著,以下是具体的分析与对比。 一、核心原理的相近性SFT 的本质 :SFT 主要是利用标注好的数据集对预训练的 LLM 进行进一步训练,通过最小化模型输出与标注答案之间的差异,来调整模型的参数。
6/6/2025 4:10:00 AM
小智

结合LangGraph、DeepSeek-R1和Qdrant 的混合 RAG 技术实践

一、引言:混合RAG技术的发展与挑战在人工智能领域,检索增强生成(RAG)技术正成为构建智能问答系统的核心方案。 传统RAG通过向量数据库存储文档嵌入并检索相关内容,结合大语言模型(LLM)生成回答,有效缓解了LLM的“幻觉”问题。 然而,单一的稠密向量检索(如基于Transformer的嵌入模型)在处理关键词匹配和多义词歧义时存在局限性,而稀疏向量检索(如BM25)虽擅长精确关键词匹配,却缺乏语义理解能力。
6/6/2025 3:11:00 AM
大模型之路

三步搭建MCP服务器,让AI工具直接调用n8n工作流

今天我们将视角转向服务端实现。 n8n 自 1.88.0 版本起,引入了一个革命性特性——MCP Server Trigger 节点。 这一创新让开发者能够将复杂的工作流包装成标准化的 MCP 服务,通过 SSE(Server-Sent Events)协议对外发布。
6/6/2025 2:11:00 AM
林月半子聊AI

Qwen和DeepSeek为何都选YaRN?

这篇文章,我们还是从面试官的视角出发,一起来分析一下,如果你在面试现场被问到这个题目,应该如何回答? 1.面试官心理分析首先还是分析一下面试官的心理,面试官问这个问题,主要是想考察三点:第一,你知不知道长度外推这个概念? 很多同学可能听都没听过这个概念,那这个问题当然也就无从答起了。
6/6/2025 1:26:00 AM
丁师兄