AI在线 AI在线

AI

爆火论文颠覆RL认知!「错误奖励」让LLM推理暴涨24.6%,学界惊了

今早的一篇爆火论文,彻底颠覆了人们对「强化学习」的传统认知。 仅用随机奖励,甚至是错误答案,也能让AI在数学推理中性能暴涨! 来自华盛顿大学、AI2、UC伯克利研究团队证实,「伪奖励」(Spurious Rewards)也能带来LLM推理能力提升的惊喜。
5/29/2025 9:14:17 AM

阿里通义发布并行计算新策略:1.6B等效4.4B,内存消耗骤降95%

既能提升模型能力,又不显著增加内存和时间成本,LLM第三种Scaling Law被提出了。 对于1.6B模型,能实现性能接近4.4B模型,内存占用仅为后者的1/22,延迟增加量为1/6。 并且可直接应用于现有模型(如Qwen-2.5),无需从头训练。
5/29/2025 9:14:00 AM

19岁少年用计算机炼出「神药」,斩获全球大奖!大厂看了都沉默

「少年药神」来了! 来自斯洛伐克的19岁少年Adam Kovalčík,凭借计算机模拟设计的新分子,一举夺得全球顶级大奖! 这些分子有望像广谱抗病毒药物Galidesivir一样有效阻止病毒复制。
5/29/2025 9:10:18 AM

一个省略号提示+强化学习搞定大模型“过度思考”,中科院自动化所新方法:从强制推理到自主选择

在日益强调“思维能力”的大语言模型时代,如何让模型在“难”的问题上展开推理,而不是无差别地“想个不停”,成为当前智能推理研究的重要课题。 中国科学院自动化研究所联合鹏城实验室提出了一种高效的推理策略,赋予推理大模型根据题目难度自主切换思考模式的能力:通过一个小小的省略号作为提示词 多阶段强化学习,引导大模型自主决定是否深度思考、思考多少。 研究背景:大模型“想太多”,是优点还是负担?
5/29/2025 9:08:00 AM

开源AI开发生态大洗牌:低代码平台逆袭,传统LLM框架日渐式微

当前的大模型开发生态,被一份报告、完整全景图谱讲清楚了。 就在第十届527蚂蚁技术日上,蚂蚁通过Coding范式、数据、模型部署等角度,对现有开源生态进行了全面完整的大剖析,从数据的视角揭示了大模型开源生态的演进规律,如果你是大模型开发者或者潜在的开发者,几乎研究好这份报告可能就够了。 但这还不够,在报告出炉之前的周末,蚂蚁还发布了2025大模型开源生态全景图,涵盖19个技术领域、135个项目,进一步给出了大模型开发生态的参考系。
5/29/2025 8:58:08 AM

快速理解热门 LLM 大语言模型

作者 | masonpy本文尽量用最简单的方式, 帮读者理解 LLM,Transformer, Prompt, Function calling, MCP, Agent, A2A 等这些基本概念。 表述时不追求绝对准确,尽量通俗易懂,部分内容有个人理解的成份,内容难免疏漏, 欢迎指正。 注意:本文需要你有基本的代码阅读能力,当然非开发阅读也不会很困难。
5/29/2025 8:30:00 AM
腾讯技术工程

单人公司能否纯凭AI智能体发育成独角兽?有戏!

译者 | 核子可乐审校 | 重楼如果你正在寻找一种替代打工生活的选择,那么自营职业——也被称为“个体创业”(solopreneuring)——可能是个好思路。 你可以凭借自己的软件开发、设计或商业技能作为独立承包商谋求发展。 或者,大家甚至可以独立创办一家公司以获得更大的回报。
5/29/2025 8:13:35 AM
核子可乐

马斯克新推出的 AI 编程助手速度是高级工程师的 10 倍,整个技术团队都面临挑战

从特斯拉的自动驾驶技术,到 Neuralink 的脑机接口,马斯克旗下的 AI 项目一直在推动技术边界。 最新发布的 AI 编程助手——xAI CodeGen,声称其开发速度是资深开发者的十倍以上。 图片作为一款先进的 AI 工具,xAI CodeGen 是否真的能够理解复杂逻辑、准确调试,并生成结构清晰、适合生产环境的代码,成为业界关注的焦点。
5/29/2025 8:10:51 AM
前端小智

AI 搜索“毒化”现实:模型崩溃隐忧,从神器到“垃圾输出”

报道称以 Perplexity 为代表的 AI 搜索工具虽然表现要优于谷歌等传统搜索引擎,但在不断地版本更迭后,搜索结果质量不升反降,AI 模型崩溃(model collapse)现象正在显现。
5/29/2025 6:26:50 AM
故渊

告别手写代码!十款开源 AI 工具,截图秒变可运行代码(附 GitHub 地址)

今年一直在学习和研究AI,也做了很多高价值AI开源项目的总结,今天就和大家分享11款通过截图(图片)生成代码的开源项目和工具,帮助大家提高编码效率。 Screenshot to Code图片它能够将设计图中的截图自动转化为代码片段,主要用于网页和应用界面的开发。 支持的技术栈包括 HTML Tailwind、React Tailwind、Vue Tailwind、Bootstrap、Ionic Tailwind、SVG 等。
5/29/2025 5:00:10 AM
趣谈AI

第二次Sora时刻来了!全球首款实时摄像头诞生,真人感拉满颠覆全行业

就在今天,AI视频领域,再次迎来了高能时刻! 硅谷新锐公司AKOOL正式发布的全球首款实时摄像头——AKOOL Live Camera,一举点燃了全行业的热情! 它不仅能秒变虚拟数字人、实时翻译多语言、无缝替换人脸,还能动态生成影视级画质的视频画面,将四大功能集于一身。
5/29/2025 4:15:00 AM
新智元

混合推理模型(LHRM):平衡效率与推理能力的新范式

大家好,我是肆〇柒。 今天,我们来探讨一下大型混合推理模型(LHRM)。 在人工智能领域,大型推理模型(LRM)能够自如的完成比如编程、数学和常识推理等任务。
5/29/2025 3:00:00 AM
肆零柒

如何通过 OpenMemory MCP 增强客户端的上下文感知能力

人工智能(AI)技术发展迅速,大型语言模型(LLMs)极大地简化了许多任务。 然而,它们面临一个基本限制:会话之间无法保留记忆。 图片如果能够拥有一个本地的、便携的 LLM “记忆层”,完全掌控您的数据,会怎样呢?
5/29/2025 2:11:00 AM
AI研究生

基于四大AI交互协议的AI测试平台架构

在IT互联网技术领域,一个APP或系统背后的技术架构,有web层、server层、中间件、数据库和底层的操作系统,看起来很复杂。 后来大家逐渐形成了较为统一的标准,即通过API接口将不同层级之间串联起来,最终才能形成一个能提供完善服务的APP应用。 AI领域目前也出现了类似的统一标准或者机制,来实现大模型、智能体等AI工具之间的协作通信。
5/29/2025 1:45:00 AM
写文章的老张

一文读懂: AI 智能体的架构原则、三高架构、 存储架构的核心方案

一、为啥 AI 架构设计这么关键? 如今,AI 应用那可是雨后春笋般地冒出来。 ‘从 ChatGPT  、到AI智能体应用,到每天服务上千万人的智能客服,再到处理亿级数据的推荐系统,要想让这些 AI 玩意儿在实际场景里落地生根,高可用、高性能、灵活扩展的系统架构是关键。
5/29/2025 1:10:00 AM
尼恩架构团队

首个面向柔性衣物灵巧操作的仿真平台来了,北大、伯克利联合发布

本论文共同第一作者为王昱然、吴睿海、陈越,导师为北京大学董豪老师。 课题组致力于统一的物体表征操作研究,以实现具有可解释性和泛化能力的物体操作策略。 在机器人操作领域,柔性物体,尤其是衣物的操控始终是一个值得关注的难题。
5/28/2025 6:43:17 PM

Meta闪电分拆AI帝国!Llama团队一劈为二:一边狂卷AGI,一边死磕OpenAI

2025 年 5 月,据 Axios 报道,Meta 正式将其 AI 部门拆分为两个独立方向:面向消费者的AI产品团队,以及追求通用人工智能(AGI)的“AGI Foundations”基础组。 过去几年,Meta在AI领域的策略始终被认为偏“研究导向”:大模型Llama的发布频率、论文产出数量、开源社区活跃度,都表现出一种“与学界赛跑”的姿态。 但与此同时,用户端产品的AI体验却始终模糊——Llama虽强,却“藏”在模型库里,普通用户几乎无感。
5/28/2025 6:41:37 PM

刚刚2岁的Llama,「爸妈」都跑了!小扎手拆Meta AI,LeCun保持独立

小扎最近着实有点烦。 一是谷歌、OpenAI、Anthropic等竞争对手不断「上压力」,谷歌I/O大会、Claude 4出炉,而OpenAI的奥特曼牵手了Apple乔布斯时代的乔纳森做硬件;二是刚刚2岁的Llama(2023年开源),最初署名的14名作者走的走,创业的创业,选择留下的只有3人;三是Llama 4不仅翻车,Behemoth还面临跳票,即使是Scout、Maverick被开发者调侃为Llama 3.5;四是作为「技术老大」的Yann LeCun天天可劲地说LLM要完蛋,与当下LLM发展背道而驰。 终于,小扎「痛定思痛」决定重组Meta的AI团队!
5/28/2025 6:41:30 PM