AI在线 AI在线

理论

纯靠“脑补”图像,大模型推理准确率狂飙80%丨剑桥谷歌新研究

不再依赖语言,仅凭图像就能完成模型推理? 大模型又双叒叕迎来新SOTA! 当你和大模型一起玩超级玛丽时,复杂环境下你会根据画面在脑海里自动规划步骤,但LLMs还需要先转成文字攻略一格格按照指令移动,效率又低、信息也可能会丢失,那难道就没有一个可以跳过“语言中介”的方法吗?
5/21/2025 1:56:37 PM

瘦身不降智!大模型训推效率提升30%,京东大模型开发计算研究登Nature旗下期刊

京东探索研究院关于大模型的最新研究,登上了Nature旗下期刊! 该项研究提出了一种在开放环境场景中训练、更新大模型,并与小模型协同部署的系统与方法。 它通过模型蒸馏、数据治理、训练优化与云边协同四大创新,这个项目将大模型推理效率平均提升30%,训练成本降低70%。
5/21/2025 1:54:20 PM

何恺明团队又发新作: MeanFlow单步图像生成SOTA,提升达50%

这段时间,大神何恺明真是接连不断地发布新研究。 这不,5 月 19 日,他又放出一篇新作! 论文标题:Mean Flows for One-step Generative Modeling 论文地址: MeanFlow 的单步生成建模框架,通过引入平均速度(average velocity)的概念来改进现有的流匹配方法,并在 ImageNet 256×256 数据集上取得了显著优于以往单步扩散 / 流模型的结果,FID 分数达到 3.43,且无需预训练、蒸馏或课程学习。
5/21/2025 1:53:49 PM

策略学习助力LLM推理效率:MIT与谷歌团队提出异步并行生成新范式

金天,麻省理工学院(MIT)计算机科学与人工智能实验室(CSAIL)博士五年级学生,师从 Michael Carbin 和 Jonathan Ragan-Kelley。 他主要研究机器学习与编程系统的结合。 此前曾在 IBM Research 主导实现深度神经网络在 IBM 主机上的推理部署。
5/21/2025 1:52:39 PM

FaceAge登上「柳叶刀」!AI一张照片看穿你的真实年龄

你有没有发现,有些人看起来就是比其他人更老。 脸,不仅仅是我们的门面,还是一个人的「健康快照」,更是一张映射身体状态的「体检报告」。 最近的一项研究发现这其中还藏着更深的秘密,这项研究登上《柳叶刀数字健康》:Mass General Brigham团队用AI训练出一个模型FaceAge,从人脸照片里预测癌症患者的真实「生物年龄」以提供建议辅助治疗。
5/21/2025 1:51:12 PM

AI数据治理破局的战略重构

人工智能正重塑商业世界,那些真正理解当代数据治理变革的企业将占据决定性优势。  旧日的数据治理手册已经无法应对AI时代的全新挑战,我们需要一场根本性的思维转变。 AI正在颠覆传统数据治理模式传统数据管理就像一本厚重的规则手册,将决策封存在层层审批中。
5/21/2025 9:41:23 AM
大数据AI智能圈

大模型全面爆发,所有榜一都是Gemini!谷歌一夜站到了台前

北京时间今天凌晨 1 点,今年的 Google I/O 2025 开发者大会正式开启。 谷歌最近的大模型技术风头正劲,今年的这场「科技春晚」吸引了全球关注的目光。 没有意外,今年的核心主题自然是 AI。
5/21/2025 9:40:11 AM
机器之心

谷歌开发者大会炸场!Agent重磅升级, A2A、SDK大更新

今天凌晨,谷歌召开了“I/O 2025”全球开发者大会,发布了很多产品包括新视频模型、代码模型、文本模型等,尤其是对Agent智能体进行了重磅升级。 例如,全新影视级文生视频模型Flow,创新架构小参数模型Gemma3n,基于AI模型的全新搜索模式等。 下面「AIGC开放社区」为大家介绍谷歌在第一天开发者大会上,与Agent智能体相关的重要内容。
5/21/2025 9:30:02 AM

史上最强AI全家桶!谷歌Gemini 2.5双杀OpenAI,上架250美金天价VIP

谷歌又双叒叕搞事情啦! 昨天,谷歌推出了一款超强的编程智能体Jules,已进入全球测试阶段。 任何拥有Google账户的开发者都可以使用,提供每日5次免费任务。
5/21/2025 9:15:00 AM

陶哲轩“喂饭级”AI教程来了!只用GitHub Copilot证明函数极限问题

视频新人博主陶哲轩又更新了! 这次是“喂饭级”AI教程——手把手演示如何只用GitHub Copilot证明函数极限问题。 (这更新频率确实o( ̄▽ ̄)d)据陶哲轩介绍,他此前主要将GitHub Copilot用于一些“花里胡哨”的代码补全,但实际情况是,如果想让它来证明数学定理,往往需要人类的“正确指挥”。
5/21/2025 9:10:00 AM

解锁 LLM 新高度!一文深度解读 Qwen3 大模型​

1、模型架构Qwen3 系列涵盖 6 种密集型模型和 2 种 MoE 模型,参数规模从 0.6 亿到 2350 亿不等,满足不同下游应用需求。 旗舰模型 Qwen3-235B-A22B 作为 MoE 模型,总参数量达 2350 亿,每 token 激活参数量为 220 亿,在性能与效率间取得平衡。 密集型模型Qwen3 的密集型模型架构与 Qwen2.5 类似,采用 Grouped Query Attention(GQA)和 QK-Norm 改进注意力机制,使用 SwiGLU 作为激活函数,搭配 Rotary Positional Embeddings(RoPE)进行位置编码,采用 RMSNorm 并预归一化。
5/21/2025 9:04:38 AM
Goldma

谷歌年度大招:所有AI模型全升级一遍!Gemini2.5大杯中杯霸榜前二,新版视频/图像模型亮相

原生多模态输入输出、智能体、联网搜索……所有前沿AI能力集成在一起会怎么样? 谷歌最新版Project Astra展示了终极AI助手的能力:以下视频来源于谷歌黑板报实时观察周围环境,搜索资料指导小哥修自行车,零件不够还能自动电话询问周边商店有没有货。 在最新的I/O大会上,谷歌连续放大招,就好像大招不要钱。
5/21/2025 9:04:00 AM

CoT推理大溃败?哈佛华人揭秘:LLM一思考,立刻就「失智」

DeepSeek-R1火了,推理模型火了,思维链(Chain-of-Thought,CoT)火了! 模型很聪明,问题是:它还听你的话吗? 思维链很好,但代价呢?
5/21/2025 9:02:20 AM

UC伯克利5千美元造全开源人形机器人,网友:这作业抄定了

仅需5000美元就能实现人形机器人3D打印? UC伯克利这次又又又整新活了! 注意看,画面中这个正在认真写名字的小家伙,就是来自UC伯克利的最新作品——人形机器人Berkeley Humanoid Lite (BHL)。
5/21/2025 8:53:00 AM

ICRA 2025|通用多机器人长时任务规划框架破解任务分配难题,成功率+105%、效率+36%

2025 年 5 月,美国加州大学河滨分校 (UC Riverside) 与宾夕法尼亚州立大学 (Penn State University) 联合团队在机器人领域顶级会议 ICRA 2025 上发布最新研究成果 LaMMA-P(Generalizable Multi-Agent Long-Horizon Task Allocation and Planning with LM-Driven PDDL Planner)。 LaMMA-P 首次将大型语言模型与 PDDL 规划器深度融合,解决了异构多机器人系统中长时任务的自动分解与分配难题,大幅提升多机器人协同规划的智能水平。 该技术在全新基准数据集上经过大量模拟实验验证,相比现有最先进方法 SMART-LLM,任务成功率提高 105%,执行效率提升 36%,在复杂长程任务规划上取得了突破性进展,为异构多机器人协同完成复杂任务提供了全新解决方案。
5/21/2025 8:52:00 AM

ICML 2025 Spotlight | 多模态大模型暴露短板?EMMA基准深度揭秘多模态推理能力

「三个点电荷 Q、-2Q 和 3Q 等距放置,哪个向量最能描述作用在 Q 电荷上的净电力方向? 」在解这道题时,我们可以通过绘制受力分析草图轻松解决。 但即使是先进的多模态大语言模型,如 GPT-4o,也可能在理解「同性相斥」的基本物理原则时,错误地判断斥力的方向(例如,错误地将 3Q 对 Q 的斥力方向判断为右下方而非正确的左上方)。
5/21/2025 8:47:00 AM

代码、多模态检索全面登顶SOTA!智源BGE向量模型三连击,并全面开放

检索增强技术在代码及多模态场景中的发挥着重要作用,而向量模型是检索增强体系中的重要组成部分。 针对这一需求,近日,智源研究院联合多所高校研发了三款向量模型,包括代码向量模型 BGE-Code-v1,多模态向量模型 BGE-VL-v1.5 以及视觉化文档向量模型 BGE-VL-Screenshot。 这些模型取得了代码及多模态检索的最佳效果,并以较大优势登顶 CoIR、Code-RAG、MMEB、MVRB 等领域内主要测试基准。
5/21/2025 8:35:00 AM

MCP或将成为AI界的HTTP​

译者 | 陈峻审校 | 重楼由Claude 人工智能(AI)模型家族背后的公司--Anthropic推出的通信协议MCP(模型上下文协议,Model Context Protocol)可谓2025年的流行协议。 目前,包括Google和OpenAI在内的几乎所有主要AI公司都接受了MCP,并使之正在成为AI模型的标准化通信方式。 下面,我将向你详细介绍什么是MCP,如何构建一个基础的MCP服务器,及其工作原理。
5/21/2025 8:27:54 AM
陈峻