理论
纯靠“脑补”图像,大模型推理准确率狂飙80%丨剑桥谷歌新研究
不再依赖语言,仅凭图像就能完成模型推理? 大模型又双叒叕迎来新SOTA! 当你和大模型一起玩超级玛丽时,复杂环境下你会根据画面在脑海里自动规划步骤,但LLMs还需要先转成文字攻略一格格按照指令移动,效率又低、信息也可能会丢失,那难道就没有一个可以跳过“语言中介”的方法吗?
5/21/2025 1:56:37 PM
瘦身不降智!大模型训推效率提升30%,京东大模型开发计算研究登Nature旗下期刊
京东探索研究院关于大模型的最新研究,登上了Nature旗下期刊! 该项研究提出了一种在开放环境场景中训练、更新大模型,并与小模型协同部署的系统与方法。 它通过模型蒸馏、数据治理、训练优化与云边协同四大创新,这个项目将大模型推理效率平均提升30%,训练成本降低70%。
5/21/2025 1:54:20 PM
何恺明团队又发新作: MeanFlow单步图像生成SOTA,提升达50%
这段时间,大神何恺明真是接连不断地发布新研究。 这不,5 月 19 日,他又放出一篇新作! 论文标题:Mean Flows for One-step Generative Modeling 论文地址: MeanFlow 的单步生成建模框架,通过引入平均速度(average velocity)的概念来改进现有的流匹配方法,并在 ImageNet 256×256 数据集上取得了显著优于以往单步扩散 / 流模型的结果,FID 分数达到 3.43,且无需预训练、蒸馏或课程学习。
5/21/2025 1:53:49 PM
策略学习助力LLM推理效率:MIT与谷歌团队提出异步并行生成新范式
金天,麻省理工学院(MIT)计算机科学与人工智能实验室(CSAIL)博士五年级学生,师从 Michael Carbin 和 Jonathan Ragan-Kelley。 他主要研究机器学习与编程系统的结合。 此前曾在 IBM Research 主导实现深度神经网络在 IBM 主机上的推理部署。
5/21/2025 1:52:39 PM
FaceAge登上「柳叶刀」!AI一张照片看穿你的真实年龄
你有没有发现,有些人看起来就是比其他人更老。 脸,不仅仅是我们的门面,还是一个人的「健康快照」,更是一张映射身体状态的「体检报告」。 最近的一项研究发现这其中还藏着更深的秘密,这项研究登上《柳叶刀数字健康》:Mass General Brigham团队用AI训练出一个模型FaceAge,从人脸照片里预测癌症患者的真实「生物年龄」以提供建议辅助治疗。
5/21/2025 1:51:12 PM
AI数据治理破局的战略重构
人工智能正重塑商业世界,那些真正理解当代数据治理变革的企业将占据决定性优势。 旧日的数据治理手册已经无法应对AI时代的全新挑战,我们需要一场根本性的思维转变。 AI正在颠覆传统数据治理模式传统数据管理就像一本厚重的规则手册,将决策封存在层层审批中。
5/21/2025 9:41:23 AM
大数据AI智能圈
大模型全面爆发,所有榜一都是Gemini!谷歌一夜站到了台前
北京时间今天凌晨 1 点,今年的 Google I/O 2025 开发者大会正式开启。 谷歌最近的大模型技术风头正劲,今年的这场「科技春晚」吸引了全球关注的目光。 没有意外,今年的核心主题自然是 AI。
5/21/2025 9:40:11 AM
机器之心
谷歌开发者大会炸场!Agent重磅升级, A2A、SDK大更新
今天凌晨,谷歌召开了“I/O 2025”全球开发者大会,发布了很多产品包括新视频模型、代码模型、文本模型等,尤其是对Agent智能体进行了重磅升级。 例如,全新影视级文生视频模型Flow,创新架构小参数模型Gemma3n,基于AI模型的全新搜索模式等。 下面「AIGC开放社区」为大家介绍谷歌在第一天开发者大会上,与Agent智能体相关的重要内容。
5/21/2025 9:30:02 AM
史上最强AI全家桶!谷歌Gemini 2.5双杀OpenAI,上架250美金天价VIP
谷歌又双叒叕搞事情啦! 昨天,谷歌推出了一款超强的编程智能体Jules,已进入全球测试阶段。 任何拥有Google账户的开发者都可以使用,提供每日5次免费任务。
5/21/2025 9:15:00 AM
陶哲轩“喂饭级”AI教程来了!只用GitHub Copilot证明函数极限问题
视频新人博主陶哲轩又更新了! 这次是“喂饭级”AI教程——手把手演示如何只用GitHub Copilot证明函数极限问题。 (这更新频率确实o( ̄▽ ̄)d)据陶哲轩介绍,他此前主要将GitHub Copilot用于一些“花里胡哨”的代码补全,但实际情况是,如果想让它来证明数学定理,往往需要人类的“正确指挥”。
5/21/2025 9:10:00 AM
解锁 LLM 新高度!一文深度解读 Qwen3 大模型
1、模型架构Qwen3 系列涵盖 6 种密集型模型和 2 种 MoE 模型,参数规模从 0.6 亿到 2350 亿不等,满足不同下游应用需求。 旗舰模型 Qwen3-235B-A22B 作为 MoE 模型,总参数量达 2350 亿,每 token 激活参数量为 220 亿,在性能与效率间取得平衡。 密集型模型Qwen3 的密集型模型架构与 Qwen2.5 类似,采用 Grouped Query Attention(GQA)和 QK-Norm 改进注意力机制,使用 SwiGLU 作为激活函数,搭配 Rotary Positional Embeddings(RoPE)进行位置编码,采用 RMSNorm 并预归一化。
5/21/2025 9:04:38 AM
Goldma
谷歌年度大招:所有AI模型全升级一遍!Gemini2.5大杯中杯霸榜前二,新版视频/图像模型亮相
原生多模态输入输出、智能体、联网搜索……所有前沿AI能力集成在一起会怎么样? 谷歌最新版Project Astra展示了终极AI助手的能力:以下视频来源于谷歌黑板报实时观察周围环境,搜索资料指导小哥修自行车,零件不够还能自动电话询问周边商店有没有货。 在最新的I/O大会上,谷歌连续放大招,就好像大招不要钱。
5/21/2025 9:04:00 AM
CoT推理大溃败?哈佛华人揭秘:LLM一思考,立刻就「失智」
DeepSeek-R1火了,推理模型火了,思维链(Chain-of-Thought,CoT)火了! 模型很聪明,问题是:它还听你的话吗? 思维链很好,但代价呢?
5/21/2025 9:02:20 AM
UC伯克利5千美元造全开源人形机器人,网友:这作业抄定了
仅需5000美元就能实现人形机器人3D打印? UC伯克利这次又又又整新活了! 注意看,画面中这个正在认真写名字的小家伙,就是来自UC伯克利的最新作品——人形机器人Berkeley Humanoid Lite (BHL)。
5/21/2025 8:53:00 AM
ICRA 2025|通用多机器人长时任务规划框架破解任务分配难题,成功率+105%、效率+36%
2025 年 5 月,美国加州大学河滨分校 (UC Riverside) 与宾夕法尼亚州立大学 (Penn State University) 联合团队在机器人领域顶级会议 ICRA 2025 上发布最新研究成果 LaMMA-P(Generalizable Multi-Agent Long-Horizon Task Allocation and Planning with LM-Driven PDDL Planner)。 LaMMA-P 首次将大型语言模型与 PDDL 规划器深度融合,解决了异构多机器人系统中长时任务的自动分解与分配难题,大幅提升多机器人协同规划的智能水平。 该技术在全新基准数据集上经过大量模拟实验验证,相比现有最先进方法 SMART-LLM,任务成功率提高 105%,执行效率提升 36%,在复杂长程任务规划上取得了突破性进展,为异构多机器人协同完成复杂任务提供了全新解决方案。
5/21/2025 8:52:00 AM
ICML 2025 Spotlight | 多模态大模型暴露短板?EMMA基准深度揭秘多模态推理能力
「三个点电荷 Q、-2Q 和 3Q 等距放置,哪个向量最能描述作用在 Q 电荷上的净电力方向? 」在解这道题时,我们可以通过绘制受力分析草图轻松解决。 但即使是先进的多模态大语言模型,如 GPT-4o,也可能在理解「同性相斥」的基本物理原则时,错误地判断斥力的方向(例如,错误地将 3Q 对 Q 的斥力方向判断为右下方而非正确的左上方)。
5/21/2025 8:47:00 AM
代码、多模态检索全面登顶SOTA!智源BGE向量模型三连击,并全面开放
检索增强技术在代码及多模态场景中的发挥着重要作用,而向量模型是检索增强体系中的重要组成部分。 针对这一需求,近日,智源研究院联合多所高校研发了三款向量模型,包括代码向量模型 BGE-Code-v1,多模态向量模型 BGE-VL-v1.5 以及视觉化文档向量模型 BGE-VL-Screenshot。 这些模型取得了代码及多模态检索的最佳效果,并以较大优势登顶 CoIR、Code-RAG、MMEB、MVRB 等领域内主要测试基准。
5/21/2025 8:35:00 AM
MCP或将成为AI界的HTTP
译者 | 陈峻审校 | 重楼由Claude 人工智能(AI)模型家族背后的公司--Anthropic推出的通信协议MCP(模型上下文协议,Model Context Protocol)可谓2025年的流行协议。 目前,包括Google和OpenAI在内的几乎所有主要AI公司都接受了MCP,并使之正在成为AI模型的标准化通信方式。 下面,我将向你详细介绍什么是MCP,如何构建一个基础的MCP服务器,及其工作原理。
5/21/2025 8:27:54 AM
陈峻
资讯热榜
标签云
AI
人工智能
OpenAI
AIGC
模型
ChatGPT
DeepSeek
谷歌
AI绘画
机器人
数据
大模型
Midjourney
开源
智能
Meta
用户
微软
GPT
学习
技术
AI新词
图像
Gemini
智能体
马斯克
AI创作
Anthropic
英伟达
论文
训练
代码
算法
LLM
Stable Diffusion
芯片
腾讯
苹果
蛋白质
Claude
开发者
AI for Science
Agent
生成式
神经网络
机器学习
3D
xAI
研究
人形机器人
生成
AI视频
百度
工具
计算
Sora
GPU
华为
大语言模型
RAG
具身智能
AI设计
字节跳动
搜索
大型语言模型
场景
AGI
深度学习
视频生成
预测
视觉
伟达
架构
Transformer
编程
神器推荐
DeepMind
亚马逊
特斯拉
AI模型