理论

大模型全面爆发，所有榜一都是Gemini！谷歌一夜站到了台前

北京时间今天凌晨 1 点，今年的 Google I/O 2025 开发者大会正式开启。谷歌最近的大模型技术风头正劲，今年的这场「科技春晚」吸引了全球关注的目光。没有意外，今年的核心主题自然是 AI。

5/21/2025 9:40:11 AM

机器之心

谷歌开发者大会炸场！Agent重磅升级， A2A、SDK大更新

今天凌晨，谷歌召开了“I/O 2025”全球开发者大会，发布了很多产品包括新视频模型、代码模型、文本模型等，尤其是对Agent智能体进行了重磅升级。例如，全新影视级文生视频模型Flow，创新架构小参数模型Gemma3n，基于AI模型的全新搜索模式等。下面「AIGC开放社区」为大家介绍谷歌在第一天开发者大会上，与Agent智能体相关的重要内容。

5/21/2025 9:30:02 AM

史上最强AI全家桶！谷歌Gemini 2.5双杀OpenAI，上架250美金天价VIP

谷歌又双叒叕搞事情啦！昨天，谷歌推出了一款超强的编程智能体Jules，已进入全球测试阶段。任何拥有Google账户的开发者都可以使用，提供每日5次免费任务。

5/21/2025 9:15:00 AM

陶哲轩“喂饭级”AI教程来了！只用GitHub Copilot证明函数极限问题

视频新人博主陶哲轩又更新了！这次是“喂饭级”AI教程——手把手演示如何只用GitHub Copilot证明函数极限问题。（这更新频率确实o(￣▽￣)ｄ）据陶哲轩介绍，他此前主要将GitHub Copilot用于一些“花里胡哨”的代码补全，但实际情况是，如果想让它来证明数学定理，往往需要人类的“正确指挥”。

5/21/2025 9:10:00 AM

解锁 LLM 新高度！一文深度解读 Qwen3 大模型

1、模型架构Qwen3 系列涵盖 6 种密集型模型和 2 种 MoE 模型，参数规模从 0.6 亿到 2350 亿不等，满足不同下游应用需求。旗舰模型 Qwen3-235B-A22B 作为 MoE 模型，总参数量达 2350 亿，每 token 激活参数量为 220 亿，在性能与效率间取得平衡。密集型模型Qwen3 的密集型模型架构与 Qwen2.5 类似，采用 Grouped Query Attention（GQA）和 QK-Norm 改进注意力机制，使用 SwiGLU 作为激活函数，搭配 Rotary Positional Embeddings（RoPE）进行位置编码，采用 RMSNorm 并预归一化。

5/21/2025 9:04:38 AM

Goldma

谷歌年度大招：所有AI模型全升级一遍！Gemini2.5大杯中杯霸榜前二，新版视频/图像模型亮相

原生多模态输入输出、智能体、联网搜索……所有前沿AI能力集成在一起会怎么样？谷歌最新版Project Astra展示了终极AI助手的能力：以下视频来源于谷歌黑板报实时观察周围环境，搜索资料指导小哥修自行车，零件不够还能自动电话询问周边商店有没有货。在最新的I/O大会上，谷歌连续放大招，就好像大招不要钱。

5/21/2025 9:04:00 AM

CoT推理大溃败？哈佛华人揭秘：LLM一思考，立刻就「失智」

DeepSeek-R1火了，推理模型火了，思维链（Chain-of-Thought，CoT）火了！模型很聪明，问题是：它还听你的话吗？思维链很好，但代价呢？

5/21/2025 9:02:20 AM

UC伯克利5千美元造全开源人形机器人，网友：这作业抄定了

仅需5000美元就能实现人形机器人3D打印？ UC伯克利这次又又又整新活了！注意看，画面中这个正在认真写名字的小家伙，就是来自UC伯克利的最新作品——人形机器人Berkeley Humanoid Lite （BHL）。

5/21/2025 8:53:00 AM

ICRA 2025｜通用多机器人长时任务规划框架破解任务分配难题，成功率+105%、效率+36%

2025 年 5 月，美国加州大学河滨分校 (UC Riverside) 与宾夕法尼亚州立大学 (Penn State University) 联合团队在机器人领域顶级会议 ICRA 2025 上发布最新研究成果 LaMMA-P（Generalizable Multi-Agent Long-Horizon Task Allocation and Planning with LM-Driven PDDL Planner）。 LaMMA-P 首次将大型语言模型与 PDDL 规划器深度融合，解决了异构多机器人系统中长时任务的自动分解与分配难题，大幅提升多机器人协同规划的智能水平。该技术在全新基准数据集上经过大量模拟实验验证，相比现有最先进方法 SMART-LLM，任务成功率提高 105%，执行效率提升 36%，在复杂长程任务规划上取得了突破性进展，为异构多机器人协同完成复杂任务提供了全新解决方案。

5/21/2025 8:52:00 AM

ICML 2025 Spotlight | 多模态大模型暴露短板？EMMA基准深度揭秘多模态推理能力

「三个点电荷 Q、-2Q 和 3Q 等距放置，哪个向量最能描述作用在 Q 电荷上的净电力方向？」在解这道题时，我们可以通过绘制受力分析草图轻松解决。但即使是先进的多模态大语言模型，如 GPT-4o，也可能在理解「同性相斥」的基本物理原则时，错误地判断斥力的方向（例如，错误地将 3Q 对 Q 的斥力方向判断为右下方而非正确的左上方）。

5/21/2025 8:47:00 AM

代码、多模态检索全面登顶SOTA！智源BGE向量模型三连击，并全面开放

检索增强技术在代码及多模态场景中的发挥着重要作用，而向量模型是检索增强体系中的重要组成部分。针对这一需求，近日，智源研究院联合多所高校研发了三款向量模型，包括代码向量模型 BGE-Code-v1，多模态向量模型 BGE-VL-v1.5 以及视觉化文档向量模型 BGE-VL-Screenshot。这些模型取得了代码及多模态检索的最佳效果，并以较大优势登顶 CoIR、Code-RAG、MMEB、MVRB 等领域内主要测试基准。

5/21/2025 8:35:00 AM

MCP或将成为AI界的HTTP

译者 | 陈峻审校 | 重楼由Claude 人工智能（AI）模型家族背后的公司--Anthropic推出的通信协议MCP（模型上下文协议，Model Context Protocol）可谓2025年的流行协议。目前，包括Google和OpenAI在内的几乎所有主要AI公司都接受了MCP，并使之正在成为AI模型的标准化通信方式。下面，我将向你详细介绍什么是MCP，如何构建一个基础的MCP服务器，及其工作原理。

5/21/2025 8:27:54 AM

陈峻

继 Vite 之后，ESLint 也接入了 AI！

在之前的文章中有分享过 Vite 是首个接入 AI 能力的构建工具，而现在 ESLint 也紧随其后，使用 AI 来管理代码规范！作为一名前端开发，咱们平时写代码的时候，代码规范这事儿一直挺让人头疼的吧。不过现在好消息来了！

5/21/2025 8:10:00 AM

小4子

骄傲藏不住！谷歌CEO劈柴哥5.20深夜开大：15项重磅炸弹，两大Gemini前沿方向！中国队Xreal成为谷歌XR原型机代表

编辑｜云昭北京时间5月21日凌晨1点，谷歌 CEO Sundar Pichai 准点走进坐落于加州山景城的著名露天圆形剧场 Shoreline Amphitheatre，发表了 Google IO 2025 大会的主题演讲。全程一部定影的时间， 115 分钟，可谓是给 5.20 的深夜奉上了一场别样的谷歌之声。先说整体感受，整体上如大部分媒体所预料的：Andriod 已经退出焦点，AI 可以说是全部。

5/21/2025 7:45:43 AM

云昭

一些银行高管预测，GenAI可能承担高达40%的工作量

根据毕马威四月份发布的一项调查，60%的银行高管将GenAI列为今年的首要投资重点。毕马威最近对银行高管进行的一项调查显示，近一半的受访者预计，到今年年底，GenAI将能够处理其团队21%至40%的日常任务。银行在AI方面的投入巨大：根据毕马威四月份发布的一份报告，60%的银行高管表示，尽管经济存在不确定性，GenAI仍是他们今年的首要投资重点。

5/21/2025 7:05:00 AM

Caitlin

RAG与微调，大语言模型的“大脑升级”，该选哪条路？（小白科普）

最近在做项目时，我发现有些甲方对RAG和模型微调分区的不太清楚，明明大语言模型（LLM）加挂RAG就可以解决的问题，却坚持要微调，但是具体沟通后发现，其实只是不太了解二者的实际用途。其实，Retrieval-Augmented Generation (RAG) 和微调 (Fine-Tuning) 是两种最常用的LLM的“大脑升级”技术，虽然它们都能提升模型的性能，但工作原理和适用场景却大相径庭。今天，我就来深入聊聊这两种技术，弄清楚在不同情况下，到底该选 RAG 还是微调。

5/21/2025 3:00:00 AM

贝塔街的万事屋

AI幻觉引爆网络安全危机专家揭示了三大防御策略

对现实世界的影响“如果一家公司的智能体利用了过时或不准确的数据，AI幻觉可能会虚构出并不存在的漏洞，或错误解读威胁情报，导致不必要的警报或忽视真正的风险。此类错误可能会分散对真正威胁的注意力，创造新的漏洞，并浪费本已紧张的安全运营团队资源。 ”Tanium的AI副总裁HarmanKaur在接受采访时表示。

5/21/2025 1:00:00 AM

Mirko Zorz

几行代码让自家网站秒变ChatGPT！微软Build上神秘开源协议，掀起第四次计算革命！网友：OpenAI的霸主时代被终结？

编辑 | 伊风出品 | 51CTO技术栈（微信号：blog51cto）昨天的微软 Build 2025 开发者大会，用一句话总结就是：信息密度爆表，炸点不断！如果你是开源党的信徒——这次微软几乎把压箱底的宝贝都掏了出来：GitHub Copilot for VS Code 项目正式开源！而且直接采用了 MIT 协议，意味着全球开发者不仅能免费访问源码、研究核心逻辑，还能亲自下场参与改进，Copilot 从此变成了真正意义上的“全民AI助手”。

5/20/2025 6:33:37 PM

伊风

资讯热榜

DeepRare 重磅发布：全球首个可循证智能体诊断系统，直击医学Last Exam难题李沐B站更新了！教你手搓语音大模型，代码全开源还能在线试玩 AI时代设计师如何突围？D20峰会揭示未来设计师生存法则考试提分新工具：网页版 ChatGPT 测试“学习和掌握”功能，AI 助你成学霸我测试了100+案例，教你零基础复刻外网刷屏的 AI 视频（附提示词模板）终结Coding？ShellAgent三句话造出马斯克同款「AI女友」！一盘大棋！OpenAI「截胡」IMO金牌，奥特曼为GPT-5献上「核弹级」预热阿里云通义千问 Qwen3-Coder 宣布开源：480B 参数、原生支持 256K 上下文，可与 Claude Sonnet4 媲美

标签云

人工智能 AI OpenAI AIGC 模型 ChatGPT DeepSeek AI绘画谷歌机器人数据大模型 Midjourney 开源智能用户 Meta 微软 GPT 学习技术图像 Gemini AI创作马斯克论文英伟达 Anthropic 智能体代码算法 Stable Diffusion 训练芯片开发者蛋白质腾讯生成式苹果 LLM 神经网络 AI新词 Claude 3D 研究生成机器学习 AI for Science xAI 计算人形机器人 Agent Sora AI视频 GPU 百度 AI设计华为搜索大语言模型工具场景字节跳动 RAG 大型语言模型具身智能预测深度学习伟达视觉 Transformer 神器推荐 AGI 亚马逊视频生成 Copilot DeepMind 模态架构 LLaMA

理论