理论

Google I/O 2025：开发者必须了解的下一代 AI 革命

Google I/O 2025 大会结束了，这场发布会不仅是一场简单的技术更新，而更像是人工智能领域的一次全面进化。从颠覆性的 Gemini 2.5 模型，到真正意义上的 AI 智能助手 Project Astra，再到文本生成视频工具 Veo 3，开发者工具与生态迎来了全方位的变革。以下是最值得开发者关注的技术革新。

5/26/2025 12:00:00 AM 前端小智

初级程序员的复仇！硅谷科技圈技术大佬神作：之前说的vibe coding都是放屁！代理军团来了！2025年底手动编码就会消失！

编辑｜云昭出品 | 51CTO技术栈（微信号：blog51cto）前天 Claude4 刷屏了，但不知道大家有没有注意到，Anthropic 的老大，Dario，时不时就会在keynote中就会引用一篇文章：《Revenge of the Junior Developer》，很有对抗感的一个名字，初期程序员的复仇！本着刨根问底的精神，小编自然不会放过这篇能影响世界顶尖AI大佬的文章。《Revenge of the Junior Developer》是Sourcegraph大佬、硅谷科技圈技术大佬、知名博主 Steve Yegge 在 2025 年 3 月发表的一篇深具洞察力的、有关 AI 编程进程的文章。

5/25/2025 10:25:49 AM 云昭

AI是否知道什么时候该"思考"？Thinkless教会大模型何时该动脑筋

你是否曾经问过简单问题，却得到AI长篇大论的回答？或者问复杂问题时，AI却草草了事？今天我要和大家分享一项突破性研究，它让AI学会了"什么时候该思考，什么时候该直接回答"。

5/23/2025 6:47:33 PM 无影寺

AI实战派：解密DeepSeek企业级项目！AI不是炫技，而是回归需求的必然答案

嘉宾 | 陈亮、张云波主持人 | 薛彦泽撰稿 | 李美涵在AI创业的浪潮里，最迷人的地方莫过于人人都知道这里是风口，却仍然能够各自找到属于自己的机会点。在众多试图乘上AI风口的创业者中，亨宝科技的CEO张云波和AI创智坊的主理人陈亮无疑是特别的存在。张云波早年投身于鸿蒙生态，今年年初就敏锐捕捉到DeepSeek大模型兴起的契机，迅速将注意力投向AI领域的应用开发。

5/23/2025 6:28:04 PM 李美涵

曝Claude 4胆儿肥变“勇”了，竟敢举报用户！但Cursor、Manus反而更爱用它了！

编辑 | 云昭近期大模型竞赛又开始热闹起来了。上周谷歌刚放出来 Gemini 2.5 Pro 在榜单上大杀四方，今天 Anthropic 就深夜放出新模型来屠榜了。关于 Claude4，一大早不少媒体都进行了报道，这里不再浪费篇幅，就像Anthropic 的 CEO Dario 在开场时就对台下观众所说的，自己不喜欢炒作。

5/23/2025 6:19:45 PM 云昭

英伟达再破世界纪录，每秒1000 token！刚刚，全球最快Llama 4诞生

你以为，AI推理的速度已经够快了？不，英伟达还能再次颠覆你的想象——就在刚刚，他们用Blackwell创下了AI推理的新纪录。仅仅采用单节点（8颗Blackwell GPU）的DGX B200服务器，英伟达就实现了Llama 4 Maverick模型每秒单用户生成1000个token（TPS/user）的惊人成绩！

5/23/2025 1:50:39 PM

耶鲁大学联合Adobe提出SynthLight：智能重塑人像照明，打造完美光影！

耶鲁大学和Adobe提出一种用于人像重新照明的扩散模型SynthLight，该方法将图像重新照明视为重新渲染问题，其中像素会根据环境照明条件的变化而变化。在真实肖像照片上可以产生逼真的照明效果，包括颈部的明显投射阴影和皮肤上的自然镜面高光。相关链接论文：：是一种用于人像重新照明的扩散模型。

5/23/2025 11:07:54 AM

Windsurf 发 SWE-1：以数据+智能飞轮驱动软件工程 AI 进化

大家好，我是肆〇柒。软件开发行业正经历一场前所未有的AI变革。 AI 辅助编程从曾经的新兴尝试，迅速成长为开发领域不可或缺的关键力量。

5/23/2025 9:45:01 AM 肆零柒

谷歌黑科技炸场！LightLab：只需一张图+AI，光影编辑像呼吸一样简单，废片秒变电影级大片！

在之前的文章中以及和大家介绍过需要关于图像&视频重打光的方法，在今天的推送文章中，已经帮大家重新整理好了，欢迎大家点击阅读~今天给大家介绍谷歌提出的一种基于扩散模型的方法LightLab，可以实现对单张图像中光源的细粒度、参数化控制。该方法能够调整可见光源的强度和颜色、环境光照的强度，并可在场景中插入虚拟光源。 LightLab方法能够对图像中的光源进行显式的参数化控制，同时生成物理上合理的阴影和环境光效应。

5/23/2025 9:36:53 AM

突发！美国新法案，10年内禁止监管AI

今天凌晨，TechPolicy消息，美国众议院通过了《HR1》法案，将禁止美国各州在未来10年内监管AI。在禁止期间，任何州或其政治分支机构不得执行任何监管AI模型、AI系统或自动决策系统的法律或法规。这个法案的对于微软、OpenAI、谷歌、亚马逊等科技巨头非常重要，彻底打开了枷锁，可以进行更多的AI技术创新尝试了。

5/23/2025 9:26:30 AM

2030年前必须实现AGI！谷歌祖师爷现场「催更」DeepMind CEO

谷歌的I/O大会证明蓝星的科技正统还在谷歌。除了发布Gemini 2.5最新版本继续遥遥领先OpenAI的奥特曼以外，还掏出两幅眼镜来拳打苹果，脚踢Meta。会后还把谷歌的「开山老祖」谢尔盖·布林（Sergey Brin）请了出来，逼Demis Hassabis赶紧在2030年前（也就5年内了）实现AGI。

5/23/2025 9:08:00 AM

字节开源高精度文档解析大模型Dolphin：轻量高效，性能超GPT4.1、Mistral-OCR！

字节跳动刚刚开源一款全新文档解析模型——Dolphin。与目前市面上各类大模型相比，这款轻量级模型不仅体积小、速度快，并且取得了令人惊艳的性能突破，解析效率提升近2倍。测试结果显示，Dolphin在文档解析任务上解析准确率超越了GPT-4.1、Claude3.5-Sonnet、Gemini2.5-pro、Qwen2.5-VL等通用多模态大模型，以及最近推出的号称最强OCR大模型的Mistral-OCR等垂类大模型。

5/23/2025 9:03:00 AM

小学数学题，大模型集体不及格！达摩院推出新基准VCBench

大模型做数学题的能力很强，可是它们真的能够理解基本的数学原理吗？拿小学生的数学题进行测试，人类平均得分为93.30%，而大模型的表现让人意外：闭源模型中Gemini2.0-Flash（49.77%）、Qwen-VL-Max（47.03%）、Claude-3.7-Sonnet（46.63%）的综合表现最佳，但仍未突破50%准确率。因为大模型可能并不能真正理解基本数学元素和视觉概念。

5/23/2025 8:47:00 AM

最强编码模型Claude 4！7小时不间断写代码，连玩24小时宝可梦，GitHub已选为Copilot底层模型

AI圈子好热闹。今天凌晨，Claude终于迎来了它的重大版本升级——Claude 4来了！此次主要发布的有两个模型：Claude Opus 4和Claude Sonnet 4。

5/23/2025 8:34:30 AM 量子位

当AI邂逅向量数据库：重新定义智能时代的数据检索

译者 | 晶颜审校 | 重楼探究人工智能与向量数据库如何实现语义搜索，为更智能的推荐系统、聊天机器人及非结构化数据处理工具提供支撑。在互联网时代，你是否期待搜索引擎不再局限于关键词匹配，而是能理解用户真实意图？这正是人工智能与向量数据库结合的价值所在。

5/23/2025 8:26:11 AM 晶颜

大语言模型究竟为何会在对话中“迷失”

译者 | 张哲刚审校 | 重楼微软研究院和 Salesforce的一篇新论文发现，即使是功能最强大的大型语言模型，如果面临的指令是分阶段而非一次性给出，往往也会表现不佳。该文作者运行六项任务进行研究，最终发现：当提示被拆分成多个回合时，大语言模型的性能平均下降了39%。单轮次对话（左图）可获得最佳结果，但对最终用户而言显得并不自然。

5/23/2025 8:18:52 AM 张哲刚

通用人工智能将如何重塑未来？

通用人工智能(AGI)是一种人工智能，具有与人类一样的获取知识、应用知识解决问题和理解能力。与专门处理受限任务的狭义人工智能系统不同，AGI寻求发展先进的认知技能，以促进在不同情况下完成复杂任务。 AGI是一种人工智能，试图模仿人类的思维过程、解决问题的能力和决策能力。

5/23/2025 6:30:00 AM chris han

RAG系列：系统评估 - 五个主流评估指标详解

引言在 RAG系列：一文让你由浅到深搞懂RAG实现中，我们将 RAG 系统主要分为问题理解、检索召回以及答案生成这三个模块，因此对 RAG 系统的评估也是围绕问题（Question）、检索到的上下文（Retrieved Context）、实际答案（Actual Answer）、参考答案（Reference Answer）这四个维度开展，通过衡量这四个维度之间的相关性来评估 RAG 系统的有效性。下面我们对每个指标一一展开讲解。评估指标上下文召回率（Context Recall）衡量检索到的上下文是否覆盖参考答案所需的所有关键信息，避免遗漏关键信息。

5/23/2025 6:00:00 AM 燃哥讲AI

资讯热榜

免费！让图片放大不失真的位图转矢量图神器 Tmttool AI应用新纪元：2025中国AI应用排行榜榜单揭晓丨2025年1月 6秒视频10秒生成！全新AI视频神器 Grok Imagine 深度体验+元提示词分享最火、最全的Agent记忆综述，NUS、人大、复旦、北大等联合出品后悔没早发现！教你用谷歌Gemini生成精美PPT（附提示词） GGUF 是什么？一文看懂大模型里最火的模型格式 Sora、可灵、即梦哪家强？AI视频软件深度测评！ OmniParser V2 在 Windows 系统上的详细安装与运行指南

标签云

AI 人工智能 OpenAI AIGC 模型 ChatGPT 谷歌 DeepSeek AI新词 AI绘画大模型机器人数据 Midjourney 开源 Meta 微软智能用户 GPT 学习英伟达 Gemini 智能体技术马斯克 Anthropic 图像 AI创作训练 LLM 论文 AI for Science 代码腾讯苹果算法 Agent Claude 芯片具身智能 Stable Diffusion xAI 蛋白质人形机器人开发者生成式神经网络机器学习 AI视频 3D 字节跳动大语言模型 RAG Sora 百度研究 GPU 生成华为工具 AGI 计算生成式AI AI设计大型语言模型搜索亚马逊 AI模型视频生成特斯拉 DeepMind 场景 Copilot 深度学习 Transformer 架构 MCP 编程视觉

理论

Google I/O 2025：开发者必须了解的下一代 AI 革命

初级程序员的复仇！硅谷科技圈技术大佬神作：之前说的vibe coding都是放屁！代理军团来了！2025年底手动编码就会消失！

AI是否知道什么时候该"思考"？Thinkless教会大模型何时该动脑筋

AI实战派：解密DeepSeek企业级项目！AI不是炫技，而是回归需求的必然答案

曝Claude 4胆儿肥变“勇”了，竟敢举报用户！但Cursor、Manus反而更爱用它了！

英伟达再破世界纪录，每秒1000 token！刚刚，全球最快Llama 4诞生

耶鲁大学联合Adobe提出SynthLight：智能重塑人像照明，打造完美光影！

Windsurf 发 SWE-1：以数据+智能飞轮驱动软件工程 AI 进化

谷歌黑科技炸场！LightLab：只需一张图+AI，光影编辑像呼吸一样简单，废片秒变电影级大片！

突发！美国新法案，10年内禁止监管AI

2030年前必须实现AGI！谷歌祖师爷现场「催更」DeepMind CEO

字节开源高精度文档解析大模型Dolphin：轻量高效，性能超GPT4.1、Mistral-OCR！

小学数学题，大模型集体不及格！达摩院推出新基准VCBench

最强编码模型Claude 4！7小时不间断写代码，连玩24小时宝可梦，GitHub已选为Copilot底层模型

当AI邂逅向量数据库：重新定义智能时代的数据检索

大语言模型究竟为何会在对话中“迷失”​

通用人工智能将如何重塑未来？

RAG系列：系统评估 - 五个主流评估指标详解

大语言模型究竟为何会在对话中“迷失”