AI

让Agent审查代码，第一版天崩！AI原生Github创始人血泪：话痨、误判，别幻想万能代理，快让AI闭嘴！网友：有效，但没必要

让Agent审查代码，第一版天崩！AI原生Github创始人血泪：话痨、误判，别幻想万能代理，快让AI闭嘴！网友：有效，但没必要

编辑 | 云昭出品 | 51CTO技术栈（微信号：blog51cto）“我们用 AI 来做代码审查，结果它比我老板还话多。 ”——这句话可能是很多开发者的真实写照。最近，一篇名为《How we made our AI code reviewer stop being so noisy》的博客引发了热议。

6/27/2025 1:06:48 PM 云昭

谷歌重启 AI 驱动的 “Ask Photos” 功能，提升搜索速度！

谷歌重启 AI 驱动的 “Ask Photos” 功能，提升搜索速度！

近日，谷歌宣布其 AI 驱动的 “Ask Photos” 搜索工具将重新开放访问，并对该功能进行了一系列改进。在此之前，谷歌曾悄然暂停了该工具的推出，以便进一步优化用户体验。 “Ask Photos” 工具由谷歌的 Gemini AI 模型提供支持，用户可以通过提出复杂的问题来快速找到所需的照片。

6/27/2025 12:00:42 PM AI在线

第一次用Cursor？四步骤快速安装＋五大功能界面说明

第一次用Cursor？四步骤快速安装＋五大功能界面说明

Cursor 是一款长得像Visual Studio Code实际上也确实是在人家基础上二次开、塞进AI 功能的程序编辑器，让写整个开发流程都能靠AI 一路加速。使用Cursor 可以一键导入原本你在VsCode中已经设置过的主题、快捷键、extensions，不用再重新设置；它也整合了像 GPT 和Claude等顶尖AI 模型，能依上下文生成整段功能代码。写程序写到一半遇到bug，只要把错误讯息丢给Cursor，AI 就会协助分析、提供建议，甚至重构程序代码、帮你优化结构，让整体更好维护。

6/27/2025 10:11:35 AM Kevin Yan11

突破通用领域推理的瓶颈！清华NLP实验室强化学习新研究RLPR

突破通用领域推理的瓶颈！清华NLP实验室强化学习新研究RLPR

余天予，清华大学计算机系一年级博士生，导师为清华大学自然语言处理实验室刘知远副教授。研究兴趣主要包括高效多模态大模型、多模态大模型对齐和强化学习，在 CVPR、AAAI等人工智能领域的著名国际会议和期刊发表多篇学术论文，谷歌学术引用1000余次。 Deepseek 的 R1、OpenAI 的 o1/o3 等推理模型的出色表现充分展现了 RLVR（Reinforcement Learning with Verifiable Reward，基于可验证奖励的强化学习）的巨大潜力。

6/27/2025 10:10:43 AM

谷歌开源Gemma 3n：2G内存就能跑，100亿参数内最强多模态模型

谷歌开源Gemma 3n：2G内存就能跑，100亿参数内最强多模态模型

端侧设备迎来了新架构的 AI 模型。本周五凌晨，谷歌正式发布、开源了全新端侧多模态大模型 Gemma 3n。模型、权重：：：，Gemma 3n 代表了设备端 AI 的重大进步，它为手机、平板、笔记本电脑等端侧设备带来了强大的多模式功能，其性能去年还只能在云端先进模型上才能体验。

6/27/2025 10:08:19 AM

91岁零基础！硬核爷爷用AI两天爆肝应用，350美元玩转氛围编程

91岁零基础！硬核爷爷用AI两天爆肝应用，350美元玩转氛围编程

一位91岁老人用Claude和Replit编写了一个复杂的教会活动管理系统！退休电气工程师John Blackman分享了他如何用Claude和Replit构建应用程序。 John从没碰过代码，但在孙子推荐下，只花两天就搞定了这个教会志愿者管理系统。

6/27/2025 10:04:31 AM

超过GPT-image-1！大黑马Black Forest刚开源新模型，只用文本实现一键PS

超过GPT-image-1！大黑马Black Forest刚开源新模型，只用文本实现一键PS

今天凌晨，知名开源平台Black Forest开源了，文生图模型FLUX.1-Kontext的开发者版本。该版本主要专注于图像编辑任务，支持迭代编辑，在各种场景和环境中都能出色地保留角色特征，还允许进行精确的局部和全局编辑，例如，用户想给一个人脸加上胡子或者更改衣服穿着、场景，FLUX.1-Kontext都能轻松实现。简单来说，FLUX.1-Kontext开发版的主要功能可以像PS一样，让用户通过自然语言就能实现一键P图。

6/27/2025 9:26:50 AM

五款大模型考「山东卷」，Gemini、豆包分别获文理第一名

五款大模型考「山东卷」，Gemini、豆包分别获文理第一名

果然，高考已经快被 AI 攻克了。近日，5 款大模型参加了今年山东高考，按照传统的文理分科方式统计：豆包 Seed 1.6-Thinking 模型以 683 分的成绩拿下文科第一，Gemini 2.5 Pro 则凭借 655 分拔得理科头筹。测评来自字节跳动 Seed 团队。

6/27/2025 9:24:04 AM 机器之心

3D VLA新范式！CVPR冠军方案BridgeVLA，真机性能提升32%

3D VLA新范式！CVPR冠军方案BridgeVLA，真机性能提升32%

近年来，视觉-语言-动作（VLA）模型在机器人操作任务中大放异彩，成为推动通用机器人操作的重要引擎。但现有的VLA模型，大多只以2D信息作为输入，且需要大量的机器人数据进行微调；反观以PerAct，RVT-2为代表的3D操作策略，通常仅需要10条轨迹就能够取得不错的效果，因此，一个很自然的想法是，是否能将现有的2D VLA升级为3D VLA，使其同时兼具2D VLA的效果以及3D操作策略的效率？中科院自动化所的研究人员提出的BridgeVLA给出了肯定的回答！

6/27/2025 9:10:17 AM

人民大学&字节Seed：利用μP实现Diffusion Transformers高效扩展

人民大学&字节Seed：利用μP实现Diffusion Transformers高效扩展

本文由中国人民大学高瓴人工智能学院李崇轩团队和字节跳动Seed团队共同完成。第一作者郑晨宇是中国人民大学高瓴人工智能学院二年级博士生，主要研究方向为基础模型的优化、泛化和可扩展性理论，导师为李崇轩副教授，论文为其在字节跳动Seed实习期间完成。第二作者张新雨是字节跳动研究员，主要研究方向为视觉生成模型。

6/27/2025 8:50:40 AM

北大发布学术搜索评测ScholarSearch：难倒一众DeepResearch的“开卷考试”

北大发布学术搜索评测ScholarSearch：难倒一众DeepResearch的“开卷考试”

LLMs能当科研助手了？北大出考题，结果显示：现有模型都不能胜任。北京大学DS-Lab发布ScholarSearch，这是首个专门用于评估大语言模型在学术研究中复杂信息检索能力的数据集，包含223道高难度的学术检索题目及其答案。

6/27/2025 8:47:12 AM

Nature报道：谷歌新模型1秒读懂DNA变异！首次统一基因组全任务，性能碾压现有模型

Nature报道：谷歌新模型1秒读懂DNA变异！首次统一基因组全任务，性能碾压现有模型

谷歌DeepMind Alpha家族又双叒登上Nature报道，这次瞄准的是DNA变异。现在只需1秒，就能精确定位基因组序列变异。据Nature最新报道，谷歌DeepMind团队目前推出了突破性生物模型AlphaGenome。

6/27/2025 8:45:31 AM

推理越多，幻觉越重？多模态推理模型的「幻觉悖论」

推理越多，幻觉越重？多模态推理模型的「幻觉悖论」

在多模态大模型的飞速发展中，R1 系列多模态推理模型凭借显式的长链推理机制，在复杂任务中屡屡突破传统「快思考」范式的性能瓶颈。然而，研究发现，随着推理链条的加长，这类模型的视觉感知能力却呈现出明显下滑的趋势，逐渐转而依赖语言先验进行「脑补」，生成内容也越来越容易脱离图像本身，甚至出现凭空捏造的幻觉现象。这一「推理增强—感知削弱」的悖论，凸显了当前多模态推理模型在推理能力与感知准确性之间面临的平衡挑战。

6/27/2025 8:40:00 AM

合成数据创造商业价值的七种方式

合成数据创造商业价值的七种方式

今年，几乎所有企业都在迅速采用AI，但大多数企业部署的都是与他人相同的平台，这些平台来自相同的供应商。基于公司独特需求创建定制化的AI解决方案需要数据，不幸的是，公司手头的数据可能存在重大缺口，在使用时可能涉及隐私或合规性问题，此外，数据量可能也不足。合成数据可以填补这一缺口，帮助企业从其AI部署中找到真正的商业价值。

6/27/2025 7:10:00 AM Maria Korolov

SCIENCEBOARD：构建智能体驱动的科学探索新「环境」

SCIENCEBOARD：构建智能体驱动的科学探索新「环境」

大家好，我是肆〇柒。今天，我们来聊聊 SCIENCEBOARD，这是一个由香港大学、上海人工智能实验室、复旦大学、北京大学、南京大学、华东师范大学和耶鲁大学等，多所知名高校和研究机构共同打造的创新平台。它致力于在多域科学工作流中评估多模态自主智能体，为推动 AI 驱动的科学发现提供了全新的方法和工具。

6/27/2025 7:00:00 AM 肆零柒

裁员潮下，AI开始重塑IT就业格局

裁员潮下，AI开始重塑IT就业格局

随着越来越多的公司将AI视为裁员的主要驱动力，IT专业人士不禁开始怀疑，职业焦虑是否正在成为现实，或者这个行业是否只是在适应另一个新的范式。在新冠疫情期间，亚马逊是众多迅速扩大招聘规模以满足新封闭商业范式下需求的科技公司之一，其他寻求支持全远程工作队伍的企业也纷纷效仿，科技行业的招聘和薪资水平达到了前所未有的高度。但这种繁荣并未持续太久，亚马逊与谷歌、Meta、微软以及其他知名企业一起，在2022年集体裁员超过10万人，以适应疫情后逐渐复苏的世界。

6/27/2025 7:00:00 AM Sarah White

简述MCP的原理-AI时代的USB接口

简述MCP的原理-AI时代的USB接口

1 简介2 执行流程3 mcp架构3.1 mcp架构设计3.2 mcp基本功能4 mcp通信原理4.1 JSON-RPC4.2 通信方式5 生命周期5.1 环境搭建5.2 建立连接获取可用工具列表5.3 调用工具6 总结1.简介随着AI的不断发展，RAG（检索增强生成）和function calling等技术的出现，使得大语言模型的对话生成能力得到了增强。然而，function calling的实现逻辑比较复杂，一个简单的工具调用和实现方式需要针对不同的系统和大模型单独编写适配接口，十分复杂。在此背景下，mcp应运而生，为当前业内AI高效可靠地调用外部工具实现了标准化。

6/27/2025 3:00:22 AM 张皓昱

生成式人工智能演变：生成式人工智能简史

生成式人工智能演变：生成式人工智能简史

从 Transformers（2017 年）到 DeepSeek-R1（2025 年）2025年初，我国推出突破性且经济高效的大型语言模型（LLM）DeepSeek-R1，引发了人工智能的巨变。本文追溯了LLM的演变历程，始于2017年革命性的Transformer架构，该架构通过自注意力机制重塑了自然语言处理（NLP）。到2018年，首批基于Transformer的两款LLM，GPT和BERT相继发布，显著增强了语境理解和文本生成能力，为未来的创新奠定了坚实的基础。

6/27/2025 3:00:00 AM

资讯热榜

AI应用新纪元：2025中国AI应用排行榜榜单揭晓丨2025年1月免费！让图片放大不失真的位图转矢量图神器 Tmttool 6秒视频10秒生成！全新AI视频神器 Grok Imagine 深度体验+元提示词分享最火、最全的Agent记忆综述，NUS、人大、复旦、北大等联合出品后悔没早发现！教你用谷歌Gemini生成精美PPT（附提示词） GGUF 是什么？一文看懂大模型里最火的模型格式 Sora、可灵、即梦哪家强？AI视频软件深度测评！ Mac也能跑Qwen3，一文看懂本地部署qwen 3配置要求

标签云

AI 人工智能 OpenAI AIGC 模型 ChatGPT 谷歌 DeepSeek AI新词 AI绘画大模型机器人数据 Midjourney 开源 Meta 微软智能用户 GPT 学习英伟达 Gemini 智能体技术马斯克 Anthropic 图像 AI创作训练 LLM 论文 AI for Science 代码腾讯苹果算法 Agent Claude 芯片具身智能 Stable Diffusion xAI 蛋白质人形机器人开发者生成式神经网络机器学习 AI视频 3D 字节跳动大语言模型 RAG Sora 百度研究 GPU 生成华为工具 AGI 计算生成式AI AI设计大型语言模型搜索亚马逊 AI模型视频生成特斯拉 DeepMind 场景 Copilot 深度学习 Transformer 架构 MCP 编程视觉