AI

北大伯克利联手“拷问”大模型：最强Agent也才40分！新基准专治“不听话”的AI分析师

给大模型当老师，让它一步步按你的想法做数据分析，有多难？结果是，连Claude-3.7和Gemini-2.5 Pro这样的顶尖选手，都开始“不听话”了。在一个全新的测试基准中，它们面对多轮、不断演进的指令，最终的任务成功率最高仅有40%。

6/11/2025 9:08:00 AM

让AI自己设计芯片！中国科学院发布「启蒙」，芯片全流程自动设计

芯片设计向来是科技界的「皇冠明珠」，传统设计流程需要顶尖专家团队耗时数月甚至数年攻坚，极具挑战性。芯片设计包含多个关键步骤，硬件设计方面包括逻辑设计、电路设计、物理设计等，基础软件方面包括操作系统内核设计、编译工具链设计、高性能库设计等。中国科学院计算技术研究所处理器芯片全国重点实验室，联合中国科学院软件研究所，基于大模型等AI技术，推出处理器芯片和相关基础软件全自动设计系统——「启蒙」。

6/11/2025 9:07:00 AM

英伟达港大联手革新视觉注意力机制！GSPN高分辨率生成加速超84倍

视觉注意力机制，又有新突破，来自香港大学和英伟达。 Transformer的自注意力在NLP和计算机视觉领域表现出色——它能捕捉远距离依赖，构建深度上下文。然而，面对高分辨率图像时，传统自注意力有两个大难题：计算量巨大：O(N²) 的复杂度让处理长上下文变得非常耗时。

6/11/2025 9:06:00 AM

20人团队提前实现DeepSeek构想，AI算力变天？直击大模型算力成本痛点

如果有一种芯片，天生只为大模型而生，能否突破当前AI的算力瓶颈？要知道，如今的芯片算力，强依赖于制程、工艺等非芯片设计因素。这是因为，传统通用型的GPGPU计算架构在应对日益庞大的模型和复杂计算时，其硬件固有的局限性日益凸显。

6/11/2025 9:06:00 AM

视频生成1.3B碾压14B、图像生成直逼GPT-4o！港科&快手开源测试时扩展新范式

论文第一作者为何浩然，香港科技大学二年级博士，他的研究方向包括强化学习、生成流模型（GFlowNets）以及具身智能，通讯作者为香港科技大学电子与计算机工程系、计算机科学与工程系助理教授潘玲。测试时扩展（Test-Time Scaling）极大提升了大语言模型的性能，涌现出了如 OpenAI o 系列模型和 DeepSeek R1 等众多爆款。那么，什么是视觉领域的 test-time scaling？

6/11/2025 9:00:00 AM

MCP 很好，但它不是万灵药！真正的技术进步，往往始于祛魅之后的清醒认知

当下AI领域最炙手可热的概念，莫过于MCP。 MCP 指的是Model Context Protocol（模型上下文协议）。令人意外的是，一个协议系统的热度，甚至盖过了OpenAI发布的最新模型，成为行业讨论的焦点。

6/11/2025 9:00:00 AM 腾讯技术工程

不是视频模型“学习”慢，而是LLM走捷径｜18万引大牛Sergey Levine

这是UC伯克利大学计算机副教授Sergey Levine最新提出的灵魂一问。他同时是Google Brain的研究员，参与了Google知名机器人大模型PALM-E、RT1和RT2等项目。 Sergey Levine在谷歌学术的被引用次数高达18万次。

6/11/2025 8:59:21 AM

英伟达黄仁勋盛赞 AI 行业变革速度惊人：过去 10 年进步了 100 万倍

除了更强的 GPU，英伟达、xAI、微软等也在打造远超过去一代的AI系统。

6/11/2025 8:50:17 AM 清源

大模型是「躲在洞穴里」观察世界？强化学习大佬「吹哨」提醒LLM致命缺点

「我一直很困惑，语言模型怎么能从下一个 token 预测中学到这么多，而视频模型从下一帧预测中学到的却那么少？难道是因为大模型（LLM）其实是伪装的大脑扫描仪？」近日，加州大学伯克利分校副教授、强化学习大牛 Sergey Levine 发出了一记灵魂拷问。

6/11/2025 8:45:00 AM

谷歌推出的AI Overview和AI Mode对内容创作者来说意味着什么？

译者 | 李睿审校 | 重楼谷歌推出了AI Overview和AI Mode这两项新功能，通过人工智能生成摘要和对话式聊天机器人响应用户查询，以减少用户点击其他网站的需求，而这对于依赖谷歌自然流量的网站构成生存威胁。内容创作者需要调整策略应对AI Overview和AI Mode带来的冲击，例如优化人工智能概览内容、建立直接流量等。谷歌搜索（Google Search）日前推出了两项新的人工智能功能，改变了其响应用户查询的方式。

6/11/2025 8:28:34 AM 李睿

苹果 AI 模型更新：设备端模型追平谷歌 / 阿里，服务器端模型不敌 OpenAI 一年前的 GPT-4o

苹果宣布更新AI模型，但性能表现不及竞争对手。其设备端模型与谷歌、阿里相当，服务器模型落后OpenAI一年。图像分析能力也不突出，用户更倾向Meta的Llama 4 Scout。苹果AI研究部门在竞争中落后，个性化Siri升级延迟。#苹果AI##人工智能#

6/11/2025 8:15:10 AM 远洋

你必须领先掌握的九项AI技能（否则将被淘汰）

下一波AI浪潮不仅仅属于技术宅。想象一下，仅仅一年后，AI带来最大财富的人不再只是程序员、营销人员或销售高手。真正的赢家，是那些掌握了几项关键AI技能的普通人。

6/11/2025 8:10:45 AM 前端小智

IT领导者阻碍AI成功的五大障碍

AI，尤其是GenAI，正迅速成为提高整个企业生产力的有效解决方案，但成功的几个常见障碍仍然存在。 IT领导者越早识别并克服这些问题，他们的企业就能越快地从基于AI的系统中获得更多价值。以下是企业在实现AI价值过程中需要克服的一些更具挑战性的障碍，以及IT领导者可以采取的应对措施。

6/11/2025 7:00:00 AM Bob Violino

构建AI Agent的最优学习路线总结：MCP、CrewAI和Streamlit

如何通过 MCP(Model Context Protocol) 创建一个结合网络搜索、AI 代理和图像生成的现代研究助手引言：AI 驱动的研究未来已来想象一下，您拥有一个个人研究助手，可以即时搜索网络、分析信息、生成全面的总结，甚至创建相关图像——所有这些都通过一个美观的 Web 界面完成。如果这个助手还能由尖端的 AI 代理驱动，与外部工具和 API 无缝协作，会怎样？欢迎体验 MCP-Powered Study Assistant —— 一款结合现代 AI 技术的革命性应用：• 🤖 CrewAI 代理，用于智能研究和写作• 📡 Model Context Protocol (MCP)，实现无缝工具集成• 🌐 Streamlit，提供直观的 Web 界面• 🔍 通过 Brave Search API 实现实时网络搜索• 🎨 通过 Segmind API 进行 AI 图像生成这不仅仅是另一个 ChatGPT 包装器——它是一个完整的研究生态系统，展示了 AI 驱动应用的未来。

6/11/2025 3:22:00 AM AI研究生

Chrome内置AI多模态提示功能详解与实战

距离我上次撰写关于Chrome内置AI功能的博客已经过去了几周，随着本周Google IO大会的召开，涌现了许多新公告和更新。您可以在Chrome开发者博客上找到近期变化的详细说明："AI API现已进入稳定版和原始试用阶段，并推出新的早期预览计划API"。最让我期待的一项功能终于发布了——多模态提示。

6/11/2025 2:13:00 AM 前端小石匠

Java 代码居然能玩转 AI？这个神器把机器学习干懵了

6/11/2025 1:10:00 AM 儒猿团队

华为创造AI算力新纪录：万卡集群训练98%可用度，秒级恢复、分钟诊断

大模型的落地能力，核心在于性能的稳定输出，而性能稳定的底层支撑，是强大的算力集群。其中，构建万卡级算力集群，已成为全球公认的顶尖技术挑战。但是，在华为，昇腾万卡算力集群，已经可以做到近乎“永不罢工”了：训练可用度达98%：这就好比你开着一辆车，全年365天里，有358天无论刮风下雨都能一脚油门就出发，从不掉链子，有问题可以随时检修，几乎不会耽误你的任何行程。

6/10/2025 4:36:29 PM

Ilya回归，获授「第四学位」！AI将完成人类能做的一切，毕业演讲实录

近日，消失了半年的Ilya突然现身多伦多大学，接受母校授予他的荣誉理学博士学位。现场演讲亮点如下：AI将能够完成我们能做的所有事情，不仅仅是其中的一部分，而是全部。大脑是一个生物计算机，而AI是数字计算机、一个数字大脑。

6/10/2025 4:29:25 PM 新智元

资讯热榜

标签云

AI 人工智能 OpenAI AIGC 模型 ChatGPT 谷歌 DeepSeek AI新词 AI绘画大模型机器人数据 Midjourney 开源 Meta 微软智能用户 GPT 学习英伟达 Gemini 智能体技术马斯克 Anthropic 图像 AI创作训练 LLM 论文 AI for Science 代码腾讯苹果算法 Agent Claude 芯片具身智能 Stable Diffusion xAI 蛋白质人形机器人开发者生成式神经网络机器学习 AI视频 3D 字节跳动大语言模型 RAG Sora 百度研究 GPU 生成华为工具 AGI 计算生成式AI AI设计大型语言模型搜索亚马逊 AI模型视频生成特斯拉 DeepMind 场景 Copilot 深度学习 Transformer 架构 MCP 编程视觉

AI

北大伯克利联手“拷问”大模型：最强Agent也才40分！新基准专治“不听话”的AI分析师

让AI自己设计芯片！中国科学院发布「启蒙」，芯片全流程自动设计

英伟达港大联手革新视觉注意力机制！GSPN高分辨率生成加速超84倍

20人团队提前实现DeepSeek构想，AI算力变天？直击大模型算力成本痛点

视频生成1.3B碾压14B、图像生成直逼GPT-4o！港科&快手开源测试时扩展新范式

MCP 很好，但它不是万灵药！真正的技术进步，往往始于祛魅之后的清醒认知

不是视频模型“学习”慢，而是LLM走捷径｜18万引大牛Sergey Levine

英伟达黄仁勋盛赞 AI 行业变革速度惊人：过去 10 年进步了 100 万倍

大模型是「躲在洞穴里」观察世界？ 强化学习大佬「吹哨」提醒LLM致命缺点

谷歌推出的AI Overview和AI Mode对内容创作者来说意味着什么？

苹果 AI 模型更新：设备端模型追平谷歌 / 阿里，服务器端模型不敌 OpenAI 一年前的 GPT-4o

你必须领先掌握的九项AI技能（否则将被淘汰）

IT领导者阻碍AI成功的五大障碍

构建AI Agent的最优学习路线总结：MCP、CrewAI和Streamlit

Chrome内置AI多模态提示功能详解与实战

Java 代码居然能玩转 AI？这个神器把机器学习干懵了

华为创造AI算力新纪录：万卡集群训练98%可用度，秒级恢复、分钟诊断

Ilya回归，获授「第四学位」！AI将完成人类能做的一切，毕业演讲实录

大模型是「躲在洞穴里」观察世界？强化学习大佬「吹哨」提醒LLM致命缺点