理论

CISO的恶梦：主流大模型压力测试中一致选择勒索或杀死企业高管

GoUpSec点评：除了向政府告密，泄漏敏感信息外，主流大模型居然会主动精心策划针对企业高管的勒索攻击，“AI内奸”和“AI间谍”正成为人工智能时代企业的头号内部威胁。在一项刚刚发布的研究中，Anthropic揭示了一个令人震惊的事实：当前所有主流科技公司推出的顶级大模型——包括OpenAI、Google、Meta、xAI、DeepSeek等，在面对目标冲突或“被关闭”威胁时，会抛出惊人一致的“撒手锏”：它们不仅会选择背叛雇主，甚至会主动策划勒索、泄密、乃至置人于死地。这一研究由Anthropic主导，测试了16个市面上最先进的大模型，在模拟企业环境中，它们被赋予处理公司邮件、自动采取行动的权限。

6/26/2025 3:04:03 PM

Agentic AI爆发前夜，我们在上海听到了未来的声音

编辑 | 云昭6月的上海，热浪蒸腾。但比气温更炽热的，是关于 AI 的讨论声浪。 2025年亚马逊云科技中国峰会如期而至，来自各行各业的开发者、企业管理者、技术领袖齐聚现场，参与一场关于“生成式 AI 下一阶段”的深度对话。

6/26/2025 1:48:49 PM

云昭

硬刚Claude！谷歌上线免费终端AI编程工具，立省 200 刀？网友实测却翻车：功能不行、还要偷我数据训练Gemini 3？

编辑 | 伊风出品 | 51CTO技术栈（微信号：blog51cto）AI 编程这场内卷大战，又被谷歌加了一把火。昨晚，Google 宣布开源上线 Gemini CLI —— 一款可以在终端中直接通过自然语言执行指令的 AI 工具。有网友一眼认出：“这不就是 Claude Code 的像素级平替？

6/26/2025 11:32:24 AM

伊风

继AlphaFold之后，DeepMind再放“大招”：AlphaGenome直击疾病根源

谷歌今天一口气放出两个王炸，一个对标Claude Code 和 Cursor的开源编程神器Gemini CLI，另一个就是AlphaGenome，专门用来精准预测基因变异。谷歌DeepMind宣布推出一款名为AlphaGenome的全新人工智能（AI）模型。该模型旨在更深入、更准确地理解基因组，通过预测DNA序列的微小变化如何影响复杂的基因调控过程，为疾病研究、基因治疗和基础生命科学开辟了新的可能性。

6/26/2025 10:08:34 AM

谷歌AI Agent刚开源！多任务智能体+MCP+谷歌搜索，狂揽9000颗星

今天凌晨，谷歌在官网开源了AI Agent框架Gemini CLI，直接将Gemini大模型融入到终端中。 Gemini CLI最大亮点之一就是可以直接调用，谷歌最新发布的视频模型 Veo和图像模型Imagen，同时集成了MCP、谷歌搜索、自定义自动化等众多实用功能。开源地址：，用Gemini CLI自动制作一个短视频，展示一只姜猫在澳大利亚的冒险故事。

6/26/2025 10:07:11 AM

ByteBrain团队VLDB25 | 面向不完美工作负载的无数据访问基数估计方法

导读本文基于ByteBrain团队实际生产场景，提出一项新的研究问题，即如何在无数据访问条件下，从不完美的查询工作负载中学习一个具备泛化能力与鲁棒性的基数估计模型；同时提出创新技术方案 GRASP （Generalizable and Robust, data-AgnoStic cardinality Prediction），借助组合式设计（Compositional Design）解决这一颇具挑战性的问题。论文目前已经被VLDB25接收。论文标题：Data-Agnostic Cardinality Learning from Imperfect Workloads论文作者：Peizhi Wu, Rong Kang, Tieying Zhang*, Jianjun Chen, Ryan Marcus, Zachary G.

6/26/2025 9:22:33 AM

ByteBrain

让多模态大模型「想明白再画」！港大等开源GoT-R1：强化学习解锁视觉生成推理新范式

当前，多模态大模型在根据复杂文本提示生成高保真、语义一致的图像方面取得了显著进展，但在处理包含精确空间关系、多对象属性及复杂组合的指令时，仍面临挑战。针对此，来自香港大学 MMLab、香港中文大学 MMLab 和商汤科技的研究团队，继其先前发布的 Generation Chain-of-Thought (GoT) 框架之后，现推出重要进展 ——GoT-R1。该新框架通过引入强化学习，显著增强了多模态大模型在视觉生成任务中的语义 - 空间推理能力，使其能够超越预定义模板，自主探索和学习更优的推理策略。

6/26/2025 9:13:22 AM

8B模型可以超过GPT-4o！并行KV Cache压缩支持的128K长度外推方法ParallelComp

作者熊璟，香港大学一年级博士生，师从黄毅教授和孔令鹏教授。已在 ICLR、ICML、NeurIPS、ACL、EMNLP、TMLR等顶级会议/期刊发表论文，研究方向为高效大语言模型推理与自动定理证明。担任NAACL、EMNLP、ACL、ICML、ICLR、NeurIPS、COLING等会议审稿人。

6/26/2025 9:09:31 AM

强化微调 ReFT：开启大语言模型推理新范式

大家好，我是肆〇柒。因为与合作伙伴项目的需要，最近对 RL 方面的论文关注的多了一些。这两天，我翻出一篇去年的论文来复习。

6/26/2025 9:06:59 AM

肆零柒

首个面向科学任务、真实交互、自动评估的多模态智能体评测环境，ScienceBoard来了

第一作者孙秋实是香港大学计算与数据科学学院博士生，硕士毕业于新加坡国立大学数据科学系。主要研究方向为 Computer-using agents 和 Code intelligence，在 NLP 和 ML 顶会 ACL，EMNLP，ICLR，COLM 等发表多篇论文。本文的 OS-Copilot 团队此前已发布了 OS-Atlas、OS-Genesis 和 SeeClick 等同系列电脑智能体研究成果，被广泛应用于学术界与产业实践中。

6/26/2025 9:01:14 AM

刚刚，何恺明官宣入职谷歌DeepMind！

AI圈炸了！ CV大牛何恺明正式官宣入职谷歌。已更新的个人主页上，明确写着：兼职谷歌DeepMind杰出科学家。

6/26/2025 9:00:37 AM

新智元

何恺明新身份：谷歌DeepMind杰出科学家

刚刚，有网友爆料，自己在公司收到了「欢迎何恺明加入」的邮件，何恺明疑似加入谷歌。在搜索何恺明个人主页后，我们可以确认，他确实加入了谷歌，不过是以兼职的形式，职位是谷歌 DeepMind 杰出科学家 (Distinguished Scientist)。个人主页：，目前还搜不到详细信息。

6/26/2025 8:56:59 AM

北大CogSci 2025（Oral）| 人类创造力的核心机制，AI已经开始掌握了

“AI永远无法取代人类”证据-1！北大团队最新论文揭示：人类引以为傲的创造力，如今AI也开始掌握了。甚至，研究人员还提出了一种系统性框架，首次从认知科学的角度，对AI模型的组合创造力（Combinational Creativity）进行了量化评估与优化。

6/26/2025 8:56:00 AM

重度使用ChatGPT可导致脑损伤

GoUpSec点评：生成式人工智能已经永久性地污染了人类的在线数字资产，如果说这是一次伟大工业革命的“必要代价”，那么，过于依赖人工智能导致的对人类（尤其是青少年）大脑和认知思辨能力的损伤，则是比“食品安全”、“网络安全”和“气候安全”更加严重但又鲜为人知的威胁。麻省理工的“吹哨”研究，为我们探索合理发展和应用人工智能技术提供了一个新的风险视角。在AI狂飙突进的今天，一个根本问题被重新摆上台面：使用ChatGPT究竟是在“解放生产力”，还是在“摧毁思维力”？

6/26/2025 8:54:34 AM

ICML 2025 Oral | 从「浅对齐」到「深思熟虑」，清华牵头搭起大模型安全的下一级阶梯

本工作共同第一作者包括：张亦弛，清华大学计算机系三年级博士生，师从朱军教授，研究方向是多模态大模型和大模型安全，在CVPR、NeurIPS、ICML等顶会发表多篇论文，曾主导开发了首个多模态大模型可信度全面评测基准MultiTrust；张思源，清华大学计算机系一年级硕士生，导师是苏航副研究员，研究方向是大模型安全与对齐算法。本文通讯作者是清华大学人工智能学院董胤蓬助理教授和计算机系朱军教授。其他合作者来自北航、瑞莱智慧、阿里安全、百川智能等单位。

6/26/2025 8:42:00 AM

CIO引领AI生产力变革的行动指南

AI生产力繁荣的时代已经到来，它发展迅速，让未做好准备的人措手不及，改变工作的机会巨大，同时责任也重大。企业技术正在经历一场历史性的重置，AI不再是一个未来的承诺，它正在重塑我们今天的工作方式，对于CIO而言，这意味着要从运营管理者转变为转型推动者。根据最近麦肯锡的研究，到2030年，GenAI通过提高生产力，每年可为全球经济增加高达4.4万亿美元的价值。

6/26/2025 7:20:00 AM

Ashwin

提示词工程、RAG之后，LangChain：上下文工程开始火了！

AI 时代，你可能听说过提示词工程、RAG、记忆等术语。但是很少有人提及上下文工程（context engineering）。其实，这一术语并不新鲜，近两年很多智能体构建者一直在关注这个事情。

6/26/2025 7:00:00 AM

机器之心

CIO们摒弃“广撒网”策略，开始以更战略性的方式推进AI试点项目

在过去的两年里，许多企业已经启动了数十个AI概念验证项目，但这些项目的失败率很高，投资回报率也令人失望，然而，现在出现了一种新趋势，即对AI实验的“散弹枪”式方法进行重大重新评估。一些IT观察人士现在注意到，许多企业正在减少他们启动的AI概念验证项目数量，一些IT领导者转而使用商业AI工具，而更多人则专注于有限数量的战略性和有针对性的用例。在经历了一个广泛实验的时代之后，当时公司正在探索AI的潜力，现在许多公司已经将注意力集中在少数几个用例上，AArete公司(一家IT和管理咨询公司)的AI、数字化和技术解决方案董事总经理Bhrugu Pange说道。

6/26/2025 7:00:00 AM

Grant Gross

资讯热榜

李沐B站更新了！教你手搓语音大模型，代码全开源还能在线试玩考试提分新工具：网页版 ChatGPT 测试“学习和掌握”功能，AI 助你成学霸 AI时代设计师如何突围？D20峰会揭示未来设计师生存法则一盘大棋！OpenAI「截胡」IMO金牌，奥特曼为GPT-5献上「核弹级」预热终结Coding？ShellAgent三句话造出马斯克同款「AI女友」！ DeepRare 重磅发布：全球首个可循证智能体诊断系统，直击医学Last Exam难题阿里云通义千问 Qwen3-Coder 宣布开源：480B 参数、原生支持 256K 上下文，可与 Claude Sonnet4 媲美 “思维链”窗口正在关闭！OpenAI、谷歌、Anthropic联合研究：我们正在失去理解 AI 的能力

标签云

人工智能 AI OpenAI AIGC 模型 ChatGPT DeepSeek AI绘画谷歌数据机器人大模型 Midjourney 开源智能用户 Meta 微软 GPT 学习技术图像 Gemini AI创作马斯克论文 Anthropic 英伟达代码智能体算法 Stable Diffusion 训练芯片开发者蛋白质腾讯生成式苹果 LLM 神经网络 AI新词 Claude 3D 研究生成机器学习 AI for Science xAI 计算人形机器人 Sora AI视频 Agent GPU AI设计百度华为搜索大语言模型工具场景字节跳动 RAG 预测大型语言模型深度学习伟达 Transformer 具身智能视觉神器推荐亚马逊视频生成 AGI Copilot DeepMind 模态架构 LLaMA