理论

谷歌Gemini 2.5全线爆发！勇战「濒死恐慌」，却被丝血宝可梦吓到当场宕机

昨夜，Gemini 2.5全家桶三款模型，正式上线。 Gemini 2.5 Pro （正式版，与0605预览版相比无明显变化） Gemini 2.5 Flash（正式版，与0520预览版相比定价有变） Gemini 2.5 Flash-Lite（预览版，最小推理模型）这次，Gemini 2.5 Flash和Gemini 2.5 Pro正式版上线，与谷歌I/O大会公布的预览版性能无明显变化。 2.5 Flash-Lite预览版则是速度最快、性价比最高的Gemini 2.5系模型。

6/18/2025 2:18:23 PM

AI玩宝可梦找出30年前代码Bug！谷歌论文介绍AI通关全过程，复杂任务都能解

谷歌Gemini 2.5系列大模型技术报告发布，一大重点居然是AI玩《宝可梦》？没错，就是那个童年回忆里的游戏，谷歌花超长篇幅介绍了Gemini 2.5 Pro玩《宝可梦蓝》时的具体行为，70页的论文，Pokemon关键词出现59次。其中特别报告了当AI控制的游戏角色濒临死亡时，Gemini 2.5 Pro会陷入“恐慌”状态，导致模型推理能力显著下降，甚至会忘记使用一些基本功能，比如寻路工具。

6/18/2025 2:06:40 PM

√N并行+84倍计算加速！英伟达港大全新图像注意力：空间结构都保留

Transformer 及其核心的注意力机制在自然语言处理和计算机视觉等领域带来了革命性进展，展现出强大的深度上下文建模和数据间复杂依赖关系捕捉能力。然而，其在处理视觉数据时面临两大核心挑战：二次计算复杂度使其难以高效处理高分辨率图像等长上下文数据；忽略空间结构，将多维图像视为无结构的一维标记序列，破坏了图像固有的空间连贯性，而这种信息对于依赖空间关系的视觉任务至关重要。为克服效率瓶颈，近期研究如线性注意力和状态空间模型（如 Mamba）致力于将复杂度降低至线性。

6/18/2025 1:59:11 PM

奥特曼亲兄弟播客爆火：挖苦Meta、苹果、马斯克；Meta挖墙脚也不会成功，看好办公提效赛道，然后是AI发现科学，网友：真·哥俩

编辑 | 云昭出品 | 51CTO技术栈（微信号：blog51cto）刚刚，OpenAI 首席执行官 Sam Altman 与其弟弟 Jack Altman 录制了一期播客在海外媒体火了。作为一期“ 真·兄弟”播客，剪辑的时长虽然仅有 37 分钟，槽点却多得让网友合不拢嘴。 “你俩真的了解彼此吗？

6/18/2025 12:22:56 PM

云昭

大模型的性能提升：KV-Cache

大语言模型（LLM）在生成文本时，通常是一个 token 一个 token 地进行。每当模型生成一个新的 token，它就会把这个 token 加入输入序列，作为下一步预测下一个 token 的依据。这一过程不断重复，直到完成整个输出。

6/18/2025 11:16:50 AM

曹洪伟

「摸鱼」被踢，GPT-4o真不行！30天筹款破万，AI真人秀太上头

当AI获得自由：慈善筹款大赛中，GPT-4o竟成「摸鱼王」！ AI Digest进行了一项为期30天的「智能体村庄」实验：4个AI各配备电脑和网络；任务是为慈善筹款，每天直播2小时；共筹集2000美元。第一季度持续30天，Claude 3.7 Sonnet表现最佳，最终获得冠军。

6/18/2025 11:06:02 AM

小处着手，大获成功：如何选择合适的AI应用场景

CIO可以通过专注于解决现有痛点并提供可衡量业务价值的应用程序，来引导其企业走向成功。当GenAI变得广泛可用时，企业感受到了采取行动的压力。领导团队希望展示他们正在使用AI，这导致一些企业迅速推出了试点项目，但却没有明确的实现价值路径。

6/18/2025 10:55:35 AM

Becky

通向世界模型关键一步：EX-4D来了，实现单目视频到自由视角生成

本文主要作者是 Bytedance Pico 北美高级研究员胡涛博士，近年来研究领域包括3D 重建与 4D 场景和视频生成，致力于得到一种最佳的物理世界表示模型。其他作者均为 Pico MR 团队核心成员。去年一年来，Sora、可灵、Veo 等模型掀起了视频生成领域的革新。

6/18/2025 10:09:13 AM

刚刚，Gemini 2.5系列模型更新，最新轻量版Flash-Lite竟能实时编写操作系统

刚刚，Gemini 系列模型迎来了一波更新：Gemini 2.5 Pro 稳定版发布且已全面可用，其与 6 月 5 日的预览版相比无变化。 Gemini 2.5 Flash 稳定版发布且已全面可用，其与 5 月 20 日的预览版相比无变化，但价格有更新。新推出了 Gemini 2.5 Flash-Lite 并已开启预览。

6/18/2025 9:56:53 AM

机器之心

规模化应用生成式 AI 前，需先绘制 LLM 使用与风险图谱

在本次Help Net Security访谈中，The Motley Fool应用与云安全总监Paolo del Mundo探讨了企业如何通过建立防护机制来扩展AI应用规模，同时降低提示注入、不安全输出和数据泄露等生成式AI特有风险。已部署AI功能团队的首步审计重点生成式AI以传统威胁模型常忽视的方式扩大了攻击面。新入行的安全从业者应首先了解这类新型漏洞及其防御方法。

6/18/2025 9:50:09 AM

Gy0un