理论

引领京城AI盛宴，金蝶开创企业管理AI新时代

在新一轮人工智能技术浪潮推动下，企业数字化转型正加速迈向智能化变革的新阶段。 6月6日，金蝶云苍穹AI峰会北京站盛大启幕，300余位来自央国企、行业龙头企业及生态伙伴的AI先行者共聚一堂，围绕“AI赋能企业管理”的新思想、新技术、新应用展开深入研讨，加速推动AI技术在企业管理中从“可想象”走向“可落地”。助力企业实现智能化转型，是金蝶“予力企业、成就不凡”这一使命在AI时代的具体体现。

6/9/2025 9:24:23 AM

ICML 2025 | 全局池化+局部保留，CCA-Attention为LLM长文本建模带来突破性进展

琶洲实验室、华南理工大学联合推出关键上下文感知注意力机制（CCA-Attention），实现超长文本的高效上下文建模。在 128K 超长序列上下文建模任务中，CCA-Attention 的推理速度是标准自注意力机制的 7.9 倍，同时键值缓存（KV Cache）显存占用减少 93%，性能全面优于现有高效注意力方法。论文标题：Core Context Aware Transformers for Long Context Language Modeling论文链接：：：2024年12月17日该成果已被 ICML 2025 接收，最早于 2024 年 12 月 17 日提交至 ArXiv，早于 DeepSeek NSA 和 Kimi MoBA 公开。

6/9/2025 9:23:05 AM

ALPHAONE（α1）：LRM 自适应推理效率与准确性的平衡之道

大家好，我是肆〇柒。今天，我们来聊大型推理模型（LRM）领域的一项研究 ——ALPHAONE（α1）框架。当前，大型推理模型如 OpenAI 的 o1 和 DeepSeek-R1 等，已经在诸多复杂推理任务上展现出了强大的能力，但它们在推理过程中也面临着一些挑战，比如容易陷入过度推理或推理不足的困境。

6/9/2025 9:17:44 AM 肆零柒

人工智能和知识图谱八(完)：知识图谱的挑战、缺点和陷阱

知识图谱虽然功能强大，但在实际场景中实现它们并非一帆风顺。我们必须意识到其中的挑战、局限性和潜在风险，包括技术问题，比如可扩展性、数据质量、模式复杂性、与非结构化或动态数据的集成障碍，以及偏见和隐私等道德问题。可扩展性和性能：一个挑战是将知识图谱扩展到极大规模（数十亿个节点/边），同时保持复杂查询和更新的性能。

6/9/2025 9:10:26 AM 晓晓

算力终结者来了！华人天团「降维打击」注意力瓶颈，AI狂飙进对数时代

LLM苦算力太久了！为缓解长序列建模中的算力瓶颈，研究界持续探索高效替代方案。这次Mamba作者Tri Dao、华人AI领域大牛Eric P.

6/9/2025 9:05:00 AM

为什么用错奖励，模型也能提分？新研究：模型学的不是新知识，是思维

本文主要作者是吕昂和谢若冰。吕昂，中国人民大学博士生，研究方向为语言模型结构优化，导师为严睿教授；谢若冰，腾讯高级研究员，研究方向为大语言模型、推荐系统。最近的一篇论文中，来自人大和腾讯的研究者们的研究表明，语言模型对强化学习中的奖励噪音具有鲁棒性，即使翻转相当一部分的奖励（例如，正确答案得 0 分，错误答案得 1 分），也不会显著影响下游任务的表现。

6/9/2025 9:04:00 AM

交互式生成视频（IGV）：重塑游戏、智能与驾驶的交互革命

大家好，我是肆〇柒。今天，我们来聊聊交互式生成视频（IGV）技术。这是一项在当下技术革命中产生的前沿技术，它具备强大的生成能力和交互特性，正在改变我们与虚拟世界互动的方式。

6/9/2025 9:03:58 AM 肆零柒

顶会0篇，一夜RLHF爆文刷屏！他靠写作逆袭AI圈，院士都说好

Ai2的高级研究科学家Nathan Lambert，最近分享了他如何走上AI之路。尽管起步艰难、几经波折，他依旧在AI领域站稳脚跟、有所成就。博士毕业时，他没有在NeurIPS/ICML/ICLR等顶会上发表过文章。

6/9/2025 9:00:00 AM

告别「失忆」AI！首个大模型记忆操作系统开源框架来了！

该项目来自百家 AI，是北京邮电大学白婷副教授所指导的研究小组，团队致力于为硅基人类倾力打造情感饱满、记忆超凡的智慧大脑。大语言模型受限于固定上下文窗口，长期对话中「失忆」、记忆断裂等问题频发，北邮百家 AI 团队重磅推出首个大模型记忆操作系统开源框架 MemoryOS。巧妙融合计算机操作系统原理与人脑分层记忆机制，构建段页式三级存储架构及四大核心模块（存储、更新、检索、生成），提供全链路用户记忆管理方案，让 AI 智能体拥有持久「记性」与深度「个性」。

6/9/2025 8:56:00 AM

顶流AI，人设崩了！6小时被攻破，泄露高危品指南，惨遭网友举报

只要6小时，顶尖大模型Claude 4 Opus「安全防线」被攻破！ AI安全研究机构FAR.AI联合创始人Adam Gleave透露，仅用6小时，研究人员Ian McKenzie就成功诱导Claude 4生成了长达15页的化学武器制作指南。 Ian McKenzie回应称：Claude 4传授的内容，比他预期的还要多。

6/9/2025 8:53:00 AM

谷歌Transformer过时了？清华姚班校友等三连击，爆改注意力！

谷歌又有新的注意力了！他们提出的新架构参数减少40%，训练速度较RNN提升5-8倍，在某些任务上性能甚至Transformer好7.2%！在大语言模型（LLMs）中，他们引入了新的注意力偏向策略，并重新构想了「遗忘」这一过程，用「保留」来取而代之。

6/9/2025 8:52:00 AM

打破跨模态干扰，快手东北大学联合提出统一多模态框架，横扫多模态检索基准

多模态检索是信息理解与获取的关键技术，但其中的跨模态干扰问题一直是一大难题。可行的解决办法是构建一种统一的多模态表示方式，为此，来自快手与东北大学的研究人员推出了多模态统一嵌入框架——UNITE。 UNITE的核心目标，就是构建一个能同时处理文本、图像、视频及其融合模态输入的统一嵌入器。

6/9/2025 8:50:00 AM

RLHF已死，RLVR引爆AGI革命！Claude 4核心成员万字对谈

在Dwarkesh Patel主持的节目中，Anthropic的Sholto Douglas、Trenton Bricken等人，一起讨论了Claude 4是如何思考的。三人私交甚好，聊了2小时20多分钟，主要集中在4个话题：1. 过去一年中人工智能研究的变化；2.

6/9/2025 8:48:00 AM

扩散语言模型扛把子LLaDA迎来新版本，数学、代码、对齐能力均提升

本文介绍的工作由中国人民大学高瓴人工智能学院李崇轩、文继荣教授团队与蚂蚁集团共同完成。朱峰琪、王榕甄、聂燊是中国人民大学高瓴人工智能学院的博士生，导师为李崇轩副教授。该研究基于团队前期发布的 8B 扩散语言模型 LLaDA（国内率先做到真正可用的扩散语言模型，是后续很多研究的主干基础模型），探索了扩散语言模型的偏好对齐方法，提出了方差缩减的偏好优化方法 VRPO，并利用 VRPO 对 LLaDA 进行了强化对齐，推出了 LLaDA 1.5。

6/9/2025 8:47:00 AM

多模态LLM+RAG：突破生成瓶颈的下一代AI架构革命

译者 | 朱先忠审校 | 重楼通过整合文本、图像、音频等数据，多模态大型语言模型（MLLM）开始突破传统RAG的文本局限，赋予AI感知能力。其核心架构采用CLIP、Whisper等编码器实现跨模态语义统一，通过投影层对齐多模态信息。不过，多模态大型语言模型的评估需要综合检索质量、生成忠实度及跨模态一致性等一系列指标实现。

6/9/2025 8:42:23 AM 朱先忠

生图效果媲美GPT-4o，一键搞定各类视觉生成任务丨港科广&字节全新框架

图像生成、视频创作、照片精修需要找不同的模型完成也太太太太太麻烦了。有没有这样一个“AI创作大师”，你只需要用一句话描述脑海中的灵感，它就能自动为你搭建流程、选择工具、反复修改，最终交付高质量的视觉作品呢？这一切，现在通过一个由港科大（广州）和字节联合出品的全新的开源框架——ComfyMind实现了。

6/9/2025 8:40:00 AM

图灵奖得主、AI教父Bengio：我改变了科研方向，哪怕与此前信念背离，也要尽己所能降低AI失控的灾难风险；AGI最快五年降临

编辑｜云昭6月6日，年逾花甲的三大“AI教父”之一的Yoshua Bengio（小编心中的科研偶像之一），如约出现在2025智源大会上的现场荧幕中。大师眼中的GPT究竟是什么样子？我们又该打造怎样的AI？

6/9/2025 8:39:10 AM 云昭

八个数据集全面胜出！思维链推理刷新图学习表现上限

思维链提示学习来了！由于图数据拥有复杂的非线性结构和缺少文本信息，语言模型中的思维链（Chain-of-Thought，CoT）提示学习方法难以简单直接地应用于图数据。基于此，来自新加坡管理大学和中国科学技术大学的研究者们提出了GCoT——首个应用于无文本图数据的类思维链提示学习框架。

6/9/2025 8:37:00 AM

资讯热榜

免费！让图片放大不失真的位图转矢量图神器 Tmttool AI应用新纪元：2025中国AI应用排行榜榜单揭晓丨2025年1月 6秒视频10秒生成！全新AI视频神器 Grok Imagine 深度体验+元提示词分享最火、最全的Agent记忆综述，NUS、人大、复旦、北大等联合出品后悔没早发现！教你用谷歌Gemini生成精美PPT（附提示词） GGUF 是什么？一文看懂大模型里最火的模型格式 Sora、可灵、即梦哪家强？AI视频软件深度测评！ OmniParser V2 在 Windows 系统上的详细安装与运行指南

标签云

AI 人工智能 OpenAI AIGC 模型 ChatGPT 谷歌 DeepSeek AI新词 AI绘画大模型机器人数据 Midjourney 开源 Meta 微软智能用户 GPT 学习英伟达 Gemini 智能体技术马斯克 Anthropic 图像 AI创作训练 LLM 论文 AI for Science 代码腾讯苹果算法 Agent Claude 芯片具身智能 Stable Diffusion xAI 蛋白质人形机器人开发者生成式神经网络机器学习 AI视频 3D 字节跳动大语言模型 RAG Sora 百度研究 GPU 生成华为工具 AGI 计算生成式AI AI设计大型语言模型搜索亚马逊 AI模型视频生成特斯拉 DeepMind 场景 Copilot 深度学习 Transformer 架构 MCP 编程视觉

理论

引领京城AI盛宴，金蝶开创企业管理AI新时代

ICML 2025 | 全局池化+局部保留，CCA-Attention为LLM长文本建模带来突破性进展

ALPHAONE（α1）：LRM 自适应推理效率与准确性的平衡之道

人工智能和知识图谱八(完)：知识图谱的挑战、缺点和陷阱

算力终结者来了！华人天团「降维打击」注意力瓶颈，AI狂飙进对数时代

为什么用错奖励，模型也能提分？新研究：模型学的不是新知识，是思维

交互式生成视频（IGV）：重塑游戏、智能与驾驶的交互革命

顶会0篇，一夜RLHF爆文刷屏！他靠写作逆袭AI圈，院士都说好

告别「失忆」AI！首个大模型记忆操作系统开源框架来了！

顶流AI，人设崩了！6小时被攻破，泄露高危品指南，惨遭网友举报

谷歌Transformer过时了？清华姚班校友等三连击，爆改注意力！

打破跨模态干扰，快手东北大学联合提出统一多模态框架，横扫多模态检索基准

RLHF已死，RLVR引爆AGI革命！Claude 4核心成员万字对谈

扩散语言模型扛把子LLaDA迎来新版本，数学、代码、对齐能力均提升

多模态LLM+RAG：突破生成瓶颈的下一代AI架构革命​

生图效果媲美GPT-4o，一键搞定各类视觉生成任务丨港科广&字节全新框架

图灵奖得主、AI教父Bengio：我改变了科研方向，哪怕与此前信念背离，也要尽己所能降低AI失控的灾难风险；AGI最快五年降临

八个数据集全面胜出！思维链推理刷新图学习表现上限

多模态LLM+RAG：突破生成瓶颈的下一代AI架构革命