理论

智能体如何重塑工业自动化和风险管理

在采访中，西门子数字工业部门网络安全横向管理副总裁迈克尔·梅茨勒(Michael Metzler)讨论了在工业环境中部署智能体所带来的网络安全影响，他谈到了智能体做出半自主决策所带来的风险，以及为什么像纵深防御(Defense-in-Depth)这样的分层安全方法对于保障工业系统安全至关重要。在一个关键基础设施环境(如能源厂或生产线)中，如果智能体被攻破，会带来哪些影响?与传统自动化系统相比，智能体为工业环境引入了哪些新的网络安全风险?智能体代表了工业自动化领域的一项重要进步，通过其半自主决策功能提供了新的能力。与任何技术进步一样，成功实施需要与现有的工业安全和安全标准及协议进行深思熟虑的整合。

5/29/2025 7:02:00 AM Mirko Zorz

告别手写代码！十款开源 AI 工具，截图秒变可运行代码（附 GitHub 地址）

今年一直在学习和研究AI，也做了很多高价值AI开源项目的总结，今天就和大家分享11款通过截图（图片）生成代码的开源项目和工具，帮助大家提高编码效率。 Screenshot to Code图片它能够将设计图中的截图自动转化为代码片段，主要用于网页和应用界面的开发。支持的技术栈包括 HTML Tailwind、React Tailwind、Vue Tailwind、Bootstrap、Ionic Tailwind、SVG 等。

5/29/2025 5:00:10 AM 趣谈AI

第二次Sora时刻来了！全球首款实时摄像头诞生，真人感拉满颠覆全行业

就在今天，AI视频领域，再次迎来了高能时刻！硅谷新锐公司AKOOL正式发布的全球首款实时摄像头——AKOOL Live Camera，一举点燃了全行业的热情！它不仅能秒变虚拟数字人、实时翻译多语言、无缝替换人脸，还能动态生成影视级画质的视频画面，将四大功能集于一身。

5/29/2025 4:15:00 AM 新智元

混合推理模型（LHRM）：平衡效率与推理能力的新范式

大家好，我是肆〇柒。今天，我们来探讨一下大型混合推理模型（LHRM）。在人工智能领域，大型推理模型（LRM）能够自如的完成比如编程、数学和常识推理等任务。

5/29/2025 3:00:00 AM 肆零柒

如何通过 OpenMemory MCP 增强客户端的上下文感知能力

人工智能（AI）技术发展迅速，大型语言模型（LLMs）极大地简化了许多任务。然而，它们面临一个基本限制：会话之间无法保留记忆。图片如果能够拥有一个本地的、便携的 LLM “记忆层”，完全掌控您的数据，会怎样呢？

5/29/2025 2:11:00 AM AI研究生

数据提取场景下不同LLM模型对比分析

在数字化时代，数据作为核心资产，其高效处理与利用成为企业和组织发展的关键。然而，大量数据以非结构化文本、传统文档等形式存在，导致数据提取面临巨大挑战。人工智能，尤其是大语言模型（LLMs）的爆发式发展，为大规模自动化数据提取提供了新的可能。

5/29/2025 1:50:00 AM 大模型之路

基于四大AI交互协议的AI测试平台架构

在IT互联网技术领域，一个APP或系统背后的技术架构，有web层、server层、中间件、数据库和底层的操作系统，看起来很复杂。后来大家逐渐形成了较为统一的标准，即通过API接口将不同层级之间串联起来，最终才能形成一个能提供完善服务的APP应用。 AI领域目前也出现了类似的统一标准或者机制，来实现大模型、智能体等AI工具之间的协作通信。

5/29/2025 1:45:00 AM 写文章的老张

大多数开发者宁愿浪费数小时，也不肯花20分钟学会用 Cursor

我见过一些开发者，明明可以轻松解决的问题，却偏偏要给自己制造困难。他们宁愿花上几个小时和代码中的 bug 死磕，也不愿花20分钟搭建一个高效的自动化流程。自从我开始用 Cursor —— 一款类似“编程高手朋友”的 AI 驱动的 IDE 后，我总结出一套五步技巧，快速上手、轻松开发。

5/29/2025 1:40:00 AM 前端小智

一文读懂： AI 智能体的架构原则、三高架构、存储架构的核心方案

一、为啥 AI 架构设计这么关键？如今，AI 应用那可是雨后春笋般地冒出来。 ‘从 ChatGPT 、到AI智能体应用，到每天服务上千万人的智能客服，再到处理亿级数据的推荐系统，要想让这些 AI 玩意儿在实际场景里落地生根，高可用、高性能、灵活扩展的系统架构是关键。

5/29/2025 1:10:00 AM 尼恩架构团队

首个面向柔性衣物灵巧操作的仿真平台来了，北大、伯克利联合发布

本论文共同第一作者为王昱然、吴睿海、陈越，导师为北京大学董豪老师。课题组致力于统一的物体表征操作研究，以实现具有可解释性和泛化能力的物体操作策略。在机器人操作领域，柔性物体，尤其是衣物的操控始终是一个值得关注的难题。

5/28/2025 6:43:17 PM

Meta闪电分拆AI帝国！Llama团队一劈为二：一边狂卷AGI，一边死磕OpenAI

2025 年 5 月，据 Axios 报道，Meta 正式将其 AI 部门拆分为两个独立方向：面向消费者的AI产品团队，以及追求通用人工智能（AGI）的“AGI Foundations”基础组。过去几年，Meta在AI领域的策略始终被认为偏“研究导向”：大模型Llama的发布频率、论文产出数量、开源社区活跃度，都表现出一种“与学界赛跑”的姿态。但与此同时，用户端产品的AI体验却始终模糊——Llama虽强，却“藏”在模型库里，普通用户几乎无感。

5/28/2025 6:41:37 PM

刚刚2岁的Llama，「爸妈」都跑了！小扎手拆Meta AI，LeCun保持独立

小扎最近着实有点烦。一是谷歌、OpenAI、Anthropic等竞争对手不断「上压力」，谷歌I/O大会、Claude 4出炉，而OpenAI的奥特曼牵手了Apple乔布斯时代的乔纳森做硬件；二是刚刚2岁的Llama（2023年开源），最初署名的14名作者走的走，创业的创业，选择留下的只有3人；三是Llama 4不仅翻车，Behemoth还面临跳票，即使是Scout、Maverick被开发者调侃为Llama 3.5；四是作为「技术老大」的Yann LeCun天天可劲地说LLM要完蛋，与当下LLM发展背道而驰。终于，小扎「痛定思痛」决定重组Meta的AI团队！

5/28/2025 6:41:30 PM

突发！传字节内部禁用Cursor、Windsurf！

编辑 | 云昭出品 | 51CTO技术栈（微信号：blog51cto）刚刚得到消息，字节跳动相关部门正在禁用 Cursor、WindSurf 等 AI 开发软件。有报道称，这一决定来源于字节跳动安全与风控部门发布的一封邮件。邮件称，出于对防范数据泄露风险的考虑，自6月30日起，将在内部分批次禁用第三方AI开发软件，包括AI编程工具Cursor、Windsurf等，并将字节旗下的编程助手Trae作为替代方案。

5/28/2025 6:36:47 PM 云昭

硬核分享！构建单智能体已经Out了！大佬分享：架构设计如何推动可靠的多智能体编排

作者 | Nikhil Gupta，Atlassian AI产品管理负责人编译 | 云昭出品 | 51CTO技术栈（微信号：blog51cto）时至今日，如果再提如何构建一个Agent，肯定已经过时了。打造一个超级智能的单一模型已经不再是2025年的主旋律。而真正的力量和令人兴奋的新领域，是让多个专业化的AI智能体协同运转起来。

5/28/2025 6:04:20 PM 云昭

55万人围观！这款代理意外燃爆了！产品感知力爆表！一张截图复刻苹果官网，一句话生成真运行App，Figma导入调整细节，要变天了

出品 | 51CTO技术栈（微信号：blog51cto）今天凌晨，一款Agent工具意外出圈了。一位热衷 AI 摄影导演的 X 博主 @EHuanglu 分享了他试用一个名叫 HeroUI 的 AI 工具的经历，并放出了自己近日来生成的 6 个精美 App 或网站，精美程度堪比苹果、迪奥。 “我只用文字 prompt，就在几分钟内创建了一个完整的项目管理应用。

5/28/2025 5:55:16 PM 云昭

地瓜机器人完成1亿美元A轮融资，加速构建具身智能生态版图

2025 年 5 月 28 日，在独立运营一周年之际，地平线机器人-W旗下地瓜机器人宣布完成 1 亿美元 A 轮融资。本轮融资获得海内外众多投资机构青睐，由高瓴资本、五源资本、线性资本、和暄资本、九合创投、Vertex Growth、砺思资本、敦鸿资产、沸点资本、梅花创投、黄浦江资本等投资机构共同参投，为地瓜机器人加速构建具身智能生态版图注入强劲动力。自成立以来，地瓜机器人始终承载着「成为机器人时代的 Wintel 」的品牌初心，致力构建软硬一体、端云协同的全链路开发基础设施，让更智能的机器人开发更简单，并在商业生态上实现了从消费级机器人市场的规模化落地，新兴智能机器人的多元品类孵化，到与众多具身智能头部企业协同创新的全面跨越，全力推动机器人智能进化与规模化落地。

5/28/2025 1:25:14 PM

MiniMax开源首个视觉RL统一框架，闫俊杰领衔！推理感知两手抓，性能横扫MEGA-Bench

仅需一个强化学习（RL）框架，就能实现视觉任务大统一？现有RL对推理和感知任务只能二选一，但“大模型六小强”之一MiniMax表示：我全都要！最新开源V-Triune（视觉三重统一强化学习系统）框架，使VLM首次能够在单个后训练流程中，联合学习和掌握视觉推理和感知任务。

5/28/2025 11:55:56 AM

多模态模型具备“物理推理能力”了吗？新基准揭示：表现最好的GPT-o4 mini也远不及人类！

表现最好的GPT-o4 mini，物理推理能力也远不及人类！就在最近，来自香港大学、密歇根大学等机构的研究人员补齐了现有评估体系中的一处关键空白——评估多模态模型是否具备“物理推理能力”。物理推理，即模型在面对真实或拟真的物理情境时，能否综合利用视觉信息、物理常识、数学建模进行判断和预测，被认为是通向具身智能的关键能力。

5/28/2025 11:55:28 AM

资讯热榜

免费！让图片放大不失真的位图转矢量图神器 Tmttool AI应用新纪元：2025中国AI应用排行榜榜单揭晓丨2025年1月 6秒视频10秒生成！全新AI视频神器 Grok Imagine 深度体验+元提示词分享最火、最全的Agent记忆综述，NUS、人大、复旦、北大等联合出品后悔没早发现！教你用谷歌Gemini生成精美PPT（附提示词） GGUF 是什么？一文看懂大模型里最火的模型格式 Sora、可灵、即梦哪家强？AI视频软件深度测评！ OmniParser V2 在 Windows 系统上的详细安装与运行指南

标签云

AI 人工智能 OpenAI AIGC 模型 ChatGPT 谷歌 DeepSeek AI新词 AI绘画大模型机器人数据 Midjourney 开源 Meta 微软智能用户 GPT 学习英伟达 Gemini 智能体技术马斯克 Anthropic 图像 AI创作训练 LLM 论文 AI for Science 代码腾讯苹果算法 Agent Claude 芯片具身智能 Stable Diffusion xAI 蛋白质人形机器人开发者生成式神经网络机器学习 AI视频 3D 字节跳动大语言模型 RAG Sora 百度研究 GPU 生成华为工具 AGI 计算生成式AI AI设计大型语言模型搜索亚马逊 AI模型视频生成特斯拉 DeepMind 场景 Copilot 深度学习 Transformer 架构 MCP 编程视觉

理论

智能体如何重塑工业自动化和风险管理

告别手写代码！十款开源 AI 工具，截图秒变可运行代码（附 GitHub 地址）

第二次Sora时刻来了！全球首款实时摄像头诞生，真人感拉满颠覆全行业

混合推理模型（LHRM）：平衡效率与推理能力的新范式

如何通过 OpenMemory MCP 增强客户端的上下文感知能力

数据提取场景下不同LLM模型对比分析

基于四大AI交互协议的AI测试平台架构

大多数开发者宁愿浪费数小时，也不肯花20分钟学会用 Cursor

一文读懂： AI 智能体的架构原则、三高架构、 存储架构的核心方案

首个面向柔性衣物灵巧操作的仿真平台来了，北大、伯克利联合发布

Meta闪电分拆AI帝国！Llama团队一劈为二：一边狂卷AGI，一边死磕OpenAI

刚刚2岁的Llama，「爸妈」都跑了！小扎手拆Meta AI，LeCun保持独立

突发！传字节内部禁用Cursor、Windsurf！

硬核分享！构建单智能体已经Out了！大佬分享：架构设计如何推动可靠的多智能体编排

55万人围观！这款代理意外燃爆了！产品感知力爆表！一张截图复刻苹果官网，一句话生成真运行App，Figma导入调整细节，要变天了

地瓜机器人完成1亿美元A轮融资，加速构建具身智能生态版图

MiniMax开源首个视觉RL统一框架，闫俊杰领衔！推理感知两手抓，性能横扫MEGA-Bench

多模态模型具备“物理推理能力”了吗？新基准揭示：表现最好的GPT-o4 mini也远不及人类！

一文读懂： AI 智能体的架构原则、三高架构、存储架构的核心方案