理论

上海AI实验室造出首个「通才」机器人大脑：看懂世界+空间推理+精准操控全拿下

机器人的新大脑框架来了！上海人工智能实验室联合多家单位提出了一种全新的通用具身智能大脑框架：Visual Embodied Brain，简称VeBrain。该模型通过同时集成视觉感知、空间推理和机器人控制能力，可实现多模态大模型（MLLM）对物理实体的直接操控，使机器人能像人类一样“看到-思考-行动”。

6/6/2025 8:52:00 AM

RAG、向量数据库和LLM搜索：人工智能驱动商业智能的未来

译者 | 李睿审校 | 重楼本文对RAG、向量数据库和LLM搜索如何塑造人工智能驱动的商业智能未来进行探讨。 RAG通过集成知识检索提升LLM性能，解决其无法及时纳入最新或专有信息的问题，尤其在客户服务领域影响显著。向量数据库则支持快速相似性搜索，理解查询语义。

6/6/2025 8:39:15 AM

李睿

译者 | 刘涛审校 | 重楼目录重构概述重构前期准备争取管理层支持通过自动化测试确保安全保障识别高风险区域设定明确的重构目标复杂代码库的重构技巧识别并隔离问题区域渐进式重构与大爆炸式重构拆分单体代码确保向后兼容性处理依赖关系与紧密耦合测试策略（自信地安全重构）在不降低性能的前提下进行重构使用人工智能工具自动化代码审查总结一、重构概述重构是一种对代码开展持续优化的重要手段，其核心目标在于降低代码的复杂程度，削减技术债务。通过不断完善代码库来解决项目推进过程中出现的代码结构恶化问题，它能将杂乱无章或低效的代码转变为结构良好、便于维护的解决方案。二、重构前期准备在着手进行代码重构之前，搭建一个坚实稳固的基础有着举足轻重的意义。

6/6/2025 8:36:21 AM

刘涛

Cursor 1.0 终于来了

自2023年首次发布以来，Cursor终于迎来了它的第一个重大版本更新——Cursor 1.0正式发布了！这次更新令人非常兴奋，因为Cursor已经成为我一年多来最常用的AI编程工具。 OpenAI曾多次尝试收购这款应用，但交易最终未能达成。

6/6/2025 8:13:47 AM

前端小智

如何利用AI改造智能电网

2023年，能源和公用事业领域的AI全球市场规模达到了105.6亿美元，预计到2030年将激增至457.8亿美元，这标志着AI将在重塑未来电力系统方面发挥关键作用。与此同时，非洲城市正处于能源转型的关键节点，整个非洲大陆仍有近6亿人无法用电，若不首先对基础电网设施进行现代化改造，建设包容性且可持续的智慧城市的目标将难以实现。随着对老旧资产的升级改造以及对服务不足社区的电力接入扩展工作的加强，AI正迅速成为这一转型的催化剂。

6/6/2025 7:02:00 AM

Satyajit

OpenAI付费企业用户猛增至300万直击微软谷歌AI腹地

OpenAI周三宣布，自2月份以来，其企业用户群激增了50%，付费企业客户已达300万，与此同时，这家AI公司推出了一系列全新的工作场所工具，旨在与微软的企业级AI产品展开直接竞争。这一里程碑是在推出几项新的面向企业的功能时公布的，凸显了OpenAI在可靠、安全的AI工具能够收取高价的企业市场中的积极扩张，该公司推出了新的“连接器”，这些连接器将ChatGPT与流行的商业应用程序集成在一起，还推出了一项名为“记录模式”(Record Mode)的会议转录功能，并对其深度研究(Deep Research)和Codex编码工具进行了增强。 “ChatGPT正在帮助企业转型，帮助员工更高效、更战略性地工作，”OpenAI的一位发言人告诉记者，“在过去的几个月里，我们一直在不断将ChatGPT发展成为一个对工作越来越有影响力的平台，提供了连接器、与ChatGPT集成的记录模式、Codex、图像生成、深度研究等商业产品。

6/6/2025 7:00:00 AM

Michael

LLM 的 SFT 与 RL：差异几何？

在大型语言模型（LLM）的训练领域，监督微调（SFT）和强化学习（RL）是两种备受瞩目的训练策略。尽管它们各自有着独特的机制和侧重点，但笔者经过深入研究和实践观察发现，二者之间的差别并非如表面上那般显著，以下是具体的分析与对比。一、核心原理的相近性SFT 的本质：SFT 主要是利用标注好的数据集对预训练的 LLM 进行进一步训练，通过最小化模型输出与标注答案之间的差异，来调整模型的参数。

6/6/2025 4:10:00 AM

小智

结合LangGraph、DeepSeek-R1和Qdrant 的混合 RAG 技术实践

一、引言：混合RAG技术的发展与挑战在人工智能领域，检索增强生成（RAG）技术正成为构建智能问答系统的核心方案。传统RAG通过向量数据库存储文档嵌入并检索相关内容，结合大语言模型（LLM）生成回答，有效缓解了LLM的“幻觉”问题。然而，单一的稠密向量检索（如基于Transformer的嵌入模型）在处理关键词匹配和多义词歧义时存在局限性，而稀疏向量检索（如BM25）虽擅长精确关键词匹配，却缺乏语义理解能力。

6/6/2025 3:11:00 AM

大模型之路

三步搭建MCP服务器，让AI工具直接调用n8n工作流

今天我们将视角转向服务端实现。 n8n 自 1.88.0 版本起，引入了一个革命性特性——MCP Server Trigger 节点。这一创新让开发者能够将复杂的工作流包装成标准化的 MCP 服务，通过 SSE（Server-Sent Events）协议对外发布。

6/6/2025 2:11:00 AM

林月半子聊AI

Qwen和DeepSeek为何都选YaRN？

这篇文章，我们还是从面试官的视角出发，一起来分析一下，如果你在面试现场被问到这个题目，应该如何回答？ 1.面试官心理分析首先还是分析一下面试官的心理，面试官问这个问题，主要是想考察三点：第一，你知不知道长度外推这个概念？很多同学可能听都没听过这个概念，那这个问题当然也就无从答起了。

6/6/2025 1:26:00 AM

丁师兄

《圣经》成书时间或被改写！AI竟发现《死海古卷》早于所罗门时代

就在刚刚，科学家用AI重新定义了《死海古卷》历史时间线！许多卷轴其实比原先认为年代还要早很多，两卷《死海古卷》竟是《但以理书》的最早片段！研究还显示，《传道书》很可能由无名作者在公元前三世纪完成，而非传统所称的所罗门王！

6/6/2025 1:25:00 AM

新智元

“一代更比一代强”：现代 RAG 架构的演进之路

基于 RAG（检索增强生成）的 AI 系统，过去是，现在仍然是企业利用大语言模型（LLM）的最有价值的应用之一。我记得差不多两年前我写了第一篇关于 RAG 的文章，那时候这个术语还未被广泛采用。我当时描述的是一个以最基础方式实现的 RAG 系统。

6/6/2025 1:15:00 AM

Baihai IDP

人工智能和知识图谱六：知识图谱的行业用例

一、医疗保健与生命科学在制药和生物技术领域，知识图谱正在加速药物发现和再利用。这些知识图谱将异构生物医学数据整合到单一知识网络中，比如基因、蛋白质、疾病、药物、临床试验、文献等。研究人员可以查询或分析该图谱，以发现不明显的联系，例如，与两种看似不相关的疾病有关的基因可能暗示着共同的靶向途径。

6/6/2025 1:00:00 AM

晓晓

大模型公司挖墙脚哪家强？报告：Anthropic人才吸引力是OpenAI的8倍，留存率达80%

大模型公司挖墙脚哪家强，Anthropic才是最大赢家？不仅顶尖AI人才的留存率达到80%，而且工程师从OpenAI跳槽到Anthropic的可能性是从Anthropic转投OpenAI的8倍。不止OpenAI，大型科技公司也是Anthropic主要的人才猎场。

6/6/2025 12:33:00 AM

超实用！Dify调用Java的三种实现方式！

在一些复杂的业务中，我们可能需要使用 Dify 调用外部程序（如 Java 程序），因为这样才能满足业务的特殊需求。例如，当我们使用 Dify 实现“AI 简历自动筛选器”的时候，我们首先会使用 AI 筛选出符合招聘要求的简历，然后再将简历存放到公司的“人才库”系统中，完成后续流程的招聘需要（预约面试、面试评价、发送 Offer 等操作），这个时候就需要让 Dify 调用 Java 程序了。那么问题来了，使用 Dify 调用 Java 程序的实现方式有哪些呢？

6/6/2025 12:00:00 AM

磊哥

奥特曼：Codex 让我感到 AGI！最新谈话罕见透露下一代“完美模型”，大胆预测 Agent 明年突破边界！

编辑 |伊风、云昭出品 | 51CTO技术栈（微信号：blog51cto）不知道大家有没有发现：今年的奥特曼，突然安静了很多。不像 24 年那样频繁出现在各种技术播客、大会、访谈里，甚至好多次OpenAI新发布也不见他的身影——这位 AI 圈最活跃的“CEO 网红”，仿佛一下子就开启带娃模式、退居幕后了。可偏偏，在这个 AI产品、Agent、大模型都在飞速迭代的时间点，我们又特别想知道他最近在想什么。

6/5/2025 2:32:41 PM

伊风

1步碾压250步！何恺明新作祭出MeanFlow，一行公式让 FID 狂降近 70%

2025 年 5 月的一篇论文中，何恺明与 CMU、MIT 联合团队提出了一种全新的一步生成框架 MeanFlow。图片论文标题是：《Mean Flows for One-step Generative Modeling》。从论文的实验曲线来看，只跑1 步，图像质量居然能甩开跑 250 步的老牌扩散模型（2021 年前后的经典扩散模型，如 ADM）。

6/5/2025 1:35:33 PM

文摘菌

被疯传的“恶趣味”：看Copilot这款“熊孩子”把微软工程师逼疯！Agent 刚上线就翻车？网友：微软工程师成了“人肉保姆”

作者 | Dylan Cooper编译 | 云昭出品 | 51CTO技术栈（微信号：blog51cto）最近，GitHub Copilot 又“整活儿”了。 Reddit 上一位网友发帖调侃：“我最近迷上了一个新爱好：看 AI 一点点把微软员工逼疯。 ”这不是段子，而是对微软 .NET 仓库里一连串尴尬 PR（Pull Request，拉取请求）的讽刺。

6/5/2025 1:16:22 PM

云昭

资讯热榜

免费！让图片放大不失真的位图转矢量图神器 Tmttool AI应用新纪元：2025中国AI应用排行榜榜单揭晓丨2025年1月 GGUF 是什么？一文看懂大模型里最火的模型格式 Sora、可灵、即梦哪家强？AI视频软件深度测评！免注册免费用！17种AI绘图模型一站式体验平台LMArena 可灵、即梦、海螺、Vidu哪家强？4大AI视频神器深度测评后悔没早发现！教你用谷歌Gemini生成精美PPT（附提示词） LangChain V1.0 深度解析：手把手带你跑通全新智能体架构

标签云

AI 人工智能 OpenAI AIGC 模型 ChatGPT 谷歌 DeepSeek AI绘画大模型机器人数据 AI新词 Midjourney 开源 Meta 微软智能用户 GPT 学习智能体技术 Gemini 马斯克英伟达 Anthropic 图像 AI创作训练 LLM 论文代码算法 AI for Science 苹果腾讯 Agent Claude 芯片 Stable Diffusion 蛋白质具身智能 xAI 开发者生成式人形机器人神经网络机器学习 3D AI视频 RAG 大语言模型 Sora 研究百度生成 GPU 工具字节跳动华为 AGI 计算大型语言模型 AI设计搜索生成式AI 视频生成 DeepMind 亚马逊 AI模型特斯拉场景深度学习 Transformer 架构 MCP Copilot 编程视觉

理论