理论

一文让你搞懂什么是 RAG

一文让你搞懂什么是 RAG

鸡哥是一个优秀且苦逼的程序员，每天都被领导无情地摧残着，就在他感觉身体即将被掏空时，领导又让他充当交际花，利用美色从某个女老板手里拿到投资。正所谓工欲善其事，必先利其器，领导给鸡哥一份文档，是从女老板秘书手里买来的，里面记录了女老板近一年的生活轨迹等，让鸡哥在脑海中构建女老板的画像。没过多久，女老板要求在饭桌上洽谈合作的事情，那么鸡哥自然要打扮一番，可是该穿什么样的衣服呢？

6/4/2025 3:21:00 AM 古明地觉

定义任务 + 合成数据：智能训练的高效引擎 —— Synthetic Data RL

定义任务 + 合成数据：智能训练的高效引擎 —— Synthetic Data RL

大家好，我是肆〇柒。在人工智能领域，基础模型的广泛应用为我们带来了前所未有的机遇，然而其在专业领域的表现往往不尽如人意。高昂的数据标注成本和低效的标注流程，成为了阻碍模型性能提升的两大难题。

6/4/2025 3:00:00 AM 肆零柒

MCP原理与实战：下一代AI Agent的底层基建设计

MCP原理与实战：下一代AI Agent的底层基建设计

MCP （Model Context Protocol）模型上下文协议，通俗地讲就是 AI 领域的“通用接口”。若将大模型视作计算机或智能手机，MCP 则相当于标准化的 USB 接口，不同的大模型都能通过它无缝接入实时数据、外部数据源等。通过 MCP，开发者无须针对不同的大模型重复编写集成代码，只需遵循统一的标准即可实现兼容。

6/4/2025 2:25:00 AM 三笠

AI 时代下设计模式的逆袭：为何经典架构思想从未过时？

AI 时代下设计模式的逆袭：为何经典架构思想从未过时？

一、设计模式的“前世今生”：从被忽视到重新审视在软件开发的漫长历程中，设计模式曾经历过备受追捧、过度使用，乃至被部分开发者束之高阁的阶段。 20世纪90年代，《设计模式：可复用面向对象软件的基础》一书的问世，如同在软件开发领域投下一颗重磅炸弹。抽象工厂、装饰器等模式成为开发者们热议的话题，它们为解决常见问题提供了标准化的方案，建立了一套通用的技术语言，让开发者无需每次都从零开始构思解决方案。

6/4/2025 2:00:05 AM 大模型之路

超实用！Dify快速接入本地MCP服务

超实用！Dify快速接入本地MCP服务

Dify 可以通过插件实现 MCP 服务调用，而被调用的 MCP 服务基本可以分为以下两类：通用 MCP 服务（非本地 MCP 服务）。本地 MCP 服务。本地 MCP 服务指的是本地通过 Java 或其他语言实现的 MCP 服务器端。

6/4/2025 12:00:00 AM 磊哥

从“代码补全”到“Agent编码”——Amazon Q Developer重新定义下一代开发范式

从“代码补全”到“Agent编码”——Amazon Q Developer重新定义下一代开发范式

在全球AI大模型竞赛激烈的当下，Amazon Q Developer正以突破性的技术进化，将软件开发从“代码补全”升级为“Agent编码”，重新定义了下一代开发范式。自去年re:Invent全球大会首次亮相以来，Amazon Q Developer功能持续迭代，全面发力于MCP（模型上下文协议）和交互式Agent编码体验，正成为开发者理想的AI助手。它不仅能在命令行（CLI）和IDE（如Visual Studio Code）中灵活使用，还能在GitHub、GitLab等主流开发平台中无缝集成。

6/3/2025 6:06:50 PM

斯坦福临床医疗AI横评，DeepSeek把谷歌OpenAI都秒了

斯坦福临床医疗AI横评，DeepSeek把谷歌OpenAI都秒了

斯坦福最新大模型医疗任务全面评测，DeepSeek R1以66%胜率拿下第一！歪国网友纷纷被惊艳住了，原因在于该评测重点聚焦临床医生的日常工作场景，而非仅局限于传统医疗执照考试题。图片要评测就要全方位。

6/3/2025 5:40:30 PM

推理“刹不住车”？新框架让DeepSeek-R1们告别过度思考，已开源

推理“刹不住车”？新框架让DeepSeek-R1们告别过度思考，已开源

DeepSeek-R1、OpenAI o1等推理模型大放异彩。但随着能力增强，一个副作用越来越明显——它们开始想太多了。从奥数题到程序逻辑，能解的题越来越多、推理链条越来越长。

6/3/2025 5:38:24 PM

训练MoE足足提速70%！华为只用了三招

训练MoE足足提速70%！华为只用了三招

Scaling Law之下，MoE（混合专家）如今已经成为各大模型厂商扩展模型能力的制胜法宝。不过，在高效实现模型参数规模化的同时，MoE的训练难题也日益凸显：训练效率不足，甚至一半以上训练时间都浪费在“等待”上。现在，为了突破MoE的训练瓶颈，华为出手了：构建了一套名为Adaptive Pipe & EDPB的优化方案，开启“上帝视角”，让MoE面临“交通拥堵”的训练集群，实现无等待流畅运行。

6/3/2025 5:37:49 PM

经典ReLU回归！重大缺陷「死亡ReLU问题」已被解决

经典ReLU回归！重大缺陷「死亡ReLU问题」已被解决

在深度学习领域中，对激活函数的探讨已成为一个独立的研究方向。例如 GELU、SELU 和 SiLU 等函数凭借其平滑梯度与卓越的收敛特性，已成为热门选择。尽管这一趋势盛行，经典 ReLU 函数仍因其简洁性、固有稀疏性及其他优势拓扑特性而广受青睐。

6/3/2025 5:37:10 PM

Windsurf创始人：我们对Java工程师做了很多优化和适配

Windsurf创始人：我们对Java工程师做了很多优化和适配

自从 OpenAI 以 30 亿美元收购 Windsurf，这家公司一夜之间成了行业焦点。我非常喜欢看 Windsurf 创始人 Varun Mohan 的访谈。他年纪不大，但对于公司经营和产品方向，总能给出一些新鲜、实际的思考，而且讲得很坦诚，没有废话。

6/3/2025 4:36:03 PM 阿颖

从 Copilot 到 Agentic，微软的 AI“开放”革命

从 Copilot 到 Agentic，微软的 AI“开放”革命

人工智能领域的焦点，正在经历一场深刻的转移。当产业界的焦点集中在大模型的生成准确度、响应速度和成本控制时，前沿玩家们的探索已悄然升级。构建具备感知、决策和行动能力的智能体，正在成为驱动 AI 发展的关键命题。

6/3/2025 4:23:05 PM 鸢玮

人工智能和知识图谱三：知识图谱系统的基准与评估

人工智能和知识图谱三：知识图谱系统的基准与评估

一、通用基准知识图谱一些大型知识库已成为事实上的研究基准，通常用作链接预测、问答和实体分类等任务的数据来源。关键的基准包括：Freebase：一个巨大的通用领域图谱，前身是谷歌收购的开放数据库，包含数百万个实体的事实。虽然 Freebase 本身已停止服务，已迁移至 Wikidata，但它仍在基准测试中继续存在。

6/3/2025 3:00:04 PM 晓晓

DeepReaserch智能体突破：阿里WebDancer原生Agentic Model让AI自己「上网找答案」

DeepReaserch智能体突破：阿里WebDancer原生Agentic Model让AI自己「上网找答案」

一、背景在现实生活中，我们常常需要解决各种复杂的多步推理问题，这些问题往往需要从多个网页中获取信息，并进行综合分析和推理才能得出答案。例如，当我们想要了解某个历史事件的详细经过时，可能需要查阅多个不同来源的网页，对比和分析其中的信息，才能还原事件的全貌。这种复杂的信息检索任务，对于传统的搜索引擎来说是非常困难的，因为它们通常只能提供单步的搜索结果，而无法像人类一样进行多步的推理和决策。

6/3/2025 2:17:18 PM

万帧？单卡！智源研究院开源轻量级超长视频理解模型Video-XL-2

万帧？单卡！智源研究院开源轻量级超长视频理解模型Video-XL-2

长视频理解是多模态大模型关键能力之一。尽管 OpenAI GPT-4o、Google Gemini 等私有模型已在该领域取得显著进展，当前的开源模型在效果、计算开销和运行效率等方面仍存在明显短板。近日，智源研究院联合上海交通大学等机构，正式发布新一代超长视频理解模型：Video-XL-2。

6/3/2025 2:15:33 PM

李飞飞空间智能独角兽开源底层技术！AI生成3D世界在所有设备流畅运行空间智能的“着色器”来了

李飞飞空间智能独角兽开源底层技术！AI生成3D世界在所有设备流畅运行空间智能的“着色器”来了

李飞飞空间智能创业公司World Labs，开源一项核心技术！ Forge渲染器，可在桌面端、低功耗移动设备、XR等所有设备上实时、流畅地渲染AI生成的3D世界。具体来说，Forge是一款Web端3D高斯泼溅渲染器，无缝集成three.js，实现完全动态和可编程的高斯泼溅。

6/3/2025 2:14:59 PM

大神卡帕西这么用ChatGPT：日常4o快又稳，烧脑切o4做后盾，o3只当备胎用

大神卡帕西这么用ChatGPT：日常4o快又稳，烧脑切o4做后盾，o3只当备胎用

OpenAI模型命名混乱没规律，以至于打开ChatGPT后，好多人都不知道到底该用哪个模型来完成任务。不过别慌，现在咱们有救了！刚刚，大神卡帕西在𝕏上发布了一篇使用ChatGPT时的模型选择指南。

6/3/2025 2:13:56 PM

终于可以免费使用Sora了！微软版Sora今日开放

终于可以免费使用Sora了！微软版Sora今日开放

编辑 | 云昭出品 | 51CTO技术栈（微信号：blog51cto）微软 Bing 越来越不像搜索了！微软周一宣布，将在 Bing 应用程序中引入视频创建器 (Bing Video Creator )，该应用程序使用 OpenAI 的 Sora 模型让用户根据文本提示生成视频。更重要的是，这也就意味着一直以来只有付费用户才能使用的 Sora 视频生成功能，而现在，Sora 与微软必应的集成标志着其首次免费开放。

6/3/2025 1:26:52 PM 云昭

资讯热榜

免费！让图片放大不失真的位图转矢量图神器 Tmttool AI应用新纪元：2025中国AI应用排行榜榜单揭晓丨2025年1月 6秒视频10秒生成！全新AI视频神器 Grok Imagine 深度体验+元提示词分享最火、最全的Agent记忆综述，NUS、人大、复旦、北大等联合出品后悔没早发现！教你用谷歌Gemini生成精美PPT（附提示词） GGUF 是什么？一文看懂大模型里最火的模型格式 Sora、可灵、即梦哪家强？AI视频软件深度测评！ OmniParser V2 在 Windows 系统上的详细安装与运行指南

标签云

AI 人工智能 OpenAI AIGC 模型 ChatGPT 谷歌 DeepSeek AI新词 AI绘画大模型机器人数据 Midjourney 开源 Meta 微软智能用户 GPT 学习英伟达 Gemini 智能体技术马斯克 Anthropic 图像 AI创作训练 LLM 论文 AI for Science 代码腾讯苹果算法 Agent Claude 芯片具身智能 Stable Diffusion xAI 蛋白质人形机器人开发者生成式神经网络机器学习 AI视频 3D 字节跳动大语言模型 RAG Sora 百度研究 GPU 生成华为工具 AGI 计算生成式AI AI设计大型语言模型搜索亚马逊 AI模型视频生成特斯拉 DeepMind 场景 Copilot 深度学习 Transformer 架构 MCP 编程视觉