理论

RAG系列：系统评估 - 构造QA测试数据集

引言在 RAG系列：基于 DeepSeek Chroma LangChain 开发一个简单 RAG 系统中，我们搭建了一个基础版的 RAG 系统，实现了文档解析和切分 - 文档向量化存储 - 用户输入问题 - 根据问题检索相关知识 - 将检索到的知识和原问题重新组合成 prompt - 最后 LLM 根据增强后的 prompt 给出答案。构造一个基础版的 RAG 系统是非常简单的，借助 LangChain 等框架可快速搭建出完整流程，代码也不会很多，但基础版的问答效果往往比较差，无法直接在实际业务中应用。在 RAG系列：一文让你由浅到深搞懂RAG实现中，我们将 RAG 系统主要分为问题理解、检索召回以及答案生成这三个模块。

5/23/2025 2:00:00 AM

阿里燃哥

实战：Dify智能体+Java=自动化运营服务！

我们在运营某个圈子的时候，可能每天都要将这个圈子的“热门新闻”发送到朋友圈或聊天群里，但依靠传统的实现手段非常耗时耗力，我们通常要先收集热门新闻，再组装要新闻内容，再根据内容设计海报等。那怎么才能简化并高效的完成以上工作呢？答案是我们可以借助 AI 工具：Dify Java 服务来实现热点新闻自动生成功能，最终生成效果如下：实现思路具体实现步骤如下：在 dify 中创建 Agent 应用。

5/23/2025 12:01:00 AM

磊哥

赌赢就是iPhone2.0，赌输下一个AI Pin！OpenAI史上最大收购案：65亿刀，苹果旧将集结！网友：真赌徒，钱少但人疯

编辑 | 云昭用“疯狂买买买”来形容5月的OpenAI，再不为过！要是有“AI初创公司求并购直播间”，OpenAI 妥妥的拿下“榜一大哥”！先是30亿美金拿下AI编码市场老二Windsurf，一度被外界认为是OpenAI最大的收购案，紧接着又开始为自己的产品部门花重金聘任了新的 CEO，Simo。

5/22/2025 5:09:15 PM

云昭

24B模型编程超DeepSeek全家桶，32G内存苹果电脑就能跑，专门针对真实GitHub Issue训练

Mistral沉默好久，果然在憋大招。刚刚发布最新开源编程模型Devstral，在软件工程任务上一举超过DeepSeek全家桶和Qwen3 235B。并且参数只有24B，可以在单卡RTX4090甚至32G内存的Mac上运行。

5/22/2025 1:43:40 PM

AI也能当情感大师？腾讯发布最新AI社交智能榜单，最新版GPT-4o拿下第一

判断AI是否智能，评价维度如今已不仅限于刷榜成绩。当大模型在“IQ”上不断实现新的突破，“懂人心”、“解人意”开始成为实际应用中，人们对大模型新的要求。所以，AI的“EQ”又该如何评价？

5/22/2025 1:42:28 PM

帮大模型提速80%，华为拿出昇腾推理杀手锏FlashComm，三招搞定通算瓶颈

在今年 2 月的 DeepSeek 开源周中，大模型推理过程中并行策略和通信效率的深度优化成为重点之一。近日，华为数学家出手，祭出 FlashComm，三箭齐发，解决大模型推理通算难题：FlashComm1: 大模型推理中的 AllReduce 通信优化技术。将 AllReduce 基于通信原理进行拆解，并结合后续计算模块进行协同优化，推理性能提升 26%。

5/22/2025 1:40:21 PM

vivo 官网 APP 首页端智能业务实践

一、前言vivo官网APP首页是流量最大的页面，承载着新品、活动、商品、其他入口等流量分发的重任。在流量分发上，云端针对首页的主要场景建设了算法支撑。通过梳理首页的场景发现，智能硬件楼层场景的商品配置还是运营纯手工动态配置，而非算法推荐。

5/22/2025 9:18:14 AM

Li Quanlong

突发！OpenAI以64亿美元，收购iPhone设计师公司io

今天凌晨1点，CNBC消息，OpenAI将以64亿美元全资收购，前苹果iPhone设计师乔尼・艾维的AI设备初创公司io，这一交易将推动OpenAI进军硬件领域。收购完成后，艾维并入OpenAI内部，并承担OpenAI和io的深度创意与设计职责，同时艾维的创意团队Love From将保持独立。 OpenAI表示，此次交易将支付50亿美元，因为其已持有该公司23%的股份。

5/22/2025 9:16:00 AM

57.6万代码撕碎AI编程神话，20%「幽灵包」暗藏漏洞！苹果、微软已中招

最近，扎克伯格表示，Meta正在内部开发专门用于编程和AI研究的智能体——这些并不是通用型工具，而是为提升 Meta自家AI项目（如 LLaMA）量身定制的专用智能体。他预测，在未来的12到18个月内，Meta用于AI开发的大部分代码将不再由人类编写，而是由AI智能体生成。微软首席技术官Kevin Scott的预测更长远，但更大胆。

5/22/2025 9:13:47 AM

陶哲轩联手AI挑战经典ε-δ极限！加法秒杀、乘法翻车

数学大师陶哲轩的AI新实验来了！这次是Lean 4自动化数学证明的第三支视频。主要看看GitHub Copilot在处理分析学经典的「ε-δ」问题（描述函数极限的经典方法）时，效果究竟如何。

5/22/2025 9:08:40 AM

12秒生成1万token！谷歌推出文本「扩散模型」Gemini Diffusion，研究员：演示都得降速看

谷歌又放新大招了，将图像生成常用的“扩散技术”引入语言模型，12秒能生成1万tokens。什么概念？不仅比Gemini 2.0 Flash-Lite更快。

5/22/2025 9:08:00 AM

ACL 2025 | 大模型乱试错、盲调用？KnowSelf让智能体有「知识边界感知」能力

在 AI 领域，大模型智能体的发展日新月异。我们今天要介绍的这篇 ACL 2025 论文——《Agentic Knowledgeable Self-awareness》，聚焦于如何提升智能体的「知识边界感知」能力，使其在复杂任务规划中更加得心应手，为智能体的可靠应用提供了新思路。论文标题：Agentic Knowledgeable Self-awareness论文链接：：秒速读版本KnowSelf 聚焦于大模型智能体在决策过程中所面临的「知识边界感知」问题。

5/22/2025 9:07:00 AM

英伟达让机器人「做梦学习」，靠梦境实现真·从0泛化

「仿生人会梦见电子羊吗？」这是科幻界一个闻名遐迩的问题。现在英伟达给出答案：Yes！

5/22/2025 9:06:00 AM

OpenAI放大招！核心API支持MCP，一夜改变智能体开发

今天凌晨，OpenAI全资收购io的消息占据了大部分头条。同时OpenAI也“悄悄地”放出了另外一个重磅消息，用于开发智能体的核心API——Responses API支持MCP服务。传统方法，我们在开发智能体需要通过函数调用与外部服务交互，每次操作都涉及从大模型到后端再到外部服务的网络传输，导致多次跳转、延迟会很高，并增加扩展和管理的复杂性。

5/22/2025 8:55:03 AM

如何基于自定义MCP服务器构建支持工具调用的Llama智能体（含code）

一、背景与目标：从知识隔离到本地化智能体在人工智能应用日益普及的今天，隐私保护与数据主权成为重要挑战。传统的AI模型依赖外部服务，导致私有知识面临泄露风险。本文将详细介绍如何构建一个完全本地化的AI智能体，通过自定义的Model Context Protocol（MCP）服务器实现知识隔离，并结合Llama 3.2轻量级模型实现工具调用能力。

5/22/2025 8:51:48 AM

大模型之路

Dia-1.6B TTS：优秀的文本到对话生成模型

译者 | 李睿审校 | 重楼Dia-1.6B TTS是由Nari Labs开发的一款拥有16亿个参数的文本转语音模型（TTS）。本文将详细介绍该模型，以及其访问途径、使用方法，并展示实际应用结果以真正了解该模型的功能。你是否正在寻求一种合适的文本转语音模型？

5/22/2025 8:05:00 AM

李睿

当心：AI 真的在抢你的工作！

译者 | 陈峻审校 | 重楼你也许是被本文的标题吸引进来，而且感觉不寒而栗。这实际上是全球性的自由职业在线平台 Fiverr 的 CEO 在给其全体员工的一封电子邮件中，所描述的一个严酷事实。而且这并非个案。

5/22/2025 8:00:00 AM

陈峻

100行代码速通Agent开发

大家好，我卡颂自从23年初GPT爆火后，每年都会涌现一些爆火的AI概念。今年最火的概念无疑是Agent。伴随而来的，是各家都在争夺「Agent的解释权」：openAI发布a-practical-guide-to-building-agents[1]Antropic发布building-effective-agents[2]langchain作者发文how-to-think-about-agent-frameworks[3]反驳openAI的观点（目的是推销自家的langGraph）这些繁杂的信息无疑加深了开发者对Agent的理解成本。

5/22/2025 7:40:32 AM

卡颂

资讯热榜

DeepRare 重磅发布：全球首个可循证智能体诊断系统，直击医学Last Exam难题李沐B站更新了！教你手搓语音大模型，代码全开源还能在线试玩 AI时代设计师如何突围？D20峰会揭示未来设计师生存法则考试提分新工具：网页版 ChatGPT 测试“学习和掌握”功能，AI 助你成学霸我测试了100+案例，教你零基础复刻外网刷屏的 AI 视频（附提示词模板）终结Coding？ShellAgent三句话造出马斯克同款「AI女友」！一盘大棋！OpenAI「截胡」IMO金牌，奥特曼为GPT-5献上「核弹级」预热阿里云通义千问 Qwen3-Coder 宣布开源：480B 参数、原生支持 256K 上下文，可与 Claude Sonnet4 媲美

标签云

人工智能 AI OpenAI AIGC 模型 ChatGPT DeepSeek AI绘画谷歌机器人数据大模型 Midjourney 开源智能用户 Meta 微软 GPT 学习技术图像 Gemini AI创作马斯克论文英伟达 Anthropic 智能体代码算法 Stable Diffusion 训练芯片开发者蛋白质腾讯生成式苹果 LLM 神经网络 AI新词 Claude 3D 研究生成机器学习 AI for Science xAI 计算人形机器人 Agent Sora AI视频 GPU 百度 AI设计华为搜索大语言模型工具场景字节跳动 RAG 大型语言模型具身智能预测深度学习伟达视觉 Transformer 神器推荐 AGI 亚马逊视频生成 Copilot DeepMind 模态架构 LLaMA

理论