AI在线 AI在线

理论

RAG系列:系统评估 - 构造QA测试数据集

引言在 RAG系列:基于 DeepSeek Chroma LangChain 开发一个简单 RAG 系统 中,我们搭建了一个基础版的 RAG 系统,实现了文档解析和切分 - 文档向量化存储 - 用户输入问题 - 根据问题检索相关知识 - 将检索到的知识和原问题重新组合成 prompt - 最后 LLM 根据增强后的 prompt 给出答案。 构造一个基础版的 RAG 系统是非常简单的,借助 LangChain 等框架可快速搭建出完整流程,代码也不会很多,但基础版的问答效果往往比较差,无法直接在实际业务中应用。 在 RAG系列:一文让你由浅到深搞懂RAG实现 中,我们将 RAG 系统主要分为问题理解、检索召回以及答案生成这三个模块。
5/23/2025 2:00:00 AM
阿里燃哥

实战:Dify智能体+Java=自动化运营服务!

我们在运营某个圈子的时候,可能每天都要将这个圈子的“热门新闻”发送到朋友圈或聊天群里,但依靠传统的实现手段非常耗时耗力,我们通常要先收集热门新闻,再组装要新闻内容,再根据内容设计海报等。 那怎么才能简化并高效的完成以上工作呢? 答案是我们可以借助 AI 工具:Dify Java 服务来实现热点新闻自动生成功能,最终生成效果如下:实现思路具体实现步骤如下:在 dify 中创建 Agent 应用。
5/23/2025 12:01:00 AM
磊哥

赌赢就是iPhone2.0,赌输下一个AI Pin!OpenAI史上最大收购案:65亿刀,苹果旧将集结!网友:真赌徒,钱少但人疯

编辑 | 云昭用“疯狂买买买”来形容5月的OpenAI,再不为过! 要是有“AI初创公司求并购直播间”,OpenAI 妥妥的拿下“榜一大哥”! 先是30亿美金拿下AI编码市场老二Windsurf,一度被外界认为是OpenAI最大的收购案,紧接着又开始为自己的产品部门花重金聘任了新的 CEO,Simo。
5/22/2025 5:09:15 PM
云昭

24B模型编程超DeepSeek全家桶,32G内存苹果电脑就能跑,专门针对真实GitHub Issue训练

Mistral沉默好久,果然在憋大招。 刚刚发布最新开源编程模型Devstral,在软件工程任务上一举超过DeepSeek全家桶和Qwen3 235B。 并且参数只有24B,可以在单卡RTX4090甚至32G内存的Mac上运行。
5/22/2025 1:43:40 PM

AI也能当情感大师?腾讯发布最新AI社交智能榜单,最新版GPT-4o拿下第一

判断AI是否智能,评价维度如今已不仅限于刷榜成绩。 当大模型在“IQ”上不断实现新的突破,“懂人心”、“解人意”开始成为实际应用中,人们对大模型新的要求。 所以,AI的“EQ”又该如何评价?
5/22/2025 1:42:28 PM

帮大模型提速80%,华为拿出昇腾推理杀手锏FlashComm,三招搞定通算瓶颈

在今年 2 月的 DeepSeek 开源周中,大模型推理过程中并行策略和通信效率的深度优化成为重点之一。 近日,华为数学家出手,祭出 FlashComm,三箭齐发,解决大模型推理通算难题:FlashComm1: 大模型推理中的 AllReduce 通信优化技术。 将 AllReduce 基于通信原理进行拆解,并结合后续计算模块进行协同优化,推理性能提升 26%。
5/22/2025 1:40:21 PM

vivo 官网 APP 首页端智能业务实践

一、前言vivo官网APP首页是流量最大的页面,承载着新品、活动、商品、其他入口等流量分发的重任。 在流量分发上,云端针对首页的主要场景建设了算法支撑。 通过梳理首页的场景发现,智能硬件楼层场景的商品配置还是运营纯手工动态配置,而非算法推荐。
5/22/2025 9:18:14 AM
Li Quanlong

突发!OpenAI以64亿美元,收购iPhone设计师公司io

今天凌晨1点,CNBC消息,OpenAI将以64亿美元全资收购,前苹果iPhone设计师乔尼・艾维的AI设备初创公司io,这一交易将推动OpenAI进军硬件领域。 收购完成后,艾维并入OpenAI内部,并承担OpenAI和io的深度创意与设计职责,同时艾维的创意团队Love From将保持独立。 OpenAI表示,此次交易将支付50亿美元,因为其已持有该公司23%的股份。
5/22/2025 9:16:00 AM

57.6万代码撕碎AI编程神话,20%「幽灵包」暗藏漏洞!苹果、微软已中招

最近,扎克伯格表示,Meta正在内部开发专门用于编程和AI研究的智能体——这些并不是通用型工具,而是为提升 Meta自家AI项目(如 LLaMA)量身定制的专用智能体。 他预测,在未来的12到18个月内,Meta用于AI开发的大部分代码将不再由人类编写,而是由AI智能体生成。 微软首席技术官Kevin Scott的预测更长远,但更大胆。
5/22/2025 9:13:47 AM

陶哲轩联手AI挑战经典ε-δ极限!加法秒杀、乘法翻车

数学大师陶哲轩的AI新实验来了! 这次是Lean 4自动化数学证明的第三支视频。 主要看看GitHub Copilot在处理分析学经典的「ε-δ」问题(描述函数极限的经典方法)时,效果究竟如何。
5/22/2025 9:08:40 AM

12秒生成1万token!谷歌推出文本「扩散模型」Gemini Diffusion,研究员:演示都得降速看

谷歌又放新大招了,将图像生成常用的“扩散技术”引入语言模型,12秒能生成1万tokens。 什么概念? 不仅比Gemini 2.0 Flash-Lite更快。
5/22/2025 9:08:00 AM

ACL 2025 | 大模型乱试错、盲调用?KnowSelf让智能体有「知识边界感知」能力

在 AI 领域,大模型智能体的发展日新月异。 我们今天要介绍的这篇 ACL 2025 论文——《Agentic Knowledgeable Self-awareness》,聚焦于如何提升智能体的「知识边界感知」能力,使其在复杂任务规划中更加得心应手,为智能体的可靠应用提供了新思路。 论文标题:Agentic Knowledgeable Self-awareness论文链接:: 秒速读版本KnowSelf 聚焦于大模型智能体在决策过程中所面临的「知识边界感知」问题。
5/22/2025 9:07:00 AM

英伟达让机器人「做梦学习」,靠梦境实现真·从0泛化

「仿生人会梦见电子羊吗? 」这是科幻界一个闻名遐迩的问题。 现在英伟达给出答案:Yes!
5/22/2025 9:06:00 AM

OpenAI放大招!核心API支持MCP,一夜改变智能体开发

今天凌晨,OpenAI全资收购io的消息占据了大部分头条。 同时OpenAI也“悄悄地”放出了另外一个重磅消息,用于开发智能体的核心API——Responses API支持MCP服务。 传统方法,我们在开发智能体需要通过函数调用与外部服务交互,每次操作都涉及从大模型到后端再到外部服务的网络传输,导致多次跳转、延迟会很高,并增加扩展和管理的复杂性。
5/22/2025 8:55:03 AM

如何基于自定义MCP服务器构建支持工具调用的Llama智能体(含code)

一、背景与目标:从知识隔离到本地化智能体在人工智能应用日益普及的今天,隐私保护与数据主权成为重要挑战。 传统的AI模型依赖外部服务,导致私有知识面临泄露风险。 本文将详细介绍如何构建一个完全本地化的AI智能体,通过自定义的Model Context Protocol(MCP)服务器实现知识隔离,并结合Llama 3.2轻量级模型实现工具调用能力。
5/22/2025 8:51:48 AM
大模型之路

Dia-1.6B TTS:优秀的文本到对话生成模型

译者 | 李睿审校 | 重楼Dia-1.6B TTS是由Nari Labs开发的一款拥有16亿个参数的文本转语音模型(TTS)。 本文将详细介绍该模型,以及其访问途径、使用方法,并展示实际应用结果以真正了解该模型的功能。 你是否正在寻求一种合适的文本转语音模型?
5/22/2025 8:05:00 AM
李睿

当心:AI 真的在抢你的工作!​

译者 | 陈峻审校 | 重楼你也许是被本文的标题吸引进来,而且感觉不寒而栗。 这实际上是全球性的自由职业在线平台 Fiverr 的 CEO 在给其全体员工的一封电子邮件中,所描述的一个严酷事实。 而且这并非个案。
5/22/2025 8:00:00 AM
陈峻

100行代码速通Agent开发

大家好,我卡颂自从23年初GPT爆火后,每年都会涌现一些爆火的AI概念。 今年最火的概念无疑是Agent。 伴随而来的,是各家都在争夺「Agent的解释权」:openAI发布a-practical-guide-to-building-agents[1]Antropic发布building-effective-agents[2]langchain作者发文how-to-think-about-agent-frameworks[3]反驳openAI的观点(目的是推销自家的langGraph)这些繁杂的信息无疑加深了开发者对Agent的理解成本。
5/22/2025 7:40:32 AM
卡颂