理论
基于Gemini与Qdrant构建生产级RAG管道:设计指南与代码实践
一、RAG技术的核心价值与应用场景在人工智能领域,检索增强生成(Retrieval-Augmented Generation, RAG)正成为解决大语言模型(LLM)知识更新滞后、生成内容不可追溯等问题的关键技术。 传统的微调(Fine-Tuning)方法将知识固化在模型参数中,难以应对动态领域的快速变化;而RAG通过将检索与生成解耦,实现了知识的实时更新与可追溯性,尤其适用于政策频繁变动、对准确性要求极高的场景,如医疗、法律和航空管理。 本文以构建机场智能助理为例,结合Google的Gemini多模态模型与Qdrant向量数据库,详细阐述如何设计并实现一个高可靠、可扩展的生产级RAG管道。
6/3/2025 2:55:00 AM
大模型之路
RAG中基于图的重排序:利用图神经网络革新信息检索(含代码)
一、信息检索的演进与图重排序的崛起在大数据与人工智能技术爆发的时代,信息检索(IR)系统面临着前所未有的挑战:用户查询日益复杂,跨领域知识需求激增,传统基于词法匹配或单一语义向量的检索模型逐渐暴露局限性。 两阶段检索架构——初始检索与重排序——虽已成为主流,但第一阶段的快速检索常因忽略文档间关联而引入噪声,第二阶段的传统重排序器(如交叉编码器)又难以捕捉结构化知识与全局语义关系。 在此背景下,基于图的重排序(Graph-Based Re-ranking)技术应运而生,通过图神经网络(GNN)建模文档、实体与查询间的复杂关系,为信息检索领域注入了全新的活力。
6/3/2025 2:11:00 AM
大模型之路
AI Agents vs Agentic AI:有何区别?为何如此重要?
如果你最近一直在关注 AI,你可能听说过 “AI Agents” 和 “Agentic AI” 这两个术语。 虽然它们听起来像是高深的科技术语,但实际上指的是两种不同类型的人工智能,它们都对我们的世界产生了巨大的影响。 它们究竟是什么?
6/3/2025 1:55:00 AM
架构精进之路
AI Agent 五大工作模式详解
在AI Agent的架构设计中,工作模式决定了智能体如何规划、执行任务并优化自身行为。 本文将深入解析五大主流工作模式:提示链 (Prompt Chaining)、路由 (Routing)、并行化 (Parallelization)、协调者-工作者 (Orchestrator-Workers) 和 **评估者-优化者 (Evaluator-Optimizer)**,通过技术图解与实例揭示其运作机制。 一、提示链 (Prompt Chaining):分步拆解的思维链核心思想:将复杂任务拆解为顺序执行的子任务链,前一步输出作为后一步输入,形成推理流水线。
6/3/2025 1:43:00 AM
程序员秋天
轻松配置Cursor玩转MCP,你学会了吗?
我们来看如何配置 Cursor。 需要注意,低版本 Cursor 也支持 MCP 服务,我用的是 0.48.7 版本。 在 Cursor 设置中,先将版本切换到 Early Access(抢先体验)。
6/3/2025 1:25:00 AM
程序员NEO
构建强大AI Agent的关键 = Pydantic AI + MCP + Advanced Web Scraping
引言在文中,我将展示一个超快速教程,教你如何使用 Pydantic AI、MCP 和高级网页抓取技术,构建一个强大的智能聊天机器人,适用于商业或个人用途。 MCP 逐渐被接受,因为它是一个开放标准。 我制作了一些非常酷的视频,你一定会喜欢。
6/3/2025 1:04:00 AM
AI研究生
AI辅助编程工具深度评测与企业选型指南
今天继续分享Google DeepResearch的AI编程工具研发分析报告。 具体的提示语如下:请对Cursor,Winsurf, Copilot,Augument 四款AI辅助编程工具进行详细分析和研究和评测。 需要从功能(核心是编程能力,上下文长度支持等),效率性能,质量,成本,易用性,开放性(mcp协议适配),差异化亮点多方面进行分析和研究。
6/3/2025 1:00:00 AM
阿里发布 QwenLong-L1 超长文本杀器!已开源、支持 120k 长上下文、具备“翻书回溯”能力
业界普遍认为AI上下文越长越好,但这存在一个核心矛盾:模型能“吞下”海量信息,却难以真正“消化”。 面对长文,它们会忘记要点、无法深入推理,这已成为一大瓶颈。 例如,AI 能记住第1页的内容,同时理解第100页的观点,并将两者联系起来进行推理吗?
6/3/2025 12:00:09 AM
十大最酷的开源 Node.js AI 项目
大家好! JavaScript AI = 纯粹的疯狂。 以前总觉得做 AI 必须得进 Python 世界……没想到 Node.js 也在迅速崛起,简直逆天。
6/3/2025 12:00:01 AM
前端小智
100+ 必备 AI 工具,每周帮你省 150 小时以上
说实话——我们大多数人都被工作压得喘不过气。 邮件、会议、写作、设计,还有那些占据你一天的大大小小琐事……很容易就陷入了“仓鼠轮”循环。 但好消息是,有办法跳出这个怪圈。
6/3/2025 12:00:00 AM
前端小智
投资回报率几何?AI的失败促使CEO们重新思考其应用
根据IBM商业价值研究院对CEO们的调查,近年来仅有25%的AI计划达到了ROI预期,同时,仅有16%的AI项目在企业范围内得到了全面推广。 部分问题在于,企业并不清楚自己将要面对什么,近三分之二的CEO承认,在尚未明确了解其价值之前,对错失新技术的恐惧就驱动了投资,这往往导致为了ROI而匆忙推进AI项目,或仅为了展示而启动项目,这两种做法都难以成功。 见证了过去两年半AI淘金热的IT专家们,对AI项目表现平平并不感到惊讶。
6/3/2025 12:00:00 AM
Grant Gross
谷歌野心藏不住!劈柴哥放话:AI比互联网更颠覆!智能体将打造新的中间平台生态;记者:Chrome被卖了咋办?
出品 | 51CTO技术栈(微信号:blog51cto)I/O大会,谷歌用Gmini 2.5 Pro、Veo 3证明了自己在AI领域的绝对实力。 刚刚,知名科技媒体Verge放出了谷歌CEO劈柴哥的采访,看完发现——谷歌的AI逆袭绝非偶然! 在24年,谷歌还在被OpenAI追着打的时候,劈柴哥就曾表示大厂的AI竞争并非一朝一夕之功,如果眼光放长远些,短期内谁领先、谁落后,其实并不重要。
5/31/2025 9:32:35 PM
伊风
美团开放AI代码工具,零代码实现全栈能力,项目负责人揭秘架构细节
一句话,呈所想。 谁都没有想到,如此实用的 AI 代码生成工具,竟是出自美团。 上周,有媒体曝出了美团的 AI 零代码工具 NoCode,这是一款无需编程背景和经验,仅通过自然语言和对话形式即可快速生成应用的工具。
5/30/2025 3:59:41 PM
多模态扩散模型开始爆发,这次是高速可控还能学习推理的LaViDa
近段时间,已经出现了不少基于扩散模型的语言模型,而现在,基于扩散模型的视觉-语言模型(VLM)也来了,即能够联合处理视觉和文本信息的模型。 今天我们介绍的这个名叫 LaViDa,继承了扩散语言模型高速且可控的优点,并在实验中取得了相当不错的表现。 现目前,几乎所有流行的 VLM 都是基于大型语言模型(LLM)构建的,而这些模型采用的范式是自回归(AR),即按照从左到右的顺序逐一生成 token。
5/30/2025 3:54:16 PM
大模型智能体如何突破规模化应用瓶颈,核心在于Agentic ROI
本文第一作者为上海交通大学计算机学院副教授刘卫文,研究方向为大模型智能体,大语言模型,个性化算法等。 近年来,随着大语言模型的快速发展,基于其构建的大模型智能体(LLM Agents)正逐步从技术演示走向实际应用部署。 然而,真正实现规模化应用仍面临诸多瓶颈。
5/30/2025 3:53:27 PM
谷歌之后,英伟达入局扩散大语言模型,Fast-dLLM推理速度狂飙27.6倍
在大语言模型(LLM)领域,推理效率是制约其实际应用的关键因素之一。 谷歌 DeepMind 的 Gemini diffusion 曾以 1400 tokens / 秒的生成速度震惊学界,展现了扩散模型在并行生成上的潜力。 然而,开源扩散 LLM 却因缺乏 KV 缓存机制和并行解码质量衰退,实际推理速度长期被自回归模型压制.近日,NVIDIA 联合香港大学、MIT 等机构重磅推出 Fast-dLLM,以无需训练的即插即用加速方案,实现了推理速度的突破!
5/30/2025 3:52:05 PM
Google 的 Agent2Agent(A2A)框架详解
作者 | Nirdiamant编辑 | 云昭出品 | 51CTO技术栈(微信号:blog51cto)MCP,市面上已经有不少干货解读了,但作为经常被拿来对比的 A2A,内容却很少,今天为大家详细解读下 A2A 的架构。 想象你走进一个繁忙的办公室,才华横溢的专家们正在处理各类复杂项目。 一个角落里,研究分析师在挖掘数据;旁边,设计专家在绘制视觉方案;另一边,物流协调员在安排货运。
5/30/2025 2:59:36 PM
云昭
专治AI生图「人脸崩坏」,8倍速碾压GPT!新版FLUX.1多方位刷新SOTA
用AI生成&编辑图片时,想生成一套完整故事模板,结果主角「变脸」比翻书还快,这可怎么办? 别慌,全新图像模型FLUX.1 Kontext来了! 支持上下文内图像生成,可以同时使用文本和图像进行提示,并能够无缝提取和修改视觉概念,从而生成新的、连贯的图像。
5/30/2025 2:28:10 PM
新智元
资讯热榜
标签云
AI
人工智能
OpenAI
AIGC
模型
ChatGPT
DeepSeek
谷歌
AI绘画
机器人
数据
大模型
Midjourney
开源
智能
Meta
用户
微软
GPT
学习
技术
AI新词
图像
Gemini
智能体
马斯克
AI创作
Anthropic
英伟达
论文
训练
代码
算法
LLM
Stable Diffusion
芯片
腾讯
苹果
蛋白质
Claude
开发者
AI for Science
Agent
生成式
神经网络
机器学习
3D
xAI
研究
人形机器人
生成
AI视频
百度
工具
计算
Sora
GPU
华为
大语言模型
RAG
具身智能
AI设计
字节跳动
搜索
大型语言模型
场景
AGI
深度学习
视频生成
预测
视觉
伟达
架构
Transformer
编程
神器推荐
DeepMind
亚马逊
特斯拉
AI模型