AI在线 AI在线

理论

AI Agent 五大工作模式详解

在AI Agent的架构设计中,工作模式决定了智能体如何规划、执行任务并优化自身行为。 本文将深入解析五大主流工作模式:提示链 (Prompt Chaining)、路由 (Routing)、并行化 (Parallelization)、协调者-工作者 (Orchestrator-Workers) 和 **评估者-优化者 (Evaluator-Optimizer)**,通过技术图解与实例揭示其运作机制。 一、提示链 (Prompt Chaining):分步拆解的思维链核心思想:将复杂任务拆解为顺序执行的子任务链,前一步输出作为后一步输入,形成推理流水线。
6/3/2025 1:43:00 AM
程序员秋天

轻松配置Cursor玩转MCP,你学会了吗?

我们来看如何配置 Cursor。 需要注意,低版本 Cursor 也支持 MCP 服务,我用的是 0.48.7 版本。 在 Cursor 设置中,先将版本切换到 Early Access(抢先体验)。
6/3/2025 1:25:00 AM
程序员NEO

构建强大AI Agent的关键 = Pydantic AI + MCP + Advanced Web Scraping

引言在文中,我将展示一个超快速教程,教你如何使用 Pydantic AI、MCP 和高级网页抓取技术,构建一个强大的智能聊天机器人,适用于商业或个人用途。 MCP 逐渐被接受,因为它是一个开放标准。 我制作了一些非常酷的视频,你一定会喜欢。
6/3/2025 1:04:00 AM
AI研究生

AI辅助编程工具深度评测与企业选型指南

今天继续分享Google DeepResearch的AI编程工具研发分析报告。 具体的提示语如下:请对Cursor,Winsurf, Copilot,Augument 四款AI辅助编程工具进行详细分析和研究和评测。 需要从功能(核心是编程能力,上下文长度支持等),效率性能,质量,成本,易用性,开放性(mcp协议适配),差异化亮点多方面进行分析和研究。
6/3/2025 1:00:00 AM

阿里发布 QwenLong-L1 超长文本杀器!已开源、支持 120k 长上下文、具备“翻书回溯”能力

业界普遍认为AI上下文越长越好,但这存在一个核心矛盾:模型能“吞下”海量信息,却难以真正“消化”。 面对长文,它们会忘记要点、无法深入推理,这已成为一大瓶颈。 例如,AI 能记住第1页的内容,同时理解第100页的观点,并将两者联系起来进行推理吗?
6/3/2025 12:00:09 AM

十大最酷的开源 Node.js AI 项目

大家好! JavaScript AI = 纯粹的疯狂。 以前总觉得做 AI 必须得进 Python 世界……没想到 Node.js 也在迅速崛起,简直逆天。
6/3/2025 12:00:01 AM
前端小智

100+ 必备 AI 工具,每周帮你省 150 小时以上

说实话——我们大多数人都被工作压得喘不过气。 邮件、会议、写作、设计,还有那些占据你一天的大大小小琐事……很容易就陷入了“仓鼠轮”循环。 但好消息是,有办法跳出这个怪圈。
6/3/2025 12:00:00 AM
前端小智

投资回报率几何?AI的失败促使CEO们重新思考其应用

根据IBM商业价值研究院对CEO们的调查,近年来仅有25%的AI计划达到了ROI预期,同时,仅有16%的AI项目在企业范围内得到了全面推广。 部分问题在于,企业并不清楚自己将要面对什么,近三分之二的CEO承认,在尚未明确了解其价值之前,对错失新技术的恐惧就驱动了投资,这往往导致为了ROI而匆忙推进AI项目,或仅为了展示而启动项目,这两种做法都难以成功。 见证了过去两年半AI淘金热的IT专家们,对AI项目表现平平并不感到惊讶。
6/3/2025 12:00:00 AM
Grant Gross

谷歌野心藏不住!劈柴哥放话:AI比互联网更颠覆!智能体将打造新的中间平台生态;记者:Chrome被卖了咋办?

出品 | 51CTO技术栈(微信号:blog51cto)I/O大会,谷歌用Gmini 2.5 Pro、Veo 3证明了自己在AI领域的绝对实力。 刚刚,知名科技媒体Verge放出了谷歌CEO劈柴哥的采访,看完发现——谷歌的AI逆袭绝非偶然! 在24年,谷歌还在被OpenAI追着打的时候,劈柴哥就曾表示大厂的AI竞争并非一朝一夕之功,如果眼光放长远些,短期内谁领先、谁落后,其实并不重要。
5/31/2025 9:32:35 PM
伊风

美团开放AI代码工具,零代码实现全栈能力,项目负责人揭秘架构细节

一句话,呈所想。 谁都没有想到,如此实用的 AI 代码生成工具,竟是出自美团。 上周,有媒体曝出了美团的 AI 零代码工具 NoCode,这是一款无需编程背景和经验,仅通过自然语言和对话形式即可快速生成应用的工具。
5/30/2025 3:59:41 PM

多模态扩散模型开始爆发,这次是高速可控还能学习推理的LaViDa

近段时间,已经出现了不少基于扩散模型的语言模型,而现在,基于扩散模型的视觉-语言模型(VLM)也来了,即能够联合处理视觉和文本信息的模型。 今天我们介绍的这个名叫 LaViDa,继承了扩散语言模型高速且可控的优点,并在实验中取得了相当不错的表现。 现目前,几乎所有流行的 VLM 都是基于大型语言模型(LLM)构建的,而这些模型采用的范式是自回归(AR),即按照从左到右的顺序逐一生成 token。
5/30/2025 3:54:16 PM

大模型智能体如何突破规模化应用瓶颈,核心在于Agentic ROI

本文第一作者为上海交通大学计算机学院副教授刘卫文,研究方向为大模型智能体,大语言模型,个性化算法等。 近年来,随着大语言模型的快速发展,基于其构建的大模型智能体(LLM Agents)正逐步从技术演示走向实际应用部署。 然而,真正实现规模化应用仍面临诸多瓶颈。
5/30/2025 3:53:27 PM

谷歌之后,英伟达入局扩散大语言模型,Fast-dLLM推理速度狂飙27.6倍

在大语言模型(LLM)领域,推理效率是制约其实际应用的关键因素之一。 谷歌 DeepMind 的 Gemini diffusion 曾以 1400 tokens / 秒的生成速度震惊学界,展现了扩散模型在并行生成上的潜力。 然而,开源扩散 LLM 却因缺乏 KV 缓存机制和并行解码质量衰退,实际推理速度长期被自回归模型压制.近日,NVIDIA 联合香港大学、MIT 等机构重磅推出 Fast-dLLM,以无需训练的即插即用加速方案,实现了推理速度的突破!
5/30/2025 3:52:05 PM

Google 的 Agent2Agent(A2A)框架详解

作者 | Nirdiamant编辑 | 云昭出品 | 51CTO技术栈(微信号:blog51cto)MCP,市面上已经有不少干货解读了,但作为经常被拿来对比的 A2A,内容却很少,今天为大家详细解读下 A2A 的架构。 想象你走进一个繁忙的办公室,才华横溢的专家们正在处理各类复杂项目。 一个角落里,研究分析师在挖掘数据;旁边,设计专家在绘制视觉方案;另一边,物流协调员在安排货运。
5/30/2025 2:59:36 PM
云昭

专治AI生图「人脸崩坏」,8倍速碾压GPT!新版FLUX.1多方位刷新SOTA

用AI生成&编辑图片时,想生成一套完整故事模板,结果主角「变脸」比翻书还快,这可怎么办? 别慌,全新图像模型FLUX.1 Kontext来了! 支持上下文内图像生成,可以同时使用文本和图像进行提示,并能够无缝提取和修改视觉概念,从而生成新的、连贯的图像。
5/30/2025 2:28:10 PM
新智元

AI生图大洗牌!流匹配架构颠覆传统,一个模型同时接受文本和图像输入

AI生图新突破! 一个模型同时接受文本和图像输入。 新模型FLUX.1 Kontext使用流匹配架构(Flow Matching),不再是文本编码器和扩散模型各干各的,与此前技术都不同。
5/30/2025 2:22:00 PM

LLM可以在没有采用强化学习或大型数据集的情况下学习推理吗?

译者 | 李睿审校 | 重楼针对提升LLM推理能力面临的挑战,斯坦福大学研究人员提出了“思考、修剪、训练”(TPT)框架,让LLM利用自生成且验证正确的数据迭代优化。 研究表明,无需强化学习、大型数据集或外部教师模型,TPT可以使较小模型推理性能媲美甚至超越大模型,凸显了TPT框架在提升模型推理能力和准确性的潜力。 目前,缺乏高质量的训练数据仍然是提高大型语言模型(LLM)推理能力的主要障碍之一。
5/30/2025 10:50:27 AM
李睿

更新改造遗留代码库:AI辅助的代码解读开发者指南

译者 | 布加迪审校 | 重楼遗留代码库给现代开发团队带来了独特的挑战。 无论你是在处理十年前的单体应用程序,还是试图更新改造电商平台,了解和更新遗留代码带来的复杂性都会大大影响开发速度。 本文提供了有效浏览、了解和更新改造遗留系统的实用策略和技术方法。
5/30/2025 10:34:00 AM
布加迪