AI在线 AI在线

AI智能体

大模型+矢量数据库:为AI智能体构建内存架构

译者 | 陈峻审校 | 重楼目前,数据科学家们已经熟悉了那些以不同的文件格式作为处理输入与输出的各类机器学习模型。 在大多数情况下,人工智能智能体(AI agent)都需要通过维护上下文,从人机交互中学习,以及按需访问其他模型无法处理的海量知识存储。 这无疑需要庞大的内存架构。
10/24/2025 8:00:00 AM
陈峻

AI智能体的未来要等十年?Karpathy直言目前的技术还很 “菜”!

近日,OpenAI 的联合创始人 Andrej Karpathy 对 AI 智能体的发展现状提出了严厉的批评。 他指出,尽管 AI 技术在迅速发展,但目前的智能体依然 “不够用”。 在一次采访中,他坦言:“现在的智能体智能水平较低,缺乏多模态能力,无法真正操作电脑,更谈不上持续学习。
10/20/2025 10:17:21 AM
AI在线

AI智能体正在悄悄改变你的工作方式,90%的人还没意识到

从ChatGPT的爆火到各类AI工具和Agent的涌现,我们正站在一个临界点:AI不再只是聊天工具,而是进化成能够独立思考和行动的数字员工。  在这个临界点之上,90%的人还没意识到:AI智能体正在悄悄改变你的工作方式! 很多人把大模型比作AI的大脑,这个比喻很形象,但不够完整。
10/16/2025 4:00:00 AM
大数据AI智能圈

AI 智能体写代码靠谱吗?GitHub 上 567 个 PR 的实证告诉你真相

大家好,我是肆〇柒。 近期 AI 编程工具如 Claude Code 越来越火,但很多人心里打鼓:AI 自动生成的代码真能被开源项目接受吗? 会不会全是“花架子”?
10/11/2025 9:35:05 AM
肆零柒

用四大章节,总结AI智能体交互设计的高频问题

过去一年里我带领我的 UI 小伙伴深耕 AI agent 领域,在人机对话的细节里摸爬滚打,攒下了一些带实战温度的 EXP,趁着有更新的热情分享给大家。 和传统交互不同,AI 智能体的设计处处藏着 “反常识” 的坑:精心设计的表单,使用体验却很割裂;花心思做的图文混排卡片,反而让对话逻辑变得混乱;自以为贴心的预输入提示词,要么被用户忽略,要么限制了真实需求的表达……. 今天我把这些踩过的坑拆解成具体场景 ,希望这些经验能帮 UI 小伙伴少走些弯路,毕竟让 AI 智能体真正 “懂用户、好用、不添乱”,需要在一次次的试错里摸索出更清晰的解决方案。
10/7/2025 12:37:21 AM
MoeDesigner

从写代码到写规则:SASE框架下,人类如何成为AI智能体的“教练”

大家好,我是肆〇柒。 今天我们要探讨的,是来自加拿大皇后大学(Queen’s University)Ahmed E. Hassan教授团队的一项前沿研究。
9/25/2025 2:35:43 PM
肆零柒

慧灵科技亮相工博会:打造“具身智能产业基座”,推动智能体落地

在工业智能的赛道上,有的企业专注机器人单品,有的深耕软件算法,而慧灵科技(HITBOT)选择了一条更底层、更长远的路径——打造 “软件 硬件”的产业基座。 作为“具身智能产业基座”的开拓者,慧灵通过操作系统与模块化硬件的深度融合,既让机器人拥有认知、理解、决策能力的“大脑”——HITBOT OS,也提供了从机械臂、电动夹爪到灵巧手等坚实的“身体”底盘。 正是“大脑 身体”的结合,慧灵科技推动智能体在场景中实现完整闭环,把“能思考”与“会行动”融为一体,从而推动科研、产线和服务场景的快速落地。
9/24/2025 3:56:11 PM
十三

ReSum:让AI智能体学会“记笔记”,突破长程推理瓶颈

大家好,我是肆〇柒。 本文分享的这篇工作来自通义实验室(Tongyi Lab, Alibaba Group)的最新研究成果——ReSum。 他们提出了一种全新的推理范式,让大模型智能体在面对复杂问题时,能够像人类一样“停下来复盘、做笔记”,从而突破传统上下文长度限制,实现真正意义上的长程探索。
9/24/2025 9:10:24 AM
肆零柒

牛津&SH AI lab万字综述:Agentic RL——下一代企业级AI智能体的终极路线图

大家好,我是肆〇柒。 今天我们一起看一篇综述,这是来自牛津大学、上海人工智能实验室、新加坡国立大学等全球顶尖机构联合发布的前沿综述——《The Landscape of Agentic Reinforcement Learning for LLMs: A Survey》。 这篇论文系统性地梳理了如何通过强化学习,将大语言模型从被动的文本生成器,重塑为主动的、能解决复杂现实问题的决策智能体。
9/12/2025 3:47:50 PM
肆零柒

工具为谁而造?AI Agentic Programming 的“元挑战”与破局

大家好,我是肆〇柒。 今天,我们不聊技术的表象,而是探讨一个正在重塑软件开发未来的核心议题。 这篇深度解析,源自英国利兹大学(University of Leeds)的综述《AI Agentic Programming: A Survey of Techniques, Challenges, and Opportunities》。
8/29/2025 9:33:19 AM
肆零柒

MCP的60%成功率瓶颈:LiveMCP-101揭示AI智能体在真实场景中的失败根源

大家好,我是肆〇柒。 今天要和大家分享的是由杜克大学(Duke University)和Zoom视频通信公司(Zoom Video Communications)联合研究团队最新发布的LiveMCP-101基准测试研究。 这项研究首次系统性地评估了AI智能体在真实动态环境中的多步骤任务执行能力,揭示了即使是最前沿的GPT-5在处理复杂现实任务时成功率也不足60%的关键发现,为行业提供了突破方向的精确坐标。
8/25/2025 9:39:57 AM
肆零柒

如果有一个能替你操作手机的Agent,你会用它做什么?

往期作者干货:如果你有一个能替你操作手机的 Agent,你会用它来做什么? 替自己回复微信消息? 下单中午想吃的外卖?
8/23/2025 12:28:55 AM
一泽Eze

AI驱动电子表格平台Paradigm获500万美元种子轮融资 配备5000个AI智能体

在"AI智能体"这个概念还未兴起的时候,安娜·摩纳哥就已经开始构建AI智能体产品。 在开发了众多聊天机器人后,她开始寻找适合AI智能体的其他交互界面,最终将目光锁定在电子表格上。 摩纳哥向TechCrunch表示:"我有一个个人使用习惯,也注意到很多其他人都有这样的习惯,就是将非常重要的CRM数据放在电子表格中,因为这是最灵活的工具。
8/19/2025 10:47:00 AM
AI在线

智能体“模态之战”:谁将主宰云基础设施管理“AIOps”的未来?

大家好,我是肆〇柒。 云基础设施日益复杂,智能体能否真正成为DevOps工程师的得力助手? AI 应用于生产系统运维是行业在持续探索的领域,我看到一篇由密歇根大学、UC Berkeley、安德森·霍洛维茨等机构的联合研究《Cloud Infrastructure Management in the Age of AI Agents》,其中深入分析了智能体在SDK、CLI、IaC和ClickOps四种云管理模态中的实际表现。
8/14/2025 9:38:16 AM
肆零柒

AI Agent哪个更好用?12个角度深度对比测评三大知名工具

在数字化转型的浪潮中,AI Agent 工具正成为企业提升效率、优化流程的关键利器。 然而,面对众多选择,如何挑选最适合的工具成为了一个难题。 本文将深入剖析 Dify、N8n 和 Coze 这三款热门 AI Agent 工具,从功能、价格、学习成本、技术架构到实际应用场景,全方位对比它们的优劣,帮助你在选型时避坑,找到最适合自己的工具。
8/8/2025 7:29:52 AM
A ad钙

AI Agent哪个更好用?12个角度全方位深度分析Dify、N8n、Coze三大工具

在数字化转型的浪潮中,AI Agent 工具正成为企业提升效率、优化流程的关键利器。 然而,面对众多选择,如何挑选最适合的工具成为了一个难题。 本文将深入剖析 Dify、N8n 和 Coze 这三款热门 AI Agent 工具,从功能、价格、学习成本、技术架构到实际应用场景,全方位对比它们的优劣,帮助你在选型时避坑,找到最适合自己的工具。
8/8/2025 7:29:52 AM
A ad钙

Lovart 实战深度测评!仅需4小时帮你完成一整套品牌全案设计!

大家好,我是三石。 公司去年有做过一个茉莉花茶的包装设计,本着试试看的态度,我想看看 Lovart 能实现到什么程度,能帮助各位设计师带来怎么的工作提效。 本次测试大概花费 4 小时,最后的成品有图片和视频,我先把视频给大家看下,这个茉莉香氛的商拍视频。
7/26/2025 7:27:43 AM
Conor

碾压ChatGPT Agent:深度测评国产AI智能体神器MiniMax Agent

上周五,ChatGPT Agent mode 上线了。 之前一直有点偷懒,也嫌贵,嫌麻烦,没咋做 Agent 的对比,这次真的想好好评测一下,让我自己有一个认知,于是花了一天的时间,构建了一些我自己的任务。 拿去测一下各家通用 Agent 的情况。
7/24/2025 12:16:19 AM
数字生命卡兹克