AI在线 AI在线

2025年,AI Agent还会是风口吗?11个问题揭秘智能体技术发展全貌

2024年,AI智能体技术无疑是科技界的焦点。 通过对来自100多个国家的3400名开发者进行深入调查,Langbase公司近日发布的一项报告揭示了智能体开发中的关键问题。 这项调查的受访者中,有46%是企业领导层,26%是工程师。

2024年,AI智能体技术无疑是科技界的焦点。

通过对来自100多个国家的3400名开发者进行深入调查,Langbase公司近日发布的一项报告揭示了智能体开发中的关键问题。这项调查的受访者中,有46%是企业领导层,26%是工程师。

Langbase专注于提供无服务器的AI云开发体验。作为一个提供可组合基础设施的AI平台,他们在2024年一共处理了来自3.6万开发人员的1840亿个token和7.86亿个API请求。

提起Langbase这个名字,你也许不太熟悉。事实上,这家公司非常年轻,2023年刚刚成立。

图片

根据Crunchbase披露的数据,他们刚刚才在9月份进行了pre-seed轮融资,但已经得到了谷歌、苹果、OpenAI、微软等大厂高管们的资金支持。

下面就让我们一起来看看这家年轻有为的Langbase发布的这份图文并茂的报告中究竟提到了哪些内容。

问题1:开发者在使用哪些基座大模型

在这场AI智能体的竞赛中,OpenAI的大模型服务占据了主导地位,但谷歌正迅速崛起,成为其强劲的竞争对手,Anthropic紧随其后。

其中,Meta的Llama、Mistral和Cohere虽然影响力较小,但增长势头不容忽视,显示出基座大模型市场的激烈竞争。

图片

问题2:不同大模型对应的的具体用途

OpenAI在翻译任务中被广泛应用,Anthropic在技术任务中备受青睐,而谷歌的模型在健康和翻译领域占据主导地位。

此外,Meta在科技和科学应用中得到了广泛使用,Cohere也在多个领域得到重视,包括科学和营销。

图片

问题3:哪些因素阻碍了你对大模型技术的应用

在模型的扩展和部署中,数据隐私和安全合规性成为主要关注点,「缺乏监控工具」和「高基础设施成本」这两项因素也阻碍了技术的落地应用。

对AI驱动解决方案的抵制或怀疑反映了使用者们的长期顾虑,这表明,模型和技术的提供商们需要更加透明和用户友好的AI平台。

图片

问题4:哪些因素影响大模型的选择

在选择大型语言模型(LLM)时,准确性是最重要的因素,其次是安全性和可定制性,成本的影响相对较小。

图片

问题5:在部署大模型时,你遇到的最大挑战是什么?

在生产环境中部署大模型和智能体面临着种种关键挑战,包括定制困难、质量保证评估方法有限,以及缺乏可重用的基础设施。

此外,工具碎片化、集成问题和可扩展性等方面的顾虑进一步复杂化了这个过程。

图片

问题6:采用大模型技术时,你的主要目标是什么?

「自动化」和「简化」是AI应用的首要任务,使公司在效率和流程简化方面受益;此外,定制解决方案和提升合作流程等方面的目标,反映了大模型日益增长的灵活性,以及消费者对系统共享访问的兴趣。

图片

问题7:您的公司如何使用大模型智能体?

LLM在软件开发中得到广泛应用,尤其在市场营销、IT运营和文本摘要等方面,客服、人力资源和法律领域的使用兴趣也在日益增长。

图片

问题8:那些平台特征对你至关重要

大多数受访者都需要多智能体检索增强生成(RAG)功能以提高上下文信息处理,同时,评估工具对于确保人工智能系统按预期工作也很重要。

图片

问题9,在编排AI流水线时,开发者偏好哪种工具

大多数受访者更喜欢能提供灵活、基础原语的开发工具以设计定制AI流水线(pipeline)。预构建的、针对特定问题的解决方案虽然可以直接解决具体问题,但它们的可定制性较低。

图片

问题10:什么因素影响大模型智能体开发工具的选择

开发者将AI智能体的版本控制视为开发平台最重要的功能。强大的SDK或库生态系统以及本地开发环境也受到重视。

图片

问题11:大模型在公司中的应用程度

大多数开发者将 AI 用于实验和生产。相比之下,实验用途的比例远远大于生产用途,但后者的比例仍在稳步前进的过程中。

图片

随着AI智能体基础设施的成熟,越来越多的企业会尝试开发智能体,而随着多模态及大模型操作计算环境(例如Claude通过接口在线互动)的发展,智能体在2025年的应用将更加广泛,甚至不仅仅局限于报告中提到的软件开发、市场营销、IT运营和文本摘要等领域。

然而,该调查中揭示的开发者关注的问题,例如更看重准确性、安全性和可定制性,而成本因素影响较小,以及偏好灵活、可定制的AI流水线开发工具,并重视AI智能体版本控制功能。

无论技术怎么进步,这份调查结果都会对智能体平台及开发者有参考价值。

参考资料:

https://langbase.com/state-of-ai-agents?genai

https://x.com/MrAhmadAwais/status/1866483416981786821

相关资讯

全网爆火的Manus到底能做什么?超多演示案例来了!

关注科技 AI 圈的同学,在 3 月 6 号这天都被 Manus 刷屏了,那么他是个啥呢? 和 DeepSeek 和 Open AI 有什么区别呢? Manus 官网上是这样说的“Manus 是一个通用的人工智能代理,它连接思想和行动:它不仅会思考,还会提供结果。
3/11/2025 12:54:46 AM
益达

速通BOSS需求!零基础AI Agent高效工作流设计指南

此次会连载一套 AI-Agent 构建的系列,主要分为三部分,首先是速通 AI-Agent 构建的工作流基础,然后是通过 ComfyUI 作为案例来复盘如何快速上手工作流平台,最后则是借助 Agent 平台构建一个 AI Agent 案例,本系列意图主要是帮助大家贯通工作流的搭建形式,并尝试思考为自己的工作搭建一些可用的 AI 助手,或是提供构建的方法指引。 无论你是产品经理还是设计师,你会发现商业场景的 AIGC,几乎都没有办法通过一段需求描述或是简单的 Agent 对话就搞定的,你需要更专业更复杂的 AIGC 过程,那么如何理解复杂? 实现专业?
3/18/2025 8:22:14 AM
泡泡bing

唯有惊叹!一手体验首款通用Agent产品Manus

一个新团队突然发了一个首款通用型的项目:Manus。 演示在此,我人直接看麻了。 看完我的第一感觉,人类又要一败涂地了。
3/7/2025 7:43:25 AM
数字生命卡兹克
  • 1