AI在线 AI在线

OpenAI Responses API新增MCP支持与多项功能升级,助力智能体开发

OpenAI宣布其核心API——Responses API现已支持**Model Context Protocol(MCP)**,并对图像生成、Code Interpreter以及文件搜索工具进行了重大更新。 这些升级极大简化了智能体开发流程,使开发者能够通过几行代码将AI智能体连接到外部工具和服务,进一步提升了API的灵活性和功能性。  MCP支持:简化智能体开发OpenAI通过Responses API新增对MCP的支持,标志着其在AI智能体开发领域的又一重大突破。

OpenAI宣布其核心API——Responses API现已支持**Model Context Protocol(MCP)**,并对图像生成、Code Interpreter以及文件搜索工具进行了重大更新。这些升级极大简化了智能体开发流程,使开发者能够通过几行代码将AI智能体连接到外部工具和服务,进一步提升了API的灵活性和功能性。

 MCP支持:简化智能体开发

OpenAI通过Responses API新增对MCP的支持,标志着其在AI智能体开发领域的又一重大突破。MCP(Model Context Protocol)是一种连接AI模型与外部工具和服务的协议,开发者只需数行代码即可实现复杂的功能集成。例如:

- **9行代码**即可将智能体连接到电商平台**Shopify**,实现与电商系统的无缝交互。

- **13行代码**可将智能体连接到云通信平台**Twilio**,支持实时通信功能。

OpenAI还宣布加入MCP指导委员会,以推动这一生态系统的发展,为开发者提供更标准化的工具集成方案。

QQ20250522-101512.png

图像生成:实时预览与多轮编辑

Responses API现已集成OpenAI最新的图像生成模型**gpt-image-1**,为开发者提供了更强大的视觉创作能力。新功能包括:

- **实时预览**:开发者可以在图像生成过程中实时查看生成效果。

- **多轮编辑**:支持逐步调整和优化图像,允许开发者根据需求进行细粒度修改。

这一更新基于广受欢迎的GPT-4o模型,其图像生成能力曾在网络上掀起“Studio Ghibli”风格动漫热潮,展现了其多样化的风格生成能力。

Code Interpreter:数据分析与图像处理

升级后的**Code Interpreter**工具进一步增强了Responses API的实用性,使AI模型能够:

- 执行复杂的数据分析任务。

- 解决高级数学问题。

- 处理和操作图像数据,例如通过代码生成或编辑图像。

这一功能为开发者提供了强大的工具,适用于从金融分析到软件开发的多种场景。

文件搜索:跨数据源的高效检索

文件搜索工具的改进使得AI智能体能够更高效地从文档中提取相关信息。更新后的功能包括:

- 根据用户查询,从文档中提取相关内容块。

- 支持跨多个数据源进行搜索,提升信息检索的广度和精度。

这一升级为市场研究、教育和软件开发等领域的应用提供了更强大的支持。

OpenAI表示,新增功能的定价与现有费率保持一致。例如:

- Code Interpreter按每会话0.03美元计费。

- 文件搜索按每1000次调用2.50美元计费,存储费用为每GB每天0.10美元(首GB免费)。

- 图像生成按分辨率和质量层级计费,起步价为每张图像0.011美元。

所有功能已于2025年5月21日起正式上线,开发者可通过OpenAI官方文档获取详细的实施指南。

总结

OpenAI Responses API的此次更新,通过支持MCP、增强图像生成、Code Interpreter和文件搜索功能,为开发者提供了更强大、更灵活的工具集。无论是连接Shopify、Twilio等外部服务,还是进行复杂的数据分析和图像处理,Responses API都展现了其在智能体开发中的巨大潜力。开发者现可通过更少的代码实现更复杂的AI应用,标志着OpenAI在推动AI技术落地应用方面迈出了重要一步。

OpenAI开发者平台:https://platform.openai.com

相关资讯

谷歌Gemini重磅更新:直接选用Imagen生成图像

近日,谷歌对其 AI 服务 Gemini 进行了重要升级,用户现在可以直接在 Gemini 界面中选择 Imagen 模型来生成高质量的图像。 这一更新不仅提升了用户体验,还为开发者提供了更多的灵活性和便捷性。 在此次更新中,谷歌还启用了 llms.txt 文件,旨在为 AI Agent 提供最新的 API 和 SDK 使用方法。
7/24/2025 9:52:46 AM
AI在线

如何使用 Gemini API 构建视频字幕生成器

译者 | 崔皓审校 | 重楼开篇在本教程中,你将使用 Google 的 Gemini API 构建人工智能驱动的字幕生成器。 我们将创建一个名为“AI-Subtitle-Generator”的项目,该项目的前端使用 React,后端使用 Express。 准备好了吗?
12/23/2024 8:00:00 AM
崔皓

大语言模型也有“健忘症”?Supermemory推出“无限记忆外挂”,让你的AI永不失忆!

在与ChatGPT或Claude等大语言模型长时间对话时,你是否也遇到过对话内容突然"失忆"的尴尬场景?这并非AI有意为之,而是受限于大语言模型固有的上下文窗口限制。 无论是8k、32k还是128k tokens的容量,一旦超过这个阈值,先前的对话内容就会被截断丢失,导致交互体验严重受损。 近日,一家名为Supermemory的公司推出了一项颠覆性技术——Infinite Chat API,号称能无限扩展任何大语言模型的上下文长度,让AI拥有"长期记忆"能力,且无需开发者重写任何应用逻辑。
5/16/2025 4:00:55 PM
AI在线
  • 1