OpenAI近日宣布对其Agents SDK进行全面升级,为开发者带来多项重要功能更新。此次升级不仅扩展了编程语言支持,还引入了突破性的语音交互技术。
Agents SDK现已正式支持TypeScript,功能与Python版本完全一致。开发者可以利用细粒度控制机制和人工审批选项,更精确地管理AI代理行为。该SDK专为简化多代理工作流程而设计,提供可配置的语言模型、代理切换功能、内置安全控制和完整的分析工具套件。
语音代理技术突破
新推出的RealtimeAgent功能是此次升级的亮点。开发者现在可以创建既能在客户端又能在服务器端运行的语音代理,这些代理支持语音打断功能,并可在对话过程中实时调用各种工具。
配套的"Traces"仪表板也进行了重大更新,能够显示语音代理的实时运行数据,包括音频流状态、工具使用情况和打断次数统计,为开发者提供全面的性能监控.
OpenAI同时改进了支撑这些功能的底层语言模型。更新后的"GPT-4O-Realtime-Preview-2025-06-03"版本在指令执行准确性、工具调用可靠性和中断处理优雅度方面都有显著提升,该模型已通过实时和聊天API向开发者开放。
API战略调整
在产品路线图方面,OpenAI计划在2026年中期实现功能对等后,逐步淘汰现有的Assistants API,全面转向新的Responses API。Chat Completions API将继续为不需要工具集成的开发者提供服务,但OpenAI建议开发者尽早过渡到Responses API以获得更强大的扩展功能。
Agents SDK与OpenAI API以及其他遵循Chat Completions标准的第三方模型提供商完全兼容,为开发者提供了灵活的选择空间。