AI在线 AI在线

破天荒!OpenAI、Cursor多位开发大牛联手曝出GPT5提示词指南!晒官方系统提示词优化秘籍,最大化编程性能,工作流更可控

编辑 | 云昭上周,GPT-5 发布以后,不少网友对这个备受期待的新版本表示无力吐槽。 OpenAI 老板 Altman 在直播间宣称,GPT-5 在自主任务执行能力、编程、综合智能以及可控性方面都实现了显著飞跃。 然而,用户实际用起来却是:“降智”、“Token很快用完”的声讨一片。

编辑 | 云昭

上周,GPT-5 发布以后,不少网友对这个备受期待的新版本表示无力吐槽。

OpenAI 老板 Altman 在直播间宣称,GPT-5 在自主任务执行能力、编程、综合智能以及可控性方面都实现了显著飞跃。

然而,用户实际用起来却是:“降智”、“Token很快用完”的声讨一片。

不过,近日,小编发现了一篇 Cursor 内部在用的 GPT-5 集成秘籍,或许能帮到大家高效使用 GPT-5。

图片图片

这还没完,OpenAI 官方也十分慷慨地放出来了 GPT-5 的提示词指南手册!小编耐心地搜集了一下作者信息,可谓大有来头。三位领衔作者,分别是:

  • OpenAI 的应用AI团队的 Anoop Kotha,对于提示词工程技巧可谓殿堂级;
  • Julian Lee ,之前是一位年收 4000 万美金的初创公司创始人,现在是 OpenAI 的研究员;
  • Eric Zakariasson ,Cursor 后端开发大牛。

图片图片

“虽然我们相信它在大多数领域中都能“开箱即用”地表现出色,但在本指南中,我们将分享一些提示词优化技巧,帮助你最大化模型输出质量。这些技巧来自我们在模型训练和实际应用中的经验。”

内容涵盖许多实际生产环境中的干货,

  • 提升自主任务执行能力
  • 确保严格遵循指令
  • 利用 API 新增功能
  • 针对前端与软件工程任务的编程优化

同时,《指南》还破天荒分享了当红炸子鸡 Cursor 与 GPT-5 的提示词调优关键经验。

绝对值得诸位收藏细读。

1.Agentic 工作流的可预测性

GPT-5 的训练重点之一是为开发者优化 工具调用、指令遵循 以及 长上下文理解,以便作为 Agentic 应用的最佳底座模型。

如果你在 Agentic 流程和工具调用中采用 GPT-5,建议升级到 Responses API,因为它可以在工具调用之间保留推理上下文,让输出更高效、更智能。

2.控制 Agentic 的“主动性”

Agentic 系统的控制范围很广——有的系统几乎将所有决策交给模型,有的则严格限制模型的自主权。GPT-5 能在这个光谱上的任意位置运作:既能在模糊情况下作出高层决策,也能处理精确定义的任务。

降低主动性

默认情况下,GPT-5 会在 Agentic 环境中非常全面地收集上下文,以确保回答正确。但如果你希望它 减少无关的工具调用,降低等待时间,可以尝试:

  • 将 reasoning_effort 降低到 medium 或 low,以换取更快的响应。
  • 在提示中明确上下文收集的目标、方法、停止条件,例如:
复制
  • 设定 工具调用上限(例如最多 2 次),并允许“在不完全确定的情况下继续执行”。

提高主动性

如果希望 GPT-5 更加自主、减少反问用户、持续执行任务,可以:

  • 提高 reasoning_effort
  • 在提示中加入持续执行规则,例如:
复制

3.工具调用说明(Tool Preambles)

在长流程中,向用户简要说明 当前要做什么、为什么 能显著提升体验。你可以在提示中控制这些说明的频率与详细程度,例如:

复制

4.reasoning_effort 参数

reasoning_effort 用于控制模型思考深度与工具调用倾向。

  • 低low:快速完成简单任务
  • 高high:适合复杂多步任务

ps:在多步骤任务中,拆分为多回合(每回合完成一个独立任务)表现最佳。

5.Responses API 的上下文复用

使用 Responses API 并传递 previous_response_id,可让模型在后续请求中复用之前的推理过程:

  • 节省 CoT(链式思维)Token
  • 避免每次工具调用都重建计划。据悉,OpenAI 在 Tau-Bench 零售场景中,单靠这一改动,准确率就从 73.9% 提升到 78.2%。

6.编程性能最大化

GPT-5 在编程能力上领先所有前沿模型,适合:

  • 修复大规模代码库中的 Bug
  • 处理多文件重构
  • 从零构建全栈应用(前端 + 后端)

前端开发建议

最佳框架与工具组合:

  • 框架:Next.js(TypeScript)、React、HTML
  • 样式/UI:Tailwind CSS、shadcn/ui、Radix Themes
  • 图标:Material Symbols、Heroicons、Lucide
  • 动效:Motion
  • 字体:Inter、Geist、Mona Sans、IBM Plex Sans、Manrope

零到一应用生成

通过“自建评分标准 + 自我反思”Prompt,可提升一次性生成的质量:

复制

与现有代码库匹配

  • 遵循项目现有的工程原则、目录结构与样式规范。
  • 在 Prompt 中明确这些规则,例如:
复制

7.生产环境的案例:Cursor 的 GPT-5 调优经验

此外,OpenAI 还把老朋友 Cursor ( 每次OpenAI 上新都会带上这个Alpha 测试伙伴)的 GPT-5 首日集成的提示词调优实战的原则也给了出来,篇幅较长,先给大家看一下省流版,整体有 5 个原则:

  • 系统提示兼顾自主性与用户指令遵循。
  • 通过 API verbosity 设置全局输出简短,但在写代码时强制高详细度。
  • 增加产品特性细节(如“用户可拒绝代码修改”)以减少反问用户的频率。
  • 用结构化 XML 标签 <[instruction]_spec> 提高指令执行率。
  • 减少过度上下文收集提示,避免重复调用工具。

接下来,让我们看下细节部分。看 Cursor 当时如何调优提示词以最大化发挥模型能力。

系统提示词与参数调优

Cursor 的系统提示词重点在于:

  • 可靠的工具调用
  • 在简洁性与自主性之间取得平衡
  • 允许用户配置自定义指令

他们的目标是:让 Agent 在长周期任务中能相对自主地运行,同时依然精准执行用户提供的指令。

初期发现的问题
  • 模型输出过于冗长:会附带状态更新和任务后总结,虽然技术上相关,但打断了用户的自然操作流。
  • 工具调用中代码输出质量很高,但过于简短,变量名常用单个字母问题严重,导致可读性差。
调整方法
  • 将 verbosity(冗长度)API 参数设置为“低”,让文本输出简洁。
  • 同时在提示词中强烈要求在编写代码工具时保持高冗长度,以提高代码可读性。

提示词片段示例:

复制

这种“参数低冗长 + 代码高冗长提示词”的组合,让状态更新简洁高效,同时让代码差异(diffs)更易阅读。

自主性优化

Cursor 还发现,模型有时会在执行前反复询问用户确认步骤,降低了长任务的流畅性。

  • 解决办法:在提示词中不仅列出可用工具和上下文,还补充更多关于产品行为的细节,例如 Undo/Reject 代码功能和用户偏好。
  • 明确规定 GPT-5 的运行方式,让其更主动地执行计划,而不是询问是否继续。

提示词示例如下:

复制

针对 GPT-5 的提示词改进

一些在旧模型中有效的提示词,在 GPT-5 中反而会造成副作用。例如:

复制

在旧模型中,这种提示能促使模型深入分析上下文。但 GPT-5 天然已经善于获取上下文,这种指令反而会导致:

  • 小任务中反复调用搜索工具
  • 即使内部知识足够,也会进行不必要的外部查找

解决办法:

  • 去掉 maximize_ 前缀
  • 弱化“全面”指令

改进示例:

复制

同时,Cursor 发现用 结构化 XML 标签(如 <[instruction]_spec>)组织提示词,可以显著提高 GPT-5 对指令的遵循度,并方便在提示中引用前文内容。

8.智能性与指令执行的优化

可控性(Steering)

GPT-5 对提示词中关于冗长度、语气、工具调用的指令反应极为敏感。

冗长度(Verbosity)

  • GPT-5 新增 API 参数 verbosity,控制最终答案的长度(与推理过程长度不同)。
  • 也可以在提示词中用自然语言覆盖全局设置,例如:

   全局设置低冗长

   对编码工具指定高冗长(Cursor 案例)

指令遵循(Instruction Following)

  • GPT-5 对指令执行精确度很高,但如果提示词存在矛盾,会浪费推理资源试图调和,反而降低性能。

示例:预约系统的提示词冲突

  • “没有患者明确同意,不要安排预约”
  • 却又要求“高危病例立即分配当天最早时间段,不联系患者”
  • 这种矛盾会让模型卡住

解决方法:

  • 将“先联系患者”与“分配时间”逻辑统一
  • 在紧急情况下允许跳过患者信息查询,直接指导拨打 911

最小推理(Minimal Reasoning)

GPT-5 新增 minimal reasoning 模式,特点是:

  • 速度最快
  • 适合延迟敏感场景
  • 更接近 GPT-4.1 的提示模式

官方文档中也给出了优化建议:

  • 在最终答案开头简短解释思路(如用列表)
  • 工具调用前提供清晰的任务进度说明
  • 最大化工具指令的明确性
  • 提前规划任务,确保所有子任务完成后才结束

提示词示例如下:

复制

9.Markdown 格式化

API 默认不输出 Markdown,以避免不支持的环境出错。如需 Markdown,可在提示中指定:

  • 仅在语义合适时使用 Markdown
  • 用反引号格式化文件、函数、类名
  • 每 3-5 次用户输入后重新提醒格式化规则

元提示(Metaprompting)

早期用户发现,可以让 GPT-5 为自己写提示词,提升效果:

  • 直接询问模型:要达成某个行为,当前提示词应增补或删除哪些内容?
  • 在保留现有结构的前提下,最小化修改以解决问题

模板示例:

复制

此外,官方的提示词指南中还附录了SWE-Bench verified开发者指令、Agent编码工具定义、终端工作台提示、Taubench-Retail 最低限度推理指令。

相信对于正在研究 Vibe Coding 工具的朋友大有帮助。这里附上指南地址:

https://cookbook.openai.com/examples/gpt-5/gpt-5_prompting_guide

多说一嘴,OpenAI 最近对GPT-5发布后用户遇到的各种问题正在紧急解决。就在四天前,OpenAI 还专门为 ChatGPT 5 推出了一款免费的 Prompt Optimizer 工具,Reddit上的网友大呼好用,并提醒说不要太上瘾。

图片图片

这个提示词优化器地址也奉上:https://platform.openai.com/chat/edit?models=gpt-5&optimize=true

相关资讯

消息称 OpenAI 新模型 GPT-5 研发遇阻,成本高昂、效果未达预期

据《华尔街日报》最新报道指出,OpenAI 正在开发的下一代大型语言模型 GPT-5 的研发进度落后于原计划,且目前取得的成果尚未达到与其巨额成本相匹配的水平。
12/22/2024 9:30:48 AM
远洋

GPT5基本玩崩了!谷歌和Meta胜算很大!AI投资人爆料:Meta承接谷歌搜索后,或收购某独角兽,OpenAI其实贼挣钱

编辑 | 言征出品 | 51CTO技术栈(微信号:blog51cto)临近年尾,相信很多朋友都在盘点这一年。 很多人都在有意无意地在围观大模型这场全明星球赛。 OpenAI、谷歌、Anthropic、Meta,还有马斯克的 XAI,以及AI应用层面比如Perplexity等一众新秀球员,究竟谁会技压群雄,赢得接下来的2025?
12/24/2024 6:13:34 PM
言征

OpenAI GPT-4.5 有望下周发布,GPT-5 被曝将与 o3 大一统、定档 5 月底

据外媒 The Verge 今日消息,据了解公司计划的知情人士透露,微软工程师目前正在为 OpenAI 即将推出的 GPT-4.5 和 GPT-5 模型准备服务器容量。
2/21/2025 10:22:58 AM
汪淼
  • 1