AI在线 AI在线

七种方式让你的AI编码结果更靠谱

译者 | 核子可乐审校 | 重楼企业在积极引入AI的同时,也希望雇用更多工程师,期望开发者能够借AI之力将产出“提升10倍”。 但要真正高效运用AI编码助手,其中也有不少门道。 首先是AI编码助手的固有局限,其存在大量不确定性,因此容易引发种种难以避免的意外行为,例如随机删除代码或引入逻辑错误。

七种方式让你的AI编码结果更靠谱

译者 | 核子可乐

审校 | 重楼

企业在积极引入AI的同时,也希望雇用更多工程师,期望开发者能够借AI之力将产出“提升10倍”。但要真正高效运用AI编码助手,其中也有不少门道。

首先是AI编码助手的固有局限,其存在大量不确定性,因此容易引发种种难以避免的意外行为,例如随机删除代码或引入逻辑错误。

此外,驱动编码助手的大模型本身也有问题。一旦使用不当,大模型也可能成为代码删除或者安全漏洞的来源。此外,AI智能体还经常陷入递归循环乃至无休止的测试循环当中,严重影响生产效率。

那么对于AI辅助开发这一未知领域兼全新技能类型,开发者和技术领导者们该如何破局?以下七种方式也许能够带来一点启示。

1.改善提示词技巧

Sonar公司首席业务增长官Harry Wang认为,“有效运用AI编码助手的第一步,是从清晰、定义明确的提示词开始,这也是解开代码库复杂性的钥匙。”

  • 元提示:在提示词中嵌入指令,帮助模型完成任务。
  • 提示词链:创建链式提示词工作流,改善规范与规划效果。
  • 一次性提示词:在提示词中包含输出参考,例如示例代码结构。
  • 系统提示词:更新底层系统提示词以反映项目特定需求。

低质量提示词往往成为安全隐患的来源,因此必须认真磨练这项技能。相关研究发现,在十项常见弱点枚举(CWE)攻击方法中,低效提示词至少会被其中四项攻破。

2.保持人类参与

根据BlueOptima发布的2024年《生成式AI对软件开发者绩效影响》报告,“适度”使用生成式AI的开发者表现最佳(报告分析了来自21万8354名企业软件开发者的总计8.8亿项提交成果)。

报告指出,最佳结果源自AI辅助与人类专业知识间的最佳平衡。在实践中,代码编写和验证工作可以交给AI,项目设计与最终审批则更适合人类。

3.为工作内容选择正确的大模型

只有在准确性、速度和成本等指标上综合最优的大模型,才是最适合特定需求的选项。

在LLM Stats公布的排行榜中,Anthropic Claude 3.5 Sonnet的编码能力在HumanEval基准上得分最高。此外,Claude在安全性方面同样名列前茅。研究发现,Claude 3.7 Sonnet生成的代码比OpenAI GPT-4o和谷歌Gemini的输出结果更安全。

与此同时,OpenAI o3的知识储备最为丰富,DeepSeek R1的推理能力则一举登顶。此外,Gemini 1.5 Pro提供最大的token窗口,Lambda拥有最高的性价比。

4.以迭代方式编程并测试

专家建议逐步开发AI代码。Honeycomb公司联合创始人兼CTO Charity Majors表示,“一定要将代码变更的规模控制得尽量更低。千万不要一次性生成整个网站、API或者功能。”

Layered Sysetm公司API策略师Kevin Swiber则提到,如果大家正在处理一个3000行的代码文件,那一定要进行拆分。这时候直接使用AI重构将带来巨大风险,因为AI经常会无故删除或者移动代码,所以“一定保证只用AI对细节做优化,阻止直接把大问题交给它。”

因此,Majors建议从端点、组件或者任务着手,之后逐步由AI生成测试、运行测试并生成更多代码。

5.提前规划

除了直接在代码编辑器中使用GitHub Copilot、Cursor或者Continue等工具获取建议,开发者也可以在行动之初就规划好一切。Swiber建议使用Markdown文件为AI助手编写一份完整计划,借此明确项目目标并详细说明进度安排。另外,最好能备份原始文件,以便随时恢复到之前的可用版本。

Swiber强调,“要提前规划并留下线索,方便自己和智能体灵活参考。”再有,可以使用明确的行内注释为智能体提供指引,例如“不要修改这些代码行。”

6.测试、测试、还是测试

对于将要投入生产的AI生成代码,一定要进行彻底审查。Majors强调,“永远不要发布自己不理解的东西。”

Sonar公司的Wang表示,“哪怕代码是由AI生成,最终也还是要由人类对其质量和安全性负责。”

Graphite公司CEO兼联合创始人Merrill Lutsky认为,“AI生成的代码更需要严格审查和测试,以保证其正确性、高性能与安全性。”

在这方面,Lutsky认为AI造成的问题也完全可以由AI来解决。他认为可以使用AI智能体简化DevOps流程、自主完成审查及测试流程,并根据需要引入人为干预,借此不断提升CI/CD的执行效率。

7.关注数据访问

另一项重点,是为AI提供适当的上下文。Cockroach Labs公司CEO Spencer Kimball表示,“只有AI获得了足够的信息,才能做出合理的判断。”当前模型在上下文窗口和外部数据访问能力方面仍有局限,但开发者可以直接用内部数据、文档乃至整个项目作为素材进行大模型微调,借此确保公共大模型也能体会项目中的细微差别。

更重要的是,Kimball认为这将成为以开源为核心的年轻技术企业们的绝佳机遇,因为他们的源代码和设计文档都会公开交付给大模型。

大模型在连接性方面也取得了重大进展。例如,OpenAI的智能体SDK与Anthropic模型上下文协议(MCP)在将AI与工具、数据源及其他AI对接方面取得了长足进步。

未来展望

AI编码应用正迈向成熟期,每位开发者都应当尽早体验这些工具。Swiber强调,“在擅长的方面,AI编码助手确实能节约下大量时间。”

如今的AI编码助手不再是实验室里的玩具,而开始成为企业开发流程中的标准。Gartner预计到2028年,75%的企业软件工程师将使用AI编码助手。

中小型企业将在这波浪潮中获得显著推动。Kimball认为在AI时代下,十几个员工支撑起年度经常性收入高达1亿美元企业将不再是梦想。

但要让这一切成为现实,开发者必须掌握新的工具驾驭智慧、建立真正高效的新型工作流。希望以上七条建议,能够成为大家拥抱AI编码时代的起点。

原文标题:7 ways to improve your AI coding results,作者:Bill Doerrfeld

相关资讯

Xcode MCP开源发布,革新VS Code与Cursor中的iOS开发体验

近日,Xcode MCP(Model Context Protocol)项目正式开源,为在Visual Studio Code(VS Code)和Cursor中进行iOS开发带来了革命性体验。 据AIbase了解,该工具通过MCP协议将Xcode的功能扩展到轻量级编辑器,支持虚拟机启动、日志获取、项目管理与模拟器控制等功能,显著提升了开发效率与灵活性。 项目已在GitHub上线,引发了iOS开发者与AI技术爱好者的广泛热议,标志着AI辅助iOS开发的新里程碑。
4/21/2025 12:00:57 PM
AI在线

Windsurf 发 SWE-1:以数据+智能飞轮驱动软件工程 AI 进化

大家好,我是肆〇柒。 软件开发行业正经历一场前所未有的AI变革。 AI 辅助编程从曾经的新兴尝试,迅速成长为开发领域不可或缺的关键力量。
5/23/2025 9:45:01 AM
肆零柒

小红书翻译紧急上线,见证历史:大模型翻译首次上线C端应用!AI竟自称是GPT-4?网友变身“测试狂魔”,疯狂套话,效果拉满了!

编辑 | 伊风出品 | 51CTO技术栈(微信号:blog51cto)程序员键盘敲冒烟,小红书翻译功能这不是就来了吗! 之前大家各种吐槽美国人用的翻译机器不准确,导致大家交流起来“人机感很重”,一些美网友还需要额外用ChatGPT才能实现无缝交流。 这翻译功能一出来,语言障碍什么的都不存在了。
1/20/2025 1:52:45 PM
伊风
  • 1