AI在线 AI在线

Anthropic 基于 Claude 3.5 Sonnet 扩充 AI 开发工具:细化提示词、增强评估和测试

Anthropic 公司昨日(7 月 10 日)发布新闻稿,宣布推出了多项新工具,基于 Claude 3.5 Sonnet 大语言模型自动化、细化提示词(prompt)。AI在线附上完整演示视频如下: 增强开发环境,可生成提示Anthropic 控制面板新增“评估”(Evaluate)单元,借助 Claude 3.5 Sonnet 大语言模型,帮助开发者高效地生成、微调和测试提示(Prompt)。这些增强功能旨在改进语言模型对各种任务的响应,为使用 Claude 开发人工智能产品的企业提供宝贵的资源。开发者只需描述

Anthropic 公司昨日(7 月 10 日)发布新闻稿,宣布推出了多项新工具,基于 Claude 3.5 Sonnet 大语言模型自动化、细化提示词(prompt)。

AI在线附上完整演示视频如下:

增强开发环境,可生成提示

Anthropic 控制面板新增“评估”(Evaluate)单元,借助 Claude 3.5 Sonnet 大语言模型,帮助开发者高效地生成、微调和测试提示(Prompt)。

Anthropic 基于 Claude 3.5 Sonnet 扩充 AI 开发工具:细化提示词、增强评估和测试

这些增强功能旨在改进语言模型对各种任务的响应,为使用 Claude 开发人工智能产品的企业提供宝贵的资源。

开发者只需描述任务(例如“分流处理客户支持请求”),Claude 就会为你生成一个高质量的提示。

Anthropic 基于 Claude 3.5 Sonnet 扩充 AI 开发工具:细化提示词、增强评估和测试

有效测试和评估

开发者在“评估”选项卡中,可以根据各种场景测试其人工智能应用程序的提示。

用户可以上传真实示例或者使用 Claude 生成案例,从而对比不同提示之间的有效性,答案以五分制进行评估,便于开发者直观评估。

Anthropic 基于 Claude 3.5 Sonnet 扩充 AI 开发工具:细化提示词、增强评估和测试

在 1 个博客示例中,开发者只需调整一行,就能在所有测试中生成更长、更详细的答案,从而节省时间和提高生产率。

测试机制

新工具支持手动和自动测试提示。开发人员可以生成输入变量,查看 Claude 的响应情况,并在需要时手动输入测试用例。

根据多个真实输入进行测试有助于在生产部署前验证提示质量。开发人员可以手动添加或从 CSV 中导入新的测试用例,或请求 Claude 创建测试用例。

Anthropic 基于 Claude 3.5 Sonnet 扩充 AI 开发工具:细化提示词、增强评估和测试

相关资讯

AI游戏大潮来袭,Steam开发者们陷入提示词内卷泥潭!

2023年被誉为生成式 AI 在游戏行业崛起的元年,Steam 平台上的 AI 游戏数量已突破8000款,较去年激增800%。 这意味着每14款 Steam 游戏中,就有一款使用了 AI 技术,并且预计到2025年,新上线的游戏中这一比例将达到20%。 AI 的广泛应用正在深刻改变游戏开发的生态。
7/21/2025 3:12:35 PM
AI在线

火山引擎发布PromptPilot,推动大模型应用高效落地

近日,火山引擎在北京举办PromptPilot产品发布会,面向广大开发者、企业客户与技术爱好者,正式推出新一代AI提示词工程平台——PromptPilot。 本次活动通过产品讲解、实操体验与真实案例分享,全面展示PromptPilot如何系统化解决大模型应用落地中的关键挑战。 破解大模型应用落地难题,提出工程化新思路火山引擎PromptPilot技术负责人许伟指出,尽管当前大模型能力突飞猛进,成本持续降低,但其在实际业务应用中仍存在三大核心痛点:需求表达不清晰、模型能力边界模糊,以及上下文动态适应困难。
9/16/2025 4:52:00 PM
新闻助手

不停PUA大模型「写更好点」,无需其它花哨技术就能让AI代码水平暴增

AI 的编程能力已经得到了证明,但还并不完美。 近日,BuzzFeed 的资深数据科学家 Max Woolf 发现,如果通过提示词不断要求模型写更好的代码(write better code),AI 模型还真能写出更好的代码! 这篇文章在网络上引发了热议,著名 AI 科学家在看完这篇文章中更是发出了 matters 三连:迭代很重要,提示词设计很重要,代码执行能力很重要。
1/11/2025 3:37:00 PM
机器之心
  • 1