AI在线 AI在线

Anthropic 基于 Claude 3.5 Sonnet 扩充 AI 开发工具:细化提示词、增强评估和测试

Anthropic 公司昨日(7 月 10 日)发布新闻稿,宣布推出了多项新工具,基于 Claude 3.5 Sonnet 大语言模型自动化、细化提示词(prompt)。AI在线附上完整演示视频如下: 增强开发环境,可生成提示Anthropic 控制面板新增“评估”(Evaluate)单元,借助 Claude 3.5 Sonnet 大语言模型,帮助开发者高效地生成、微调和测试提示(Prompt)。这些增强功能旨在改进语言模型对各种任务的响应,为使用 Claude 开发人工智能产品的企业提供宝贵的资源。开发者只需描述

Anthropic 公司昨日(7 月 10 日)发布新闻稿,宣布推出了多项新工具,基于 Claude 3.5 Sonnet 大语言模型自动化、细化提示词(prompt)。

AI在线附上完整演示视频如下:

增强开发环境,可生成提示

Anthropic 控制面板新增“评估”(Evaluate)单元,借助 Claude 3.5 Sonnet 大语言模型,帮助开发者高效地生成、微调和测试提示(Prompt)。

Anthropic 基于 Claude 3.5 Sonnet 扩充 AI 开发工具:细化提示词、增强评估和测试

这些增强功能旨在改进语言模型对各种任务的响应,为使用 Claude 开发人工智能产品的企业提供宝贵的资源。

开发者只需描述任务(例如“分流处理客户支持请求”),Claude 就会为你生成一个高质量的提示。

Anthropic 基于 Claude 3.5 Sonnet 扩充 AI 开发工具:细化提示词、增强评估和测试

有效测试和评估

开发者在“评估”选项卡中,可以根据各种场景测试其人工智能应用程序的提示。

用户可以上传真实示例或者使用 Claude 生成案例,从而对比不同提示之间的有效性,答案以五分制进行评估,便于开发者直观评估。

Anthropic 基于 Claude 3.5 Sonnet 扩充 AI 开发工具:细化提示词、增强评估和测试

在 1 个博客示例中,开发者只需调整一行,就能在所有测试中生成更长、更详细的答案,从而节省时间和提高生产率。

测试机制

新工具支持手动和自动测试提示。开发人员可以生成输入变量,查看 Claude 的响应情况,并在需要时手动输入测试用例。

根据多个真实输入进行测试有助于在生产部署前验证提示质量。开发人员可以手动添加或从 CSV 中导入新的测试用例,或请求 Claude 创建测试用例。

Anthropic 基于 Claude 3.5 Sonnet 扩充 AI 开发工具:细化提示词、增强评估和测试

相关资讯

AI游戏大潮来袭,Steam开发者们陷入提示词内卷泥潭!

AI游戏大潮来袭,Steam开发者们陷入提示词内卷泥潭!

2023年被誉为生成式 AI 在游戏行业崛起的元年,Steam 平台上的 AI 游戏数量已突破8000款,较去年激增800%。 这意味着每14款 Steam 游戏中,就有一款使用了 AI 技术,并且预计到2025年,新上线的游戏中这一比例将达到20%。 AI 的广泛应用正在深刻改变游戏开发的生态。
7/21/2025 3:12:35 PM AI在线
火山引擎发布PromptPilot,推动大模型应用高效落地

火山引擎发布PromptPilot,推动大模型应用高效落地

近日,火山引擎在北京举办PromptPilot产品发布会,面向广大开发者、企业客户与技术爱好者,正式推出新一代AI提示词工程平台——PromptPilot。 本次活动通过产品讲解、实操体验与真实案例分享,全面展示PromptPilot如何系统化解决大模型应用落地中的关键挑战。 破解大模型应用落地难题,提出工程化新思路火山引擎PromptPilot技术负责人许伟指出,尽管当前大模型能力突飞猛进,成本持续降低,但其在实际业务应用中仍存在三大核心痛点:需求表达不清晰、模型能力边界模糊,以及上下文动态适应困难。
9/16/2025 4:52:00 PM 新闻助手
Anthropic 最强 AI 模型 Claude Sonnet 4 / Opus 4 有望明日发布

Anthropic 最强 AI 模型 Claude Sonnet 4 / Opus 4 有望明日发布

科技媒体 bleepingcomputer 今天(5 月 22 日)发布博文,报道称基于 Anthropic 官网配置文件,该公司正秘密研发 Claude Sonnet 4 和 Claude Opus 4 两款全新 AI 模型。
5/22/2025 10:48:24 AM 故渊