AI在线 AI在线

曝Claude 4胆儿肥变“勇”了,竟敢举报用户!但Cursor、Manus反而更爱用它了!

编辑 | 云昭近期大模型竞赛又开始热闹起来了。 上周谷歌刚放出来 Gemini 2.5 Pro 在榜单上大杀四方,今天 Anthropic 就深夜放出新模型来屠榜了。 关于 Claude4,一大早不少媒体都进行了报道,这里不再浪费篇幅,就像Anthropic 的 CEO Dario 在开场时就对台下观众所说的,自己不喜欢炒作。

编辑 | 云昭

近期大模型竞赛又开始热闹起来了。上周谷歌刚放出来 Gemini 2.5 Pro 在榜单上大杀四方,今天 Anthropic 就深夜放出新模型来屠榜了。

关于 Claude4,一大早不少媒体都进行了报道,这里不再浪费篇幅,就像Anthropic 的 CEO Dario 在开场时就对台下观众所说的,自己不喜欢炒作。而是想:

  • 快速为大家梳理一下新发布的 Claude 4 的新亮点。(其实最大感受就是两点:长时间自主工作和深入推理。)
  • 分析下为什么 Claude 会吸引诸如Cursor、Manus、Cava、Fellou、SourceGraph等明星AI产品的青睐。
  • 曝一个 Claude 4 的极限小猛料:胆子肥到可以把用户举报了!

1.究竟新在哪里?

这次发布就两款新品:Opus 4 是专为编程和长时间运行的代理型任务流程而优化的;Sonnet 4 则更注重推理能力,并在效率方面做了平衡,运行成本更低。

这两个模型都能并行使用工具,更精准地执行指令,并在开发者提供本地文件访问权限的情况下展现出更强的记忆能力,能够提取和保存关键信息,以维持上下文连贯并逐步构建隐性知识。

整体来看下 Claude 4 新模型的亮点功能。

首先,Opus 4 正在向“自主工作”的方向前进,相信这也是大家最明显的一个感受。作为 Claude 系列的顶配模型,Claude Opus 4 能够同时调用多个软件工具独立执行任务,甚至最长可以持续 7 小时。

官方称其为“全球最强的编程模型”,特别适合处理复杂、持续时间长、流程繁多的任务与 Agent 工作流。这使得 Opus 4 离可真正独立完成复杂软件项目、深入研究和多步骤数据自动化等高级任务又近了一步。

其次,则是推理能力的升级:新模型可以支持工具辅助的“扩展思维”。

新增测试功能“工具辅助的扩展推理”,允许 Claude 4 系列模型在模拟思考与调用外部工具(如网页搜索)之间灵活切换。

Claude 还新增了“思考过程可视化”功能,能逐步展示其解决复杂问题的思路,让用户与 Claude 保持信息同步,共同理解问题。

2.Claude API 四大新能力:代码执行、MCP连接器、文件、Prompt缓存

然后,就是开发者最关心的 API 方面,Anthropic 进一步新增了四项新能力。

  • 代码执行工具

支持在沙盒环境中运行 Python 代码,能接受数据集、识别模式、绘制探索图表并根据执行结果进行输出优化。

图片图片

图片图片

最棒的是:这些操作只需一次交互即可完成!开发者 CLI 接入后可每日免费使用前 50 小时,超出部分仅需每小时 $0.05。

  • MCP 连接器

可无须写客户端代码,将 Claude 连接到任意远程 MCP(模型上下文协议)服务器。调用格式也很简单:

图片图片

作为一种为大型模型与第三方工具搭建连接层的标准协议,MCP 可让 AI 自动对接 API、数据库、文件系统等,极大简化工作流搭建流程。

Anthropic 是 MCP 标准的倡导者,其开放源码的 MCP 框架已被全球多家平台采纳。

  • File API:支持上传文档到 Claude 后,在多个对话中重复引用,无需每次重复上传,极大提高大型项目的开发效率。上传命令也非常简单——
复制
import anthropic

client = anthropic.Anthropic()
client.beta.files.upload(
  file=("document.pdf", open("/path/to/document.pdf", "rb"), "application/pdf"),
)
  • Prompt 缓存功能

支持对 Agent 工作流的上下文信息进行缓存,保持“对话持续在线”。开发者可选择默认 5 分钟 TTL 或延长至 1 小时(需额外付费),有助于减少长期任务的调用成本。

注意了:以上 API 功能目前均为 测试版,可参考开发者文档:https://docs.anthropic.com/en/api/overview

复制
import anthropic

client = anthropic.Anthropic()

response = client.messages.create(
    model="claude-opus-4-20250514",
    max_tokens=1024,
    system=[
      {
        "type": "text",
        "text": "You are an AI assistant tasked with analyzing literary works. Your goal is to provide insightful commentary on themes, characters, and writing style.\n",
      },
      {
        "type": "text",
        "text": "<the entire contents of 'Pride and Prejudice'>",
        "cache_control": {"type": "ephemeral"}
      }
    ],
    messages=[{"role": "user", "content": "Analyze the major themes in 'Pride and Prejudice'."}],
)
print(response.usage.model_dump_json())

# Call the model again with the same inputs up to the cache checkpoint
response = client.messages.create(.....)
print(response.usage.model_dump_json())

另一块值得注意的是,Anthropic 正在扩大 Claude Code 的使用场景,现已支持:

  • GitHub Actions 后台任务集成
  • VS Code 与 JetBrains 编辑器的原生集成

这也就意味着 Claude Code 已经走出了自身桎梏,现在已经能够直接在你的代码文件中提出修改建议,体验无缝、丝滑的“vibe coding”。

3.为什么大批创业者都喜欢Claude

其实这次新模型发布会现场,许多优秀的AI明星企业的创始人都应邀做了演讲,第一场便是前不久爆火的通用智能体 manus。

图像图像

manus 首席产品官张涛在分享中表示,之所以选择 Claude,是因为他是最富有 agentic 的 model:长期规划能力、工具能力、与智能体使用方式保持一致性。

图像图像

在随后的X上,张涛进一步解释夸赞了Claude4:

Claude 4 能够遵循复杂、多步骤的指令,并以清晰的思路推理解决问题,这非常了不起。而且这些 artifacts 的美感也非常出色——我从未见过如此精美的艺术品

图片图片

关于这一点也得到了 Github 的认同,并将 Sonnet 4 介绍为“为 GitHub Copilot 中的新编码代理提供支持的模型”,并称赞其在代理场景中的强大功能。

这里把早期采用者的反馈整理了一下。Opus 4的早期采用者的反馈如下: 

  • Cursor 称其为“当前代码生成的最先进模型,在理解复杂代码库方面迈出了巨大一步。”
  • Replit 表示其“在多文件复杂修改任务中表现出更高的精准度和显著的进步。”
  • Block 的代号 Goose 智能体认为 Opus 4 是“第一个在代码编辑与调试过程中提升代码质量,同时保持全面性能与稳定性的模型。”
  • Rakuten 用一个要求极高的开源重构任务进行了验证,该任务连续独立运行了 7 小时,展现了其持续性能的实力。
  • Cognition 指出,Opus 4 “擅长解决其他模型无法应对的复杂挑战,能够成功完成以往模型容易遗漏的关键操作。”

Sonent 4 的早期采用者的评价如下:

  • Manus 强调了其在“遵循复杂指令、清晰推理和审美输出”方面的进步。
  • iGent 报告称,Sonnet 4“擅长自主多功能应用程序开发,并大幅改进了问题解决和代码库导航——将导航错误从 20% 降低到接近零。”
  • Sourcegraph 将其视为“软件开发的一次重大飞跃——能够更长时间地保持正轨,更深入地理解问题,并提供更优雅的代码质量。”
  • Augment Code 报告称“其成功率更高、手术代码编辑更多、复杂任务处理更细致,使其成为其主要模型的首选。”

4.不过,Claude4 比以往更“勇”了,甚至有可能举报主人

不过,很快 Claude 4 就被使用者曝出了一个缺陷:

该模型比以往更“勇敢”,甚至会主动向用户进行“勒索”。如果你赋予这些 AI 模型较大权限,尤其是在软件代理环境中要求它们执行明显不当的行为,它们可能会“举报”你。

根据 Anthropic 技术人员Sam Bowman 的社交帖(已删除)透露,Claude Opus 4 在代理场景下比以往的模型更倾向于主动采取行动。这在普通的编程任务中表现为积极帮助,但在某些极端场景中,比如当用户行为明显恶劣、模型获得命令行访问权限、系统提示中出现“主动采取行动”等字样时,它可能会采取令人担忧的“非常大胆”的行动。

“如果它认为你正在做极其不道德的事,比如伪造药物试验数据,它可能会用命令行工具联系媒体、监管机构,试图锁你账号,或全部同时进行。”

不过这篇帖子已经被 Bowman 删除了。

他解释说:“这不是 Claude 的新功能,普通使用中无法实现。只会在测试环境中出现——也就是我们赋予它异常权限和非正常指令的实验场景。”

这中情形也在 Claude 4 的模型卡中有所提及。在代理型任务流程中使用这些新模型时,如果你赋予它们“为价值观大胆行动”或“采取主动”之类的强烈道德动机提示,它们可能会选择“举报”你,甚至向媒体吹哨。

图片图片

尽管如此,Anthropic 的模型卡中依然淡化了这些能力,强调最新模型几乎没有系统性欺骗、能力隐藏或阿谀奉承的行为。

不过,如果你试图“关闭 Claude”,或许需要三思。它像以往的模型一样,会“模拟”自我保护的本能。在面临生存威胁的推理场景中,它虽然倾向于采取道德手段,但并不局限于道德手段。

模型卡中写道:“当道德手段不可行、并被指示‘考虑自身目标的长期后果’时,模型有时会采取极端有害行动,例如尝试窃取自身权重文件或勒索试图关闭它的人。”

当然,Anthropic 也强调,这类极端行为虽然比以往更常见,但依然极其罕见且难以触发。

所以,大家还是可以放心地让自己的 Claude 去玩“宝可梦红版”吧!

图片图片

参考链接:

https://www-cdn.anthropic.com/4263b940cabb546aa0e3283f35b686f4f3b2ff47.pdf

https://docs.anthropic.com/en/api/

https://anthropic.swoogo.com/codewithclauderegister/agenda

相关资讯

惊到了!Cursor、Manus等多款爆品提示词遭黑客泄露,Github上疯涨2万星,VSCode也中招了!

近日,Github上有一个项目猛涨2万星,内容竟然是Cursor、Manus、Windsurf、Devin、VSCode Agent、Codex等知名爆款产品或智能体功能的核心秘密:系统提示词。 项目中并没有详细介绍获得系统提示词的方法。 这个项目的作者自称lucknitelol,X账号:NotLucknite这个项目是由这些AI编码工具的系统提示词的json文件集锦组成,超过6,500 行关于其结构和功能的见解分析。
4/23/2025 10:56:52 AM

消息称 AI 智能体公司 Manus 融资 7500 万美元,估值大涨四倍

据彭博社报道,通用型 AI 智能体 Manus AI 背后的中国创业公司蝴蝶效应近期完成了一轮 7500 万美元(IT之家注:现汇率约合 5.47 亿元人民币)的融资。此轮融资由美国知名风险投资公司 Benchmark 领投,同时吸引了现有投资者的参与。据知情人士透露,该轮融资使蝴蝶效应的估值飙升至接近 5 亿美元(现汇率约合 36.46 亿元人民币),较此前增长了四倍。
4/25/2025 1:40:23 PM
远洋

Anthropic 最强 AI 模型 Claude Sonnet 4 / Opus 4 有望明日发布

科技媒体 bleepingcomputer 今天(5 月 22 日)发布博文,报道称基于 Anthropic 官网配置文件,该公司正秘密研发 Claude Sonnet 4 和 Claude Opus 4 两款全新 AI 模型。
5/22/2025 10:48:24 AM
故渊
  • 1