AI在线 AI在线

stress-testing methodology

Anthropic、Thinking Machines Lab论文曝光:30万次压力测试揭示AI规范缺陷

即便是最详细的模型规范,也存在内部矛盾、粒度不足与解释歧义。 现如今,LLM 正越来越多地受到模型规范的约束,这些规范为模型的行为准则与伦理边界提供了清晰定义。 它们构成了 Constitutional AI(宪法式 AI) 与 Deliberate Alignment(审慎对齐) 的核心基础。
10/25/2025 11:05:00 PM
机器之心
  • 1