AI在线 AI在线

RLMT

RLHF与RLVR全都要,陈丹琦团队最新力作将推理能力拓展到通用智能

思考自身行为的后果,并在必要时进行修正 —— 这是人类智慧的核心特征之一。 一个月前,我们曾报道过清华姚班校友、普林斯顿教授陈丹琦似乎加入 Thinking Machines Lab 的消息。 有些爆料认为她在休假一年后,会离开普林斯顿,全职加入 Thinking Machines Lab。
9/28/2025 1:11:00 PM
机器之心
  • 1