AI在线 AI在线

RLFT

谷歌DeepMind:大模型明知到最优解,但还是故意绕了一圈

现在的大模型(LLMs)已经非常智能。 写文章、编代码、当医生、当老师,样样精通。 于是乎,有人就想了:既然它们这么聪明,能不能让它们自己做决定,当个“智能体”呢?比如,在复杂的环境里自己探索、自己解决问题。
5/6/2025 11:00:51 AM
AI在线
  • 1