AI在线 AI在线

R-4B

DeepSeek、GPT-5都在尝试的快慢思考切换,有了更智能版本,还是多模态

本研究由腾讯混元和中科院自动化所联合研发,团队成员包括 Jie Jiang, Qi Yang, Bolin Ni, Shiming Xiang, Han Hu, Houwen Peng背景:多模态大模型的思考困境当前,业界顶尖的大模型正竞相挑战“过度思考”的难题,即无论问题简单与否,它们都采用 “always-on thinking” 的详细推理模式。 无论是像 DeepSeek-V3.1 这种依赖混合推理架构提供需用户“手动”介入的快慢思考切换,还是如 GPT-5 那样通过依赖庞大而高成本的“专家路由”机制提供的自适应思考切换。 它们距离真正意义上的“智能思考”仍有距离。
9/1/2025 2:14:00 PM
机器之心
  • 1