AI在线 AI在线

扩展规律

系统梳理 Test-Time Compute 的主要实现路径

当前大语言模型(LLM)最有趣的研究趋势之一,是推理模型的兴起 —— 这类模型在给出答案前会花费时间进行思考。 这种技术通常被称为「测试时计算」(test-time compute),即在推理阶段进行深度推理。 其实在模型推理过程中应用搜索或深度推理的思路早已存在(例如 AlphaZero[1],以及 Transformer 诞生之前就尝试用类似方法解决旅行商问题的论文[2]),但 o1 的出现让这一理念重新回到了主流视野。
9/4/2025 5:16:59 PM
  • 1