NoThinking
推理模型其实无需「思考」?伯克利发现有时跳过思考过程会更快、更准确
当 DeepSeek-R1、OpenAI o1 这样的大型推理模型还在通过增加推理时的计算量提升性能时,加州大学伯克利分校与艾伦人工智能研究所突然扔出了一颗深水炸弹:别再卷 token 了,无需显式思维链,推理模型也能实现高效且准确的推理。 这项研究认为显式思考过程会显著增加 token 使用量和延迟,导致推理效率低下。 就比如在控制延迟条件时,NoThinking 的效果就显著好于 Thinking。
4/20/2025 10:24:00 AM
机器之心
- 1
资讯热榜
标签云
AI
人工智能
OpenAI
AIGC
模型
ChatGPT
DeepSeek
AI绘画
谷歌
机器人
数据
大模型
Midjourney
开源
智能
Meta
用户
微软
GPT
学习
技术
图像
Gemini
马斯克
智能体
AI创作
AI新词
Anthropic
英伟达
论文
训练
代码
算法
LLM
Stable Diffusion
芯片
蛋白质
腾讯
开发者
Claude
苹果
AI for Science
Agent
生成式
神经网络
机器学习
3D
研究
xAI
生成
人形机器人
AI视频
计算
百度
Sora
工具
GPU
华为
RAG
AI设计
大语言模型
字节跳动
具身智能
搜索
大型语言模型
场景
深度学习
视频生成
预测
视觉
AGI
伟达
架构
Transformer
神器推荐
亚马逊
特斯拉
编程
Copilot
DeepMind