DeepSeek R1
DeepSeek R1也会大脑过载?过度思考后性能下降,少琢磨让计算成本直降43%
原来,大型推理模型(Large Reasoning Model,LRM)像人一样,在「用脑过度」也会崩溃,进而行动能力下降。 近日,加州大学伯克利分校、UIUC、ETH Zurich、CMU 等机构的研究者观察到了这一现象,他们分析了 LRM 在执行智能体任务过程中存在的推理 - 行动困境,并着重强调了过度思考的危险。 论文标题:The Danger of Overthinking: Examining the Reasoning-Action Dilemma in Agentic Tasks论文链接:「单机模式」下,这些模型在实时互动的环境中仍是「思想上的巨人,行动中的矮子」。
3/2/2025 2:07:00 PM
机器之心
仅靠逻辑题,AI数学竞赛能力飙升!微软、九坤投资:7B小模型也能逼近o3-mini
AIxiv专栏是AI在线发布学术、技术内容的栏目。 过去数年,AI在线AIxiv专栏接收报道了2000多篇内容,覆盖全球各大高校与企业的顶级实验室,有效促进了学术交流与传播。 如果您有优秀的工作想要分享,欢迎投稿或者联系报道。
2/25/2025 11:29:00 AM
机器之心
昆仑万维旗下 Opera 接入 DeepSeek R1 模型,支持本地个性化部署
Opera 在 2024 年将内置本地大语言模型(LLM)引入 Web 浏览器,提供超 50 种 LLM 的访问权限。Opera Developer 利用 Ollama 框架(由 llama.cpp 实现)支持了 DeepSeek R1 系列模型部署。
2/19/2025 10:13:41 PM
归泷(实习)
200多行代码,超低成本复现DeepSeek R1「Aha Moment」!复旦大学开源
AIxiv专栏是AI在线发布学术、技术内容的栏目。 过去数年,AI在线AIxiv专栏接收报道了2000多篇内容,覆盖全球各大高校与企业的顶级实验室,有效促进了学术交流与传播。 如果您有优秀的工作想要分享,欢迎投稿或者联系报道。
2/18/2025 10:24:00 AM
机器之心
免费!「DeepSeek-R1 671B满血版」不卡、不限次!问小白火速支援
最近 DeepSeek 太火,问题来了,你是不是经常遇到这个情况? 不卡顿、联网的、满血版 DeepSeek R1 越来越香,也越来越难享用到? 问小白来了,火速上线、火线支援。
2/14/2025 10:16:00 AM
机器之心
玩转DeepSeek!5个超实用的新手技巧
大家好,我是小六,借着这次 DeepSeek 的热度,给大家分享一些关于 deepseek 的技巧。 这个春节 DeepSeek 成为了互联网圈的热门话题,这两天一度登顶中、日、美三个 App Store 榜首。 几乎一夜之间,所有人都在关注 DeepSeek,甚至在老家完全没用过 AI 的亲戚都在问 DeepSeek 是什么,怎么用。
2/12/2025 12:17:06 AM
Mr.小六
爆肝48小时!学会这8招,让DeepSeek变得超好用!
更多相关介绍:. 重磅好文! 8个章节带你全方位了解DeepSeek这两天,DeepSeek-R1 火的飞起,在中日美三个 Appstore 榜上登顶。
2/8/2025 12:04:55 AM
解决师Blue
免费!潞晨携手华为昇腾,国产算力DeepSeek R1推理API及云镜像服务来了
DeepSeek-R1 系列模型的开源,因其出色的性能和低廉的开发成本,已引发全球的热切讨论和关注。 潞晨科技携手华为昇腾,联合发布基于国产 910B 算力的 DeepSeek R1 系列推理 API,及云镜像服务。 DeepSeek R1 系列推理 API 免费体验在本次发布中,潞晨以自研国产推理引擎为技术底座,成功实现了国产华为昇腾 910B 算力与 DeepSeek R1 系列模型的推理适配优化,性能表现与使用高端 GPU 持平,为开发者提供高效、灵活、稳定的 AI 推理服务,助力企业实现降本增效,加速智能业务基于国产软硬件体系快速部署落地。
2/4/2025 8:39:00 PM
机器之心
o3-mini 碾压DeepSeek R1?一条python程序引发近400万围观
AI 圈的头条被 DeepSeek 承包了十几天,昨天,OpenAI 终于坐不住了,推出了全新推理模型系列 o3-mini。 不仅首次向免费用户开放了推理模型,而且相比之前的 o1 系列,成本更是降低了 15 倍之多。 OpenAI 也称这是其推理模型系列中最新、最具成本效益的模型:刚刚上线,已经有网友迫不及待的拿它和席卷整个大模型圈的国产大模型 DeepSeek R1 进行对比了。
2/2/2025 11:54:00 PM
机器之心
完整的671B MoE DeepSeek R1怎么塞进本地化部署?详尽教程大放送!
AIxiv专栏是AI在线发布学术、技术内容的栏目。 过去数年,AI在线AIxiv专栏接收报道了2000多篇内容,覆盖全球各大高校与企业的顶级实验室,有效促进了学术交流与传播。 如果您有优秀的工作想要分享,欢迎投稿或者联系报道。
2/2/2025 11:51:00 PM
机器之心
- 1
资讯热榜
标签云
人工智能
OpenAI
AIGC
AI
ChatGPT
AI绘画
DeepSeek
数据
模型
机器人
谷歌
大模型
Midjourney
智能
用户
开源
学习
GPT
微软
Meta
图像
AI创作
技术
论文
Stable Diffusion
马斯克
Gemini
算法
蛋白质
芯片
代码
生成式
英伟达
腾讯
神经网络
研究
计算
Anthropic
3D
Sora
AI for Science
AI设计
机器学习
开发者
GPU
AI视频
华为
场景
人形机器人
预测
百度
苹果
伟达
Transformer
深度学习
xAI
模态
字节跳动
Claude
大语言模型
搜索
驾驶
具身智能
神器推荐
文本
Copilot
LLaMA
算力
安全
视觉
视频生成
训练
干货合集
应用
大型语言模型
科技
亚马逊
智能体
DeepMind
特斯拉