AI在线 AI在线

硅基流动升级DeepSeek-R1 等推理模型API ,支持 128K 上下文长度

硅基流动(SiliconCloud)宣布对其 DeepSeek-R1等推理模型 API 进行了一次重要升级,旨在更好地满足开发者对长上下文和灵活参数配置的需求。 此次升级中,多个推理模型的最大上下文长度被提升至128K,使得模型在思考时能够更加充分,输出内容也更为完整。 在此次升级中,多个知名模型,如 Qwen3、QWQ、GLM-Z1等,均支持128K 的最大上下文长度,而 DeepSeek-R1则支持96K。

硅基流动(SiliconCloud)宣布对其 DeepSeek-R1等推理模型 API 进行了一次重要升级,旨在更好地满足开发者对长上下文和灵活参数配置的需求。此次升级中,多个推理模型的最大上下文长度被提升至128K,使得模型在思考时能够更加充分,输出内容也更为完整。

image.png

在此次升级中,多个知名模型,如 Qwen3、QWQ、GLM-Z1等,均支持128K 的最大上下文长度,而 DeepSeek-R1则支持96K。这一提升为复杂推理任务,如代码生成和智能体的应用提供了强有力的支持。

更为重要的是,硅基流动还引入了独立控制 “思维链” 和 “回复内容” 长度的功能。通过这种方式,开发者能够更加高效地利用模型的推理能力。最大回复长度(max_tokens)现在仅用于限制模型最终输出给用户的内容,而思维链长度(thinking_budget)则专门用来控制模型在思考阶段的 Token 使用量。这样的设计使得开发者能够根据实际任务的复杂程度,灵活调整模型的思考深度和输出长度。

以 SiliconCloud 平台的 Qwen3-14B 为例,用户可以通过设置 thinking_budget 和 max_tokens 来分别控制模型的最大思维链长度和最大回复长度。在推理过程中,若思考阶段生成的 Token 数达到 thinking_budget,Qwen3系列推理模型会强制停止思维链推理。而对于其他推理模型,则可能会继续输出思考内容。

image.png

此外,如果最大回复长度超过 max_tokens 或上下文长度超出 context_length 限制,模型输出的回复内容将会被截断,响应中的 finish_reason 字段将标记为 length,表示因长度限制而终止输出。

欲了解更多关于 API 使用的细节,用户可以访问硅基流动的官方文档。随着硅基流动的不断创新,用户体验将持续提升,更多功能也将相继推出。

https://docs.siliconflow.cn/cn/userguide/capabilities/reasoning

划重点:  

🔹 支持128K 最大上下文长度,提升模型思考和输出能力。  

🔹 独立控制思维链和回复内容长度,提高开发者灵活性。  

🔹 若达到长度限制,模型输出将会被截断,并标记原因。  

相关资讯

六位一线 AI 工程师分享自身总结,公开大模型应用摸爬滚打一年心得

六位一线 AI 工程师和创业者,把在大模型应用开发上摸爬滚打一整年的心得,全!分!享!了!(奇怪的六一儿童节大礼包出现了)这篇干货长文,一时间成为开发者社区热议的话题。有网友评价为,大模型领域少有的“有操作性”的实用见解,非常值得一读。这 6 位作者来自不同背景,比如有大厂工程师,也有独立开发者,还有咨询顾问。但他们的共同之处,是过去一年里一直在大模型之上构建真实应用程序,而不只是炫酷的 Demo 演示,他们认为:现在正是非机器学习工程师或科学家,也能把 AI 构建到产品中的时候。在他们的一系列分享中,网友热议的亮
6/1/2024 6:54:15 PM
清源

想把半本《红楼梦》搬进ChatGPT输入框?先把这个问题解决掉

从 GPT-4 的 32k 到谷歌 CoLT5 的 64k 再到最新研究的 200万 token,类ChatGPT 模型们可以处理的文本长度正在急剧增加,这意味着它们的应用范围也越来越广。或许有一天,ChatGPT 能帮乔治·马丁把《冰与火之歌》(权力的游戏)写完呢?过去两年,斯坦福大学 Hazy Research 实验室一直在从事一项重要的工作:增加序列长度。 他们有一种观点:更长的序列将开启机器学习基础模型的新时代 —— 模型可以从更长的上下文、多种媒体源、复杂的演示等中学习。目前,这项研究已经取得了新进展。H
4/27/2023 3:11:00 PM
机器之心

豪掷千万美元拿稀缺域名,硅基智能发布新一代数字人交互基础设施DUIX

近日,AI数字人科技公司硅基智能宣布1000万美元收购稀缺四字母.com域名DUIX.com。 与域名收购同步进行的,是硅基智能旗下同名数字人实时交互平台的正式上线。 据介绍,新推出的平台名为DUIX,全称Dialogue User Interface System,旨在定位为新一代数字人智能交互基础设施。
4/28/2025 3:00:50 PM
AI在线
  • 1