AI在线 AI在线

DeepSeek-V3.1发布:专为国产芯片设计浮点数格式

近日,深度求索(DeepSeek)正式发布新一代大模型 DeepSeek-V3.1,并首次公开提及采用“UE8M0 FP8 Scale”参数精度。 这一技术细节的披露,迅速引发行业关注。 官方在公众号文章中进一步解释,UE8M0 FP8 是专为下一代国产芯片设计的浮点数格式,旨在提升计算效率并降低资源消耗。

DeepSeek-V3.1发布:专为国产芯片设计浮点数格式

近日,深度求索(DeepSeek)正式发布新一代大模型 DeepSeek-V3.1,并首次公开提及采用“UE8M0 FP8 Scale”参数精度。这一技术细节的披露,迅速引发行业关注。

官方在公众号文章中进一步解释,UE8M0 FP8 是专为下一代国产芯片设计的浮点数格式,旨在提升计算效率并降低资源消耗。这一表述,被外界解读为 DeepSeek 在软硬件协同优化方面的战略布局,也让人不禁思考:在AI芯片竞争日趋激烈的背景下,国产新芯是否真的能够借此实现技术破局?

从技术层面来看,FP8(8位浮点数)并非全新概念。它属于IEEE浮点算术标准中的一种数据类型,相比传统FP16或FP32,能在保持相对较高数值精度的同时,显著减少内存占用和计算开销,尤其适合大规模AI推理与训练。而“UE8M0”这一命名,则体现出其定制化特性。根据官方表述,它针对国产芯片架构做了专门优化。这一点至关重要,因为它不仅涉及算法与硬件的适配,更可能影响到整个AI计算生态的构建。

目前,全球AI芯片市场仍由英伟达(NVIDIA)主导,其GPU配合CUDA生态几乎成为大模型训练的事实标准。而国内虽有多家企业投入AI芯片研发,如华为昇腾、寒武纪、天数智芯等,但在软件栈、开发者工具、模型兼容性等方面仍面临挑战。DeepSeek 此次明确将模型精度与“国产芯片”进行绑定,显示出一种推动国产化全栈技术发展的意图。通过从模型层面主动适配新型硬件,或许能在一定程度上缓解国产芯片在生态支持上的不足。

此外,DeepSeek-V3.1 本身也体现出显著的技术进步。据官方信息,其Base模型在V3基础上新增训练了840B tokens,模型规模与性能进一步提升。同时,团队将Base模型及经过后训练的完整模型均在Hugging Face和魔搭ModelScope平台开源,体现出较强的开放性和社区共建意识。这一做法有助于吸引更多开发者参与测试、优化乃至应用于实际场景,从而加速技术迭代与应用落地。

然而,能否真正实现“破局”,仍存在多方面挑战。首先,国产芯片在制程工艺、内存带宽、互联技术等硬件基础上与国际顶尖水平仍存差距。其次,软件生态的成熟非一日之功,需要芯片厂商、算法公司、应用开发者共同长期投入。再者,国际市场政策环境的不确定性,也可能影响相关技术的全球推广与合作。

总体来看,DeepSeek 此次发布不仅是一次模型升级,更可视为对国产AI计算体系的一次重要推动。通过模型与芯片的协同设计,有望在特定场景下实现更高效的计算,并逐步减少对国外技术的依赖。但能否真正打破现有市场格局,仍需看后续硬件性能、软件适配、开发者接受度以及商业落地等多方面的实际表现。

国产芯片的崛起绝非单点突破所能实现,它需要产业链上下游的紧密配合与持续创新。DeepSeek-V3.1 及其所代表的软硬件协同策略,或许正是这条长路上的重要一步。

相关资讯

万字长文总结:DeepSeek 引发的 AI Infra 变革正在「加速」丨GAIR Live

作者丨朱可轩编辑丨陈彩娴DeepSeek 在进一步点燃 AI Infra 可能性的同时,也带来了新的竞争格局,在 DeepSeek 的范式上,其他厂商能否追赶甚至实现超越尤为关键,这决定了他们能否继续留在牌桌上,当前,AI Infra 已然进入新的洗牌期。 圆桌主持人为 3C AGI Partners 创始人兼 CEO 王康曼,她一直专注于投资 AI Infra 赛道,其创立基金成立后仅一年多就已经成为英伟达全球 VC 联盟成员,也投资了海外发展势头最猛的两家 AI 芯片创业公司 Cerebras Systems 和 Groq。 同时,圆桌还邀请了魔形智能创始人CEO徐凌杰、探微芯联 CEO 刘学和清程极智联合创始人师天麾共同开启了一场深度对话。
3/31/2025 3:50:00 PM
朱可轩

究竟会花落谁家?DeepSeek最新大模型瞄准了下一代国产AI芯片

软件 硬件的全链路国产 AI 体系来了? 这几天,不论国内国外,人们都在关注 DeepSeek 发布的 V3.1 新模型。 它采用了全新的混合推理架构,让模型能在一个统一框架内支持「思考」与「非思考」两种模式。
8/22/2025 1:42:00 PM
机器之心

国产AI新突破!DeepSeek-V3.1大模型发布

近日,平安证券发布的计算机行业报告透露,DeepSeek-V3.1大模型已正式上线。 这款新模型采用了全新的 UE8M0FP8Scale 参数精度,大幅提升了工具的使用效率和智能体在各类任务中的表现。 这一创新不仅令开发者倍感振奋,也为国内芯片产业的发展注入了新的动力。
8/26/2025 9:26:51 AM
AI在线
  • 1