AI在线 AI在线

强强联手!深度求索、寒武纪同步发布DeepSeek-V3.2模型架构和基于vLLM的模型适配源代码

机器之心报道机器之心编辑部2025 年 9 月 29 日,深度求索公司发布新一代模型架构 DeepSeek-V3.2 ,引发行业广泛关注。 令人瞩目的是,在该大模型发布的同时,寒武纪也官宣了对 DeepSeek-V3.2 的适配,并开源大模型推理引擎 vLLM 源代码。 深度求索公司正式发布的 DeepSeek-V3.2-Exp 模型,是一个实验性(Experimental)的版本。

机器之心报道

机器之心编辑部

2025 年 9 月 29 日,深度求索公司发布新一代模型架构 DeepSeek-V3.2 ,引发行业广泛关注。令人瞩目的是,在该大模型发布的同时,寒武纪也官宣了对 DeepSeek-V3.2 的适配,并开源大模型推理引擎 vLLM 源代码。

深度求索公司正式发布的 DeepSeek-V3.2-Exp 模型,是一个实验性(Experimental)的版本。作为迈向新一代架构的中间步骤,V3.2-Exp 在 V3.1-Terminus 的基础上引入了 DeepSeek Sparse Attention(一种稀疏注意力机制),针对长文本的训练和推理效率进行了探索性的优化和验证。

目前,DeepSeek 官方 App、网页端、小程序均已同步更新为 DeepSeek-V3.2-Exp,同时 API 大幅度降价,欢迎广大用户体验测试并提供反馈意见。

同时,寒武纪已同步实现对深度求索公司最新模型 DeepSeek-V3.2-Exp 的适配,并开源大模型推理引擎 vLLM-MLU 源代码。代码地址和测试步骤见文末,开发者可以在寒武纪软硬件平台上第一时间体验 DeepSeek-V3.2-Exp 的亮点。

这一同步发布适配的“高能”操作,在业内专家看来,背后蕴含着中国顶尖科技企业深度协同的重要信号。

从技术层面来看,这款新大模型的体量相当可观,达到了 671GB 。据行业测算,在带宽充足的理想条件下,仅完成该大模型的下载,就需要耗费约 8-10 个小时。而芯片与大模型的适配,涉及底层架构优化、算力资源匹配、兼容性调试等一系列复杂工作,绝非短时间内能够完成。

有 AI 行业资深专家分析指出:“如此快速的适配响应,充分说明寒武纪早在 DeepSeek-V3.2 发布前就已启动适配研发,双方在技术层面的沟通与协作早已悄然展开。双方都是低调务实的公司,前期秘而不宣,估计早就已经相向而行了。”拒绝炒作、专注技术,正是当下中国顶尖科技企业行事风格的典型体现。

全球 AI 竞争日趋激烈,中国 AI 产业要想在国际舞台上站稳脚跟、占据优势地位,离不开头部企业间的深度协同合作。此次大模型与 AI 芯片领军企业的快速联动,正是国内高科技企业协同创新的有力例证。

我们可以期待,本次产业链上下游领军企业的深度协同,将大幅降低大模型用户在长序列场景下的训推成本,助力 AI 应用的 “涌现”。

DeepSeek开源模型获取方式:

https://huggingface.co/deepseek-ai/DeepSeek-V3.2-Exp

vLLM-MLU DeepSeek-V3.2-Exp适配的源码获取方式:

https://github.com/Cambricon/vllm-mlu

相关资讯

苏宁打响国产AI反击战:灵思大模型携手寒武纪算力平台,推理效率暴涨30%训练成本狂降70%

苏宁打响国产AI反击战:灵思大模型携手寒武纪算力平台,推理效率暴涨30%训练成本狂降70%

一场关于算力国产化的技术革命正在零售巨头苏宁易购内部悄然上演。 当海外AI芯片供应链频频受阻,当算力依赖成为悬在中国科技企业头上的达摩克利斯之剑时,苏宁易购却以一种近乎完美的方式给出了答案——让国产算力与自研大模型碰撞出令人震撼的火花。 苏宁易购旗下的灵思大模型刚刚完成了一次意义深远的技术升级,这次升级的幕后英雄正是国产寒武纪算力平台。
9/2/2025 2:46:48 PM AI在线
商汤日日新Seko系列模型与寒武纪成功适配,国产算力&多模态AI实现关键跨越

商汤日日新Seko系列模型与寒武纪成功适配,国产算力&多模态AI实现关键跨越

12月15日,商汤科技基于在生成式AI与多模态交互领域的技术积累,正式发布Seko2.0——行业首个多剧集生成智能体。 该智能体在多剧集视频生成的一致性方面展现出显著优势,其背后依托的是商汤自研的日日新Seko系列模型,包括SekoIDX、SekoTalk等图像与视频生成多模态模型所构建的技术底座。 商汤日日新Seko系列模型已完成对国产AI芯片寒武纪的适配,国产算力对AIGC核心场景的支持实现了从语言到多模态的关键跨越。
12/15/2025 2:55:00 PM 新闻助手
商汤发布行业首个“多剧集生成智能体”Seko2.0,国产AI芯片首次打通多模态AIGC全链路

商汤发布行业首个“多剧集生成智能体”Seko2.0,国产AI芯片首次打通多模态AIGC全链路

商汤科技正式推出Seko2.0——全球首个专注于多剧集视频生成的智能体,标志着AI视频生成从单片段创作迈向连续叙事的新阶段。 该系统能够生成角色、场景、风格高度一致的多集短视频内容,在剧情连贯性、人物稳定性与视觉统一性上实现行业突破,为短剧、广告、教育等场景提供可规模化的AI内容生产方案。 0 的背后,是商汤自研“日日新Seko”系列多模态大模型的深度协同。
12/15/2025 6:01:08 PM AI在线