DeepSeek开源新基础模型，但不是V4，而是V3.1-Base

作者： 2025-08-20 09:08

昨晚，深度求索在用户群里宣布「DeepSeek 线上模型版本已升级至 V3.1，上下文长度拓展至 128k」并更新了 UI （去掉了 DeepThink 旁的 R1 标示）之后，在 Hugging Face 发布了一款新模型 DeepSeek-V3.1-Base。模型地址：，该模型是 DeepSeek-V3 系列最新的基础模型。至于为什么命名为 V3.1，而不是像之前以前命名为 V3 带四位日期数字的形式（如 V3-0324），尽管社区有诸多猜测，但深度求索官方尚未给出明确说明 —— 和该公司之前的操作一样，这一次同样是模型先行，说明和宣传还在后面。

昨晚，深度求索在用户群里宣布「DeepSeek 线上模型版本已升级至 V3.1，上下文长度拓展至 128k」并更新了 UI （去掉了 DeepThink 旁的 R1 标示）之后，在 Hugging Face 发布了一款新模型 DeepSeek-V3.1-Base。

模型地址：https://huggingface.co/deepseek-ai/DeepSeek-V3.1-Base

从名字也能看出来，该模型是 DeepSeek-V3 系列最新的基础模型。至于为什么命名为 V3.1，而不是像之前以前命名为 V3 带四位日期数字的形式（如 V3-0324），尽管社区有诸多猜测，但深度求索官方尚未给出明确说明 —— 和该公司之前的操作一样，这一次同样是模型先行，说明和宣传还在后面。

该模型一发布就吸引了 AI 社区的广泛关注，短短几个小时就已经冲上了 Hugging Face 热门模型榜第 4 位！

DeepSeek开源新基础模型，但不是V4，而是V3.1-Base

具体技术指标上，DeepSeek-V3.1-Base 与 DeepSeek-V3 差别不大，同样的参数量，采用了混合专家（MoE）架构，拥有 128k 上下文长度。

DeepSeek开源新基础模型，但不是V4，而是V3.1-Base

整体来看，社交网络上对深度求索的这次更新看法不一。有人表示非常振奋，认为这是深度求索在为接下来的 DeepSeek-V4 和 DeepSeek-R2 做铺垫，但也有人认为这次更新不够亮眼，没有达到该公司之前的一贯水准。

对此，你怎么看？

微软等开源AIOpsLab，可构建自主云AI Agent

微软、加州大学伯克利分校、伊利诺伊大学等研究人员联合开源了，一个专用于云自动化运维的AI Agents——AIOpsLab。 AIOpsLab能模拟真实云服务环境中的复杂操作任务，实现故障的自动化检测、定位和解决问题。还具备高度的可观测性，能够收集和分析关键的遥测数据，确保对系统状态和应用环境的深入洞察。

1/27/2025 9:51:24 AM AIGC开放社区

DeepSeek开源Janus-Pro-7B：多模态AI模型性能超越DALL-E 3 和 Stable Diffusion 3!

中国人工智能公司 DeepSeek 的 R1“推理”人工智能已经引起了广泛关注，位居应用商店排行榜首位并改变了股市。随后DeepSeek又宣布开源新一代多模态模型Janus-Pro-7B，该模型在图像生成、视觉问答等任务中全面超越 OpenAI 的 DALL-E 3 和 Stable Diffusion 3，并以“理解-生成双路径”架构和极简部署方案引发AI社区轰动。性能表现：小模型吊打行业巨头Janus-Pro-7B虽仅有70亿参数（约为GPT-4的1/25），却在关键测试中碾压对手：文生图质量：在GenEval测试中以80%准确率击败DALL-E 3（67%）和Stable Diffusion 3（74%）复杂指令理解：在DPG-Bench测试中达84.19%准确率，能精准生成如“山脚下有蓝色湖泊的雪山”等复杂场景多模态问答：视觉问答准确率超越GPT-4V，MMBench测试得分79.2分接近专业分析模型技术突破：像“双面神”分工协作传统模型让同一套视觉编码器既理解图片又生成图片，如同让厨师同时设计菜单和炒菜。

2/7/2025 11:00:00 AM AIGC Studio

李飞飞、DeepSeek为何偏爱这个国产模型？

斯坦福李飞飞团队的一篇论文，近来在AI圈子掀起了一场飓风。他们仅用1000个样本，在16块H100上监督微调26分钟，训出的新模型s1-32B，竟取得了和OpenAI o1、DeepSeek R1等尖端推理模型相当的数学和编码能力！团队也再次证明了测试时Scaling的威力。

2/8/2025 9:30:00 AM 新智元

DeepSeek开源新基础模型，但不是V4，而是V3.1-Base

相关资讯

微软等开源AIOpsLab，可构建自主云AI Agent

DeepSeek开源Janus-Pro-7B：多模态AI模型性能超越DALL-E 3 和 Stable Diffusion 3!

李飞飞、DeepSeek为何偏爱这个国产模型？