DeepSeek-V

DeepSeek-V3：硬件与模型的完美统协，奏响 AI 高效新乐章

DeepSeek-V3：硬件与模型的完美统协，奏响 AI 高效新乐章

大家好，我是肆〇柒。 DeepSeek-V3 曾经一度备受全球瞩目，从 V3 发布至今，这一开源模型已经在众多企业场景中成功落地。然而，在落地过程中，由于其复杂的工程细节，相信许多团队也遇到了不少挑战。

5/28/2025 1:20:00 AM 肆零柒

DeepSeek-V3新论文：软硬协同，砸碎“算力神话”！

DeepSeek-V3新论文：软硬协同，砸碎“算力神话”！

当AI大模型越来越“吃”硬件，把内存、算力、带宽逼到极限，追赶者们，或者说整个行业，除了干等硬件升级，还能怎么办？ ChatGPT横空出世，大模型竞赛白热化。英伟达的GPU成了硬通货，算力就是一切。

5/21/2025 2:01:22 PM

更新版DeepSeek-V3官方报告出炉！模型参数685B!数学、代码性能击败GPT-4.5

更新版DeepSeek-V3官方报告出炉！模型参数685B!数学、代码性能击败GPT-4.5

出品 | 51CTO技术栈（微信号：blog51cto）刚刚，DeepSeek放出了更新模型的官方报告，并发推文：🚀 DeepSeek-V3-0324 现已推出！ 🔹推理能力大幅提升🔹更强的前端开发技能🔹更智能的工具使用能力✅对于非复杂推理任务，我们建议使用 V3 — 只需关闭“DeepThink”🔌 API 使用保持不变📜模型现在根据 MIT 许可证发布，就像 DeepSeek-R1 一样！报告细节已经可以在HF上进行查看：💫模型参数：685B✨更新版V3的几项改进：1.推理能力基准测试表现显著提升： 2.前端 Web 开发- 提高代码的可执行性 - 生成更美观的网页和游戏前端 3.中文写作能力风格和内容质量提升 - 符合 R1 写作风格 - 中长篇写作质量更优 4.功能增强 - 多轮交互改写能力提升 - 翻译质量和书信写作优化 5.中文搜索能力- 报告分析请求的输出更加详细 6.函数调用改进- 函数调用准确率提升，修复了 V3 版本中的相关问题在推文下，海外网友纷纷在评论区“催更”DeepSeek-R2!相信不久的将来，DeepSeek就会给我们想要的惊喜吧！

3/26/2025 7:14:33 AM

DeepSeek-R1详细解读！

DeepSeek-R1详细解读！

DeepSeek-R1爆火，今天来详细看下。论文地址：：：：现有LLMs在推理任务上的改进主要依赖监督微调（SFT）和后训练（Post-Training）方法，但这些方法需要大量人工标注数据且成本高昂。 OpenAI的o1系列模型虽通过扩展推理链（Chain-of-Thought, CoT）提升了性能，但其测试时扩展仍存在挑战。

2/19/2025 8:00:00 AM GoldMa

资讯热榜

免费！让图片放大不失真的位图转矢量图神器 Tmttool AI应用新纪元：2025中国AI应用排行榜榜单揭晓丨2025年1月 6秒视频10秒生成！全新AI视频神器 Grok Imagine 深度体验+元提示词分享最火、最全的Agent记忆综述，NUS、人大、复旦、北大等联合出品后悔没早发现！教你用谷歌Gemini生成精美PPT（附提示词） GGUF 是什么？一文看懂大模型里最火的模型格式 Sora、可灵、即梦哪家强？AI视频软件深度测评！ Mac也能跑Qwen3，一文看懂本地部署qwen 3配置要求

标签云

AI 人工智能 OpenAI AIGC 模型 ChatGPT 谷歌 DeepSeek AI新词 AI绘画大模型机器人数据 Midjourney 开源 Meta 微软智能用户 GPT 学习英伟达 Gemini 智能体技术马斯克 Anthropic 图像 AI创作训练 LLM 论文 AI for Science 代码腾讯苹果算法 Agent Claude 芯片具身智能 Stable Diffusion xAI 蛋白质人形机器人开发者生成式神经网络机器学习 AI视频 3D 字节跳动大语言模型 RAG Sora 百度研究 GPU 生成华为工具 AGI 计算生成式AI AI设计大型语言模型搜索亚马逊 AI模型视频生成特斯拉 DeepMind 场景 Copilot 深度学习 Transformer 架构 MCP 编程视觉