DeepSeek

2025美国最新奥数题，让大模型集体翻车，DeepSeek R1平均分也不到5%

当 AI 翻开奥数题，CPU 也烧了！还记得那些被奥数题折磨得彻夜难眠的日子吗？当你在凌晨三点对着一道几何证明题抓耳挠腮、怀疑人生的时候，你可能会想：「要是有个超级大脑能帮我解决这些问题该多好啊！

4/2/2025 6:15:00 PM 机器之心

7小时开发完成！北京语言大学团队好样的！国产大模型DeepSeek首次用于地震国际救援！

出品 | 51CTO技术栈（微信号：blog51cto）中国科技再立大功！ 4月初，缅甸发生中部7.9级地震后，中国驻缅甸使馆称，前方在使用基于DeepSeek紧急开发的中缅英互译系统，据了解，该系统是国家应急语言服务团秘书处和北京语言大学迅速组建的语言服务支持团队开发出来的。开发过程团队接到任务后争分夺秒，利用国产大模型DeepSeek仅仅七小时内就开发出中缅英三语实时互译系统，并紧急部署到救援人员的手机和终端设备上。

4/2/2025 4:07:07 PM

DeepSeek 首次用于地震国际救援，7 小时攻克缅甸救灾语言关

近日缅甸发生7.9级地震，中国团队用DeepSeek 7小时开发中缅英互译系统，助力救援。至今700余人使用该平台，这是中国大模型首用于地震国际救援。#DeepSeek #地震国际救援 #中缅英互译系统

4/2/2025 11:33:04 AM 远洋

DeepSeek 新专利公布：减少数据采集时网络资源消耗

可对未下载的链接进行质量推断，通过择优下载分配额度的方式，减少低质量网页下载和重复下载，提高数据质量及下载效率，减少在数据采集过程中网络资源的消耗。

4/2/2025 10:23:29 AM 清源

DeepSeek-V3击败R1开源登顶！杭州黑马撼动硅谷AI霸主，抹去1万亿市值神话

DeepSeek依然很能打，春节余波还在扩散！据AI产品分析平台aitools.xyz统计，DeepSeek每月新增网站访问量超过了ChatGPT。作为异军突起的现象级产品，DeepSeek的增长速度除了创造AI产品的增长奇迹，更是重新定义了全球的AI竞赛格局。

4/2/2025 9:21:00 AM 新智元

DeepSeek R1本地训练全流程实操指南，手把手教你打通其“任督二脉”

作者 | asher许多关于 DeepSeek R1 的复现文章，主要聚焦在“rewards的设计、训练指标的变化、benchmark测评”这些内容，但是对于“本地训练”这个开启深度探索的关键前置步骤，却很少有人深挖。可能有人觉得，照着readme操作就能轻松训练了吧？太天真啦！

4/2/2025 9:00:00 AM 腾讯技术工程

「DeepSeek-V3 技术解析」：无辅助损失函数的负载均衡

在混合专家模型（MoE）的实践中，负载不均衡俨然已成为制约模型性能提升的关键瓶颈之一。传统的均衡策略往往需要引入复杂的辅助损失函数，不仅增加了训练的复杂度，还可能干扰模型的核心学习目标。工程师们在提升模型效率的道路上，一直苦苦追寻着一个优雅而高效的平衡解决方案。

4/2/2025 2:17:00 AM 追求卓越的

DeepSeek-R1之后推理模型发展如何？Raschka长文梳理后R1时代14篇重要论文

近日，Deepseek R1 等一系列推理大语言模型已成为 2025 年最热门的话题之一。在过去的几周里，研究人员推出了许多改进推理的新策略，包括扩展简单测试 - 时间规模化（S1）、关联思维链（Chain of Associated thoughts）、Inner Transformer 等方法。不仅如此，还有来自腾讯实验室的研究人员探索了 Thoughts Are All Over the Place，通过衡量不正确答案中的 token 效率来鼓励模型对每条推理路径进行更深入的探索；来自美国马里兰大学和橡树岭国家实验室等机构联合提出了 Recurrent Block，通过重复调用同一个循环体的方式，在推理阶段可以迭代任意多次；以及来自美国 Zoom 视频通讯公司的研究团队提出了 Chain of Draft（CoD），基于更接近人类推理的提示策略提出了草稿图，这是一种优先考虑效率和推理的提示词策略。

4/1/2025 4:14:00 PM 机器之心

打工人自救指南：Manus+DeepSeek+Coze破局AI淘汰

前言2025年的中国AI竞技场中，三股技术浪潮正深度重构普通人的生存法则——DeepSeek让普通人年也能享受硅谷级智囊服务；Manus让小微企业人力成本直降70%（简历筛选、财务核算等）；Coze的智能体孵化出了新兴职业（智能体架构师、智能体调教师等）。当人们还在争论AI是否替代人类时，这三个现象级工具已悄然定义了智能技术的三种进化路径：认知突破、执行闭环与生态革命。这场技术革命的核心分野，在于三者对人类能力的增强坐标差异：• DeepSeek强化认知维度：用强化学习与模型蒸馏技术，将专业决策的颗粒度细化至人类难以企及的层级（如投资策略模拟准确率达97.3%）；• Manus重构执行范式：通过规划-执行-验证（PEV）架构，替代HR筛选、财务核算等流程性工作，实现企业人力成本大幅度降低；• Coze激活创新生态：其插件市场增长率达200%，催生“智能体调教师”“智能体架构师”等新职业，让技术民主化从口号变为现实。

4/1/2025 9:49:06 AM 后端小肥肠

DeepSeek能否超越ChatGPT？营销人员应该关注什么

在关于创业的商业课程中，初创企业进入市场时面临一个战略决策，即要与竞争对手保持同步。对于一项新产品，你必须快速推向市场，或者为市场带来与众不同的东西。如今，AI初创企业面临着比大多数初创企业更短的跑道来做出这一选择，因为当前领导者之间的竞争依然激烈——包括Perplexity、Claude、谷歌的Gemini和OpenAI的ChatGPT。

4/1/2025 7:00:00 AM Pierre DeBois

一站式解决Deepseek微调三大痛点：数据集、GPU资源、微调手册与源码

1.Deepseek微调痛点Deepseek模型微调是提升在行业领域表现的关键，但你是否被这些问题卡住？数据集：不知道如何准备，担心数据泄露？ GPU算力：算力不足，Deepseek不同模型尺寸对应的GPU配置选择一头雾水？

3/31/2025 5:10:00 PM 九章云极DataCanvas

万字长文总结：DeepSeek 引发的 AI Infra 变革正在「加速」丨GAIR Live

作者丨朱可轩编辑丨陈彩娴DeepSeek 在进一步点燃 AI Infra 可能性的同时，也带来了新的竞争格局，在 DeepSeek 的范式上，其他厂商能否追赶甚至实现超越尤为关键，这决定了他们能否继续留在牌桌上，当前，AI Infra 已然进入新的洗牌期。圆桌主持人为 3C AGI Partners 创始人兼 CEO 王康曼，她一直专注于投资 AI Infra 赛道，其创立基金成立后仅一年多就已经成为英伟达全球 VC 联盟成员，也投资了海外发展势头最猛的两家 AI 芯片创业公司 Cerebras Systems 和 Groq。同时，圆桌还邀请了魔形智能创始人CEO徐凌杰、探微芯联 CEO 刘学和清程极智联合创始人师天麾共同开启了一场深度对话。

3/31/2025 3:50:00 PM 朱可轩

文小言上新了！支持多模型调度，升级全新语音大模型、图片问答能力

3月31日，新一期百度AI DAY上，文小言宣布完成品牌焕新与功能升级。除品牌视觉形象焕新外，文小言聚焦模型开放与功能创新，支持多模型融合调度，升级全新语音大模型、图片问答、AI生图生视频等多项能力，为用户带来更智能、更高效的AI体验。百度AI产品创新业务负责人薛苏强调：“AI的未来不再是单纯的技术参数比拼，而是如何通过多模型协同，真正为用户创造价值。

3/31/2025 3:22:01 PM

DeepSeek 月访问量超越 ChatGPT，成为 AI 工具新星

根据3月31日发布的报告，AI 分析平台 aitools.xyz 揭示，DeepSeek 已迅速崛起，成为全球增长最快的 AI 工具之一。令人惊讶的是，该平台在2025年2月的月访问量达到了5.25亿次，成功超过了 OpenAI 的 ChatGPT，后者的月访问量为5亿次。这一变化标志着 DeepSeek 在 AI 市场的强劲增长，令业内人士为之一振。

3/31/2025 11:54:00 AM AI在线

2 月 DeepSeek 新访问量力压 ChatGPT，增长势头强劲

中国AI公司DeepSeek在2025年2月新访问量达5.247亿次，超越ChatGPT的5亿次，市场份额从2.34%增至6.58%，展现强劲增长势头。全球AI工具2月总访问量120.5亿次，独立访客30.6亿。#AI工具##DeepSeek#

3/31/2025 11:17:02 AM 远洋

基于DeepSeek推理的文本聚类

译者 | 李睿审校 | 重楼开发人员需要开发和理解一种新的文本聚类方法，并使用DeepSeek推理模型解释推理结果。本文将探索大型语言模型（LLM）中的推理领域，并介绍DeepSeek这款优秀工具，它能帮助人们解释推论结果，构建能让终端用户更加信赖的机器学习系统。在默认情况下，机器学习模型是一种黑盒，不会为决策提供开箱即用的解释（XAI）。

3/31/2025 8:28:24 AM 李睿

Deepseek V3升级！更快、更准、更聪明！

前言大家好，我是林三心，用最通俗易懂的话讲最难的知识点是我的座右铭，基础是进阶的前提是我的初心~🎈 编程的兄弟们都知道，现阶段咱们的开发真的离不开 AI，尤其是碰到一些代码技术上的难题的时候，AI 简直是太好使了，以前咱们要花几个小时去网上查找资料，而现在通过 AI 给出答案，只需要几秒钟 ❗️❗️❗️但是，现在的AI界也是卷出了新的高度，从年前的DeepSeek到Manus每一次的话题都能引爆全网热议。要问目前AI产品的顶流，问小白现在的发展势头非常迅猛，其凭借着速度快、稳定、方便上手使用、完全免费，受到广大用户好评！我们可以在AI ChatBots发布的全球 AI 网站增长榜中清楚的看到，问小白正在以超高的增速杀入全球前三。

3/31/2025 3:33:00 AM

割韭菜新姿势：C#+DeepSeek自动生成爆文，单篇收益破万的秘密

在内容创作的江湖中，一直流传着各种“一夜暴富”的传说。如今，一种看似能让梦想照进现实的“神奇组合”——C#与DeepSeek，正悄然在技术圈掀起波澜，传言称依靠它们自动生成爆文，单篇收益能轻松破万，这究竟是“财富密码”，还是新的“割韭菜”套路？今天，就让我们一探究竟。

3/31/2025 12:25:00 AM conan

资讯热榜

这样在本地搭建DeepSeek可以直接封神：本地部署+避坑指南（升级版）免费！让图片放大不失真的位图转矢量图神器 Tmttool AI应用新纪元：2025中国AI应用排行榜榜单揭晓丨2025年1月 GGUF 是什么？一文看懂大模型里最火的模型格式后悔没早发现！教你用谷歌Gemini生成精美PPT（附提示词） Mac也能跑Qwen3，一文看懂本地部署qwen 3配置要求 6秒视频10秒生成！全新AI视频神器 Grok Imagine 深度体验+元提示词分享最火、最全的Agent记忆综述，NUS、人大、复旦、北大等联合出品

标签云

AI 人工智能 OpenAI AIGC 模型 ChatGPT 谷歌 DeepSeek AI新词 AI绘画大模型机器人数据 Midjourney 开源 Meta 微软智能用户 GPT 学习英伟达 Gemini 智能体技术马斯克 Anthropic 图像 AI创作训练 LLM 论文 AI for Science 代码腾讯苹果算法 Agent Claude 芯片具身智能 Stable Diffusion xAI 蛋白质人形机器人开发者生成式神经网络机器学习 AI视频 3D 大语言模型字节跳动 RAG Sora 百度研究 GPU 生成华为工具 AGI 计算生成式AI AI设计大型语言模型搜索亚马逊 AI模型视频生成特斯拉 DeepMind 场景 Copilot 深度学习 Transformer 架构 MCP 编程视觉