AI在线 AI在线

DeepSeek

《麻省理工科技评论》点评中国AI“四剑客”,每家都媲美DeepSeek

《麻省理工科技评论》点评中国AI“四剑客”,每家都媲美DeepSeek

春节期间,DeepSeek 一跃成为全球瞩目的焦点。 它以仅约十分之一的超低训练成本,成功推出了性能与OpenAI o1近乎相当的开源模型,对全球科技领域带来巨大冲击,先后引发美国科技股的大幅下跌,以及硅谷科技巨头和各国政要的纷纷回应,如今全球各大芯片厂商和智算云服务厂商更是积极响应、跟进适配。 半个月来,DeepSeek相关话题热度居高不下,热搜频频,已成为全球科技、经济乃至政治领域的重要话题。
2/7/2025 2:37:00 PM 新闻助手
全球化钓鱼攻击:DeepSeek仿冒网站遍布六国,用户需警惕

全球化钓鱼攻击:DeepSeek仿冒网站遍布六国,用户需警惕

奇安信XLab实验室2月6日发布最新安全报告,揭示了一波针对DeepSeek用户的大规模网络钓鱼活动。 数据显示,仿冒DeepSeek的钓鱼网站数量已超过2000个,且仍在持续增长。 根据报告,在2024年12月1日至2025年2月3日期间,共发现2650个仿冒DeepSeek的域名。
2/7/2025 2:07:00 PM AI在线
架构创新×模型创新!清微智能全面适配DeepSeek模型推理和训练

架构创新×模型创新!清微智能全面适配DeepSeek模型推理和训练

随着大模型技术向多场景渗透,算力需求呈现「大规模、高弹性、低成本」三重挑战。 清微智能基于全球领先的可重构计算架构(CGRA)推出可重构算力芯片RPU(Reconfigurable Processing Unit),实现单机高效运行千亿级参数模型推理和训练,以动态硬件重构、全栈优化及高能效比,重新定义国产AI芯片的性价比标杆。 新年伊始,DeepSeek的惊艳亮相,不仅在科技圈掀起巨浪,其影响还涉及到经济、社会、政策等多个维度,相关企业迅速跟进。
2/7/2025 2:04:44 PM 新智元
华人研究团队揭秘:DeepSeek-R1-Zero或许并不存在「顿悟时刻」

华人研究团队揭秘:DeepSeek-R1-Zero或许并不存在「顿悟时刻」

自我反思(尤其是肤浅的)有时对模型性能的助益不大。 在过去这半个月里,关于 DeepSeek 的一切都会迅速成为焦点。 一项非常鼓舞人心的发现是:DeepSeek-R1-Zero 通过纯强化学习(RL)实现了「顿悟」。
2/7/2025 1:52:00 PM 机器之心
DeepSeek 用的 GRPO 占用大量内存?有人给出了些破解方法

DeepSeek 用的 GRPO 占用大量内存?有人给出了些破解方法

自 DeepSeek-R1 发布以来,群组相对策略优化(GRPO)因其有效性和易于训练而成为大型语言模型强化学习的热门话题。 R1 论文展示了如何使用 GRPO 从遵循 LLM(DeepSeek-v3)的基本指令转变为推理模型(DeepSeek-R1)。 GRPO 是一种在线学习算法(online learning algorithm),它通过使用训练过程中由训练模型自身生成的数据来进行迭代改进。
2/7/2025 1:45:58 PM 机器之心
国产大模型DeepSeek爆火,崛起背后大模型专利申请激增

国产大模型DeepSeek爆火,崛起背后大模型专利申请激增

近日,国产大模型DeepSeek爆火全网,凭借“低成本、高性能”的技术优势,其成为全球科技市场关注的焦点。 创始人梁文锋介绍,团队主要由国内高校毕业生和没毕业的博士生组成。 过硬的创新成果表明,今天的中国,正在成为顶尖人才成长的沃土、原创性创新的策源地。
2/7/2025 1:42:00 PM AI在线
感谢DeepSeek,ChatGPT开始公开o3思维链,但不完整

感谢DeepSeek,ChatGPT开始公开o3思维链,但不完整

奥特曼兑现了承诺。 DeepSeek 带来的压力已经传递给了每一个科技公司。 最近一段时间,很多生成式 AI 产品正在加速更新技术。
2/7/2025 1:32:00 PM 机器之心
DeepSeek 爆红引发业界“狂欢”,第三方厂商嗅到商机跟风售卖 AI 网课 / 外设获利颇丰

DeepSeek 爆红引发业界“狂欢”,第三方厂商嗅到商机跟风售卖 AI 网课 / 外设获利颇丰

国产 AI 公司深度求索开发的 AI 大模型 DeepSeek 在网络上成为爆款,作为一款开源、免费的大模型,尽管深度求索公司本身还未实现盈利,但目前已有大量其他厂商嗅到商机,打着“DeepSeek”旗号开始跟风“挣钱”。
2/7/2025 1:27:23 PM 漾仔
DeepSeek R1 集成难题完美解决:Deepseek4j 已开源

DeepSeek R1 集成难题完美解决:Deepseek4j 已开源

一、为什么需要 deepseek4j? 1.1 现有框架的局限性思维链内容丢失:R1 最核心的推理过程完全被忽略响应模式不兼容:无法处理"思考在前、结论在后"的输出模式参数限制:temperature、top_p 等关键参数设置失效流式处理不完善:用户体验欠佳虽然笔者上篇博客介绍了如何使用 WebFlux 直接调用 DeepSeek API,但这种方式存在一些问题:开发成本高:直接调用 API 或改造现有框架需要处理大量细节,包括请求构建、响应解析、错误处理等。 一不做二不休,为了彻底解决这些问题,笔者基于 OpenAI4J[1] 项目的优秀架构,打造了一个专门面向 DeepSeek 的开箱即用方案 DeepSeek4J[2]增强支持 DeepSeek 独有的思维链和账单特性增加 Project Reactor 的全面响应式支持提供集成 Spring Boot Starter,提供自动配置 二、核心特性 ✨ 完整保留思维链能力、账单🚀 响应式流式处理🛠 简单优雅的 API 设计📦 开箱即用的 Spring Boot 集成,同时支持 2.x / 3.x💡 内置调试页面🔍 详细的请求响应日志🔧 灵活的代理配置⚡️ 响应式编程支持 三、快速开始 3.1 添加依赖复制3.2 配置参数复制3.3 基础使用复制3.4 进阶配置复制
2/7/2025 1:10:06 PM 冷冷
联想集团正与 DeepSeek 探讨更多深入合作可能性,股价创历史新高

联想集团正与 DeepSeek 探讨更多深入合作可能性,股价创历史新高

联想集团与沐曦股份本月联合发布基于 DeepSeek 大模型的一体机解决方案,联想个人智能体“小天”已接入 DeepSeek。
2/7/2025 11:14:03 AM 汪淼
优必选:正验证 DeepSeek 技术在人形机器人应用场景中的有效性

优必选:正验证 DeepSeek 技术在人形机器人应用场景中的有效性

公司希望借助推理大模型的深度思考能力,破解这些复杂任务的挑战,使人形机器人更接近人类的思维方式和行为表现。
2/7/2025 10:36:10 AM 清源
钉钉 AI 助理接入 DeepSeek:可选 R1、V3 等三种模型,支持深度思考

钉钉 AI 助理接入 DeepSeek:可选 R1、V3 等三种模型,支持深度思考

钉钉低代码平台宜搭也接入了DeepSeek,用户可借助宜搭生成Prompt并调用DeepSeek能力,应用于数据分析、文本生成等多个场景。
2/7/2025 10:10:49 AM 清源
​亚马逊 CEO:AI 成本因 DeepSeek 技术大幅降低

​亚马逊 CEO:AI 成本因 DeepSeek 技术大幅降低

近日,亚马逊首席执行官安迪・贾西在与分析师的电话会议中谈到了人工智能(AI)技术的发展及其成本问题。 他表示,随着新技术的不断涌现,特别是 DeepSeek 等模型的推出,人工智能推理的成本将会显著下降。 这一变化将使得更多企业能够轻松将 AI 应用于其业务中,尤其是在推理和生成式 AI 的领域。
2/7/2025 10:01:00 AM AI在线
​钉钉 AI 助理接入 DeepSeek,可自主选择 R1、V3 等三种模型

​钉钉 AI 助理接入 DeepSeek,可自主选择 R1、V3 等三种模型

钉钉宣布 AI 助理全面接入 DeepSeek 系列模型,为用户提供了更多智能选择。 用户在创建 AI 助理时可选择DeepSeek R1&V3671B模型以及蒸馏系列模型。 同时,钉钉还推出了全新的模板,简化了 AI 助理的创建过程,让用户能够一键发布基于 DeepSeek 模型的助理。
2/7/2025 9:58:00 AM AI在线
算力告急!DeepSeek暂停API充值,两大模型价格策略同步调整

算力告急!DeepSeek暂停API充值,两大模型价格策略同步调整

DeepSeek今日发布重要通知,因服务器资源紧张,即日起暂停API充值服务。 公司表示,用户现有账户余额仍可继续使用,但暂不接受新的充值。 与此同时,DeepSeek还宣布其产品价格调整计划。
2/7/2025 9:36:00 AM AI在线
钉钉AI助理接入DeepSeek,支持深度思考

钉钉AI助理接入DeepSeek,支持深度思考

2月6日,钉钉AI助理全面接入DeepSeek系列模型。 用户在钉钉上创建AI助理时,可自主选择DeepSeeK系列的R1、V3等3种模型。 同时,钉钉还发布了全新模板,帮助用户一键创建、发布基于DeepSeeK模型的AI助理。
2/7/2025 9:36:00 AM 新闻助手
DeepSeek在1月底的用户量超越谷歌Gemini,成AI聊天新宠

DeepSeek在1月底的用户量超越谷歌Gemini,成AI聊天新宠

根据研究公司 SimilarWeb 的最新估计,中国聊天 AI 平台 DeepSeek 在短短一周内用户量迅速攀升,已超越谷歌的 Gemini 聊天 AI。 1月31日,DeepSeek 网站在美国的日访问量达到了240万次,相较于 Gemini 的150万次,DeepSeek 的访问量高出60%。 值得一提的是,OpenAI 的 ChatGPT 依然是行业的巨头,当天的日访问量为1930万次,约是 DeepSeek 的八倍。
2/7/2025 9:14:00 AM AI在线
DeepSeek正在杀死程序员?不,它杀死的是一整个时代

DeepSeek正在杀死程序员?不,它杀死的是一整个时代

——从“人肉编码”到“AI工程化”,中国软件行业的范式革命已至导语:当技术革命的枪声响起2023年GitHub统计显示,中国开发者平均每天写300行代码,其中270行是重复性业务逻辑。 而在DeepSeek等AI编码工具冲击下,这种“人肉堆代码”的模式正在崩塌——某跨国IT服务商已裁撤40%初级Java岗位,同时开出百万年薪急招AI工程师。 这不是简单的工具替代,而是一场关乎行业生死存亡的认知革命。
2/7/2025 8:30:37 AM 斯巴达人