AI在线 AI在线

DeepSeek

澎峰科技 + 海光 DCU:自研推理框架全面支持 DeepSeek 系列模型

澎峰科技在近日正式宣布,其自主研发的 PerfXLM + 推理框架已基于海光 DCU,完成对 DeepSeek 全系列模型的深度适配与优化。
2/7/2025 7:02:04 PM
归泷(实习)

网易有道全面拥抱DeepSeek-R1,加速AI教育应用商业化落地

1月20日,DeepSeek震撼发布DeepSeek-R1,这款推理大模型在数学、编程及逻辑推理等多个领域展现出了与OpenAI顶尖模型比肩的实力,同时实现了API调用成本90%-95%的大幅缩减,无疑为科技界投下了一颗开年“重磅炸弹”。 DeepSeek-R1的深度推理能力不仅为AI产业的多元化发展开辟了新航道,也为包括教育在内的多个行业带来了革新动力。 作为教育科技企业,网易有道坚持深入挖掘教育场景下的大模型应用价值。
2/7/2025 6:31:00 PM
朱可轩

「鲶鱼」DeepSeek 正在搅动上下游

作者|朱可轩编辑|陈彩娴春节结束,DeepSeek 热度不减,而要说刚刚过去的春节假期,留给科技圈的印象可能是“卷上加卷”,几乎无人不在热议分析着 DeepSeek 这条“鲶鱼”。 硅谷方面迎来了空前的危机感:开源的信徒们声量再度走高,甚至连 OpenAI 都在反思闭源的决策是否正确;低算力成本的新范式引发芯片巨头英伟达连锁反应,创下美股史上最大规模单日市值蒸发纪录;政府部门下场调查 DeepSeek 使用芯片的合规性......在海外对 DeepSeek 评价褒贬不一的同时,国内也迎来了空前繁荣。 DeepSeek 发布 R1 模型后上线的 APP 接到泼天流量,初步验证了应用端增长将会拉动整个 AI 生态发展。
2/7/2025 6:10:00 PM
朱可轩

历史时刻:DeepSeek GitHub星数超越OpenAI,仅用时两个月

开源 AI 世界的里程碑事件! 我们正在见证历史:DeepSeek 项目在全球最大代码托管平台 GitHub 上的 Star 量超过了 OpenAI。 截至本周五下午两点,DeepSeek 旗下热度最高的项目 DeepSeek-V3 大模型 Star 量已达 7.77 万,超越了同平台中 OpenAI 最热门项目。
2/7/2025 5:39:00 PM
机器之心

烽火通信旗下长江计算 G440K V2 服务器实现 DeepSeek 系列模型推理适配和优化

烽火通信旗下长江计算近日联合昇腾、华为云团队成功助力某国有大行完成 DeepSeek-V3 大模型的本地化推理服务部署。本次部署使用长江计算 G440K V2 服务器,基于 MindIE 推理引擎,在华为云 AI 开发平台 ModelArts 上完成。
2/7/2025 4:33:56 PM
归泷(实习)

DeepSeek被禁!最高判刑20年,外交部回应!

过去几周,中国人工智能公司DeepSeek的崛起,在全球范围内引发了一场前所未有的争议。 这款凭借“低成本、高性能”迅速抢占市场的AI工具,不仅一度超越ChatGPT登顶美国应用下载榜,还导致多国科技股震荡下跌。 然而,其“高光时刻”很快被多国的禁令与限制措施打破——美国、意大利、澳大利亚、印度、韩国、日本等国相继以“国家安全”“数据隐私风险”为由,禁止或限制DeepSeek在政府及企业中的使用。
2/7/2025 3:46:17 PM
不才陈某

你的提示词根本只是在浪费算力,让deepseek达到最佳效果的三大原则

最近几周自学deepseek原理 应用 实践,一些成果,和大家分享。 与deepseek这类AI对话,为了达到最佳效果,提示词应当遵循哪三大原则? 清晰性;结构化;细节化;为什么?
2/7/2025 3:11:41 PM
58沈剑

行业首款 DeepSeek 量产车型落地,消息称岚图知音、梦想家已深度融合 R1 大模型

岚图知音车机云端还将持续融合和蒸馏DeepSeek R1模型。基于对DeepSeek做模型蒸馏,岚图一方面可以优化车机的智能化体验,做到技术的快速迭代;同时还可以降低智能座舱的开发和使用成本。
2/7/2025 3:07:11 PM
清源

Andrej Karpathy 最新视频盛赞 DeepSeek:R1 正在发现人类思考的逻辑并进行复现

继近日斯坦福李飞飞、Percy Liang 等人推出 S1 后,李飞飞的学生、OpenAI 早期成员与前特斯拉 AI 总监也录制了一期最新长达 3 小时的长视频上传到 YouTube,深入浅出地从神经网络的起源、GPT-2、ChatGPT 到最近 DeepSeek-R1 介绍了 AI 大模型的系列进化:视频链接:,视频讲解十分通俗易懂,即使没有技术背景的观众也能轻松理解! 尤其是在视频的第 2 个小时开始,他对最近爆火的 DeepSeek-R1 论文进行了深入介绍,并直言 DeepSeek R1 在性能方面与 OpenAI 的模型不相上下,它的出现推动了 RL 技术的发展。 除了盛赞 DeepSeek-R1 的技术创新外,Andrej Karpathy 还对纯 RL 的学习能力给予了高度评价,但又指出 RL 非常非常擅长发现一种方法来“欺骗”模型,阻碍了 RLHF 成为专业技术的步伐。
2/7/2025 2:50:00 PM
郑佳美

《麻省理工科技评论》点评中国AI“四剑客”,每家都媲美DeepSeek

春节期间,DeepSeek 一跃成为全球瞩目的焦点。 它以仅约十分之一的超低训练成本,成功推出了性能与OpenAI o1近乎相当的开源模型,对全球科技领域带来巨大冲击,先后引发美国科技股的大幅下跌,以及硅谷科技巨头和各国政要的纷纷回应,如今全球各大芯片厂商和智算云服务厂商更是积极响应、跟进适配。 半个月来,DeepSeek相关话题热度居高不下,热搜频频,已成为全球科技、经济乃至政治领域的重要话题。
2/7/2025 2:37:00 PM
新闻助手

全球化钓鱼攻击:DeepSeek仿冒网站遍布六国,用户需警惕

奇安信XLab实验室2月6日发布最新安全报告,揭示了一波针对DeepSeek用户的大规模网络钓鱼活动。 数据显示,仿冒DeepSeek的钓鱼网站数量已超过2000个,且仍在持续增长。 根据报告,在2024年12月1日至2025年2月3日期间,共发现2650个仿冒DeepSeek的域名。
2/7/2025 2:07:00 PM
AI在线

架构创新×模型创新!清微智能全面适配DeepSeek模型推理和训练

随着大模型技术向多场景渗透,算力需求呈现「大规模、高弹性、低成本」三重挑战。 清微智能基于全球领先的可重构计算架构(CGRA)推出可重构算力芯片RPU(Reconfigurable Processing Unit),实现单机高效运行千亿级参数模型推理和训练,以动态硬件重构、全栈优化及高能效比,重新定义国产AI芯片的性价比标杆。 新年伊始,DeepSeek的惊艳亮相,不仅在科技圈掀起巨浪,其影响还涉及到经济、社会、政策等多个维度,相关企业迅速跟进。
2/7/2025 2:04:44 PM
新智元

华人研究团队揭秘:DeepSeek-R1-Zero或许并不存在「顿悟时刻」

自我反思(尤其是肤浅的)有时对模型性能的助益不大。 在过去这半个月里,关于 DeepSeek 的一切都会迅速成为焦点。 一项非常鼓舞人心的发现是:DeepSeek-R1-Zero 通过纯强化学习(RL)实现了「顿悟」。
2/7/2025 1:52:00 PM
机器之心

DeepSeek 用的 GRPO 占用大量内存?有人给出了些破解方法

自 DeepSeek-R1 发布以来,群组相对策略优化(GRPO)因其有效性和易于训练而成为大型语言模型强化学习的热门话题。 R1 论文展示了如何使用 GRPO 从遵循 LLM(DeepSeek-v3)的基本指令转变为推理模型(DeepSeek-R1)。 GRPO 是一种在线学习算法(online learning algorithm),它通过使用训练过程中由训练模型自身生成的数据来进行迭代改进。
2/7/2025 1:45:58 PM
机器之心

国产大模型DeepSeek爆火,崛起背后大模型专利申请激增

近日,国产大模型DeepSeek爆火全网,凭借“低成本、高性能”的技术优势,其成为全球科技市场关注的焦点。 创始人梁文锋介绍,团队主要由国内高校毕业生和没毕业的博士生组成。 过硬的创新成果表明,今天的中国,正在成为顶尖人才成长的沃土、原创性创新的策源地。
2/7/2025 1:42:00 PM
AI在线

感谢DeepSeek,ChatGPT开始公开o3思维链,但不完整

奥特曼兑现了承诺。 DeepSeek 带来的压力已经传递给了每一个科技公司。 最近一段时间,很多生成式 AI 产品正在加速更新技术。
2/7/2025 1:32:00 PM
机器之心

DeepSeek 爆红引发业界“狂欢”,第三方厂商嗅到商机跟风售卖 AI 网课 / 外设获利颇丰

国产 AI 公司深度求索开发的 AI 大模型 DeepSeek 在网络上成为爆款,作为一款开源、免费的大模型,尽管深度求索公司本身还未实现盈利,但目前已有大量其他厂商嗅到商机,打着“DeepSeek”旗号开始跟风“挣钱”。
2/7/2025 1:27:23 PM
漾仔

DeepSeek R1 集成难题完美解决:Deepseek4j 已开源

一、为什么需要 deepseek4j? 1.1 现有框架的局限性思维链内容丢失:R1 最核心的推理过程完全被忽略响应模式不兼容:无法处理"思考在前、结论在后"的输出模式参数限制:temperature、top_p 等关键参数设置失效流式处理不完善:用户体验欠佳虽然笔者上篇博客介绍了如何使用 WebFlux 直接调用 DeepSeek API,但这种方式存在一些问题:开发成本高:直接调用 API 或改造现有框架需要处理大量细节,包括请求构建、响应解析、错误处理等。 一不做二不休,为了彻底解决这些问题,笔者基于 OpenAI4J[1] 项目的优秀架构,打造了一个专门面向 DeepSeek 的开箱即用方案 DeepSeek4J[2]增强支持 DeepSeek 独有的思维链和账单特性增加 Project Reactor 的全面响应式支持提供集成 Spring Boot Starter,提供自动配置 二、核心特性 ✨ 完整保留思维链能力、账单🚀 响应式流式处理🛠 简单优雅的 API 设计📦 开箱即用的 Spring Boot 集成,同时支持 2.x / 3.x💡 内置调试页面🔍 详细的请求响应日志🔧 灵活的代理配置⚡️ 响应式编程支持 三、快速开始 3.1 添加依赖复制3.2 配置参数复制3.3 基础使用复制3.4 进阶配置复制
2/7/2025 1:10:06 PM
冷冷