DeepSeek
「鲶鱼」DeepSeek 正在搅动上下游
作者|朱可轩编辑|陈彩娴春节结束,DeepSeek 热度不减,而要说刚刚过去的春节假期,留给科技圈的印象可能是“卷上加卷”,几乎无人不在热议分析着 DeepSeek 这条“鲶鱼”。 硅谷方面迎来了空前的危机感:开源的信徒们声量再度走高,甚至连 OpenAI 都在反思闭源的决策是否正确;低算力成本的新范式引发芯片巨头英伟达连锁反应,创下美股史上最大规模单日市值蒸发纪录;政府部门下场调查 DeepSeek 使用芯片的合规性......在海外对 DeepSeek 评价褒贬不一的同时,国内也迎来了空前繁荣。 DeepSeek 发布 R1 模型后上线的 APP 接到泼天流量,初步验证了应用端增长将会拉动整个 AI 生态发展。
2/7/2025 6:10:00 PM
朱可轩
历史时刻:DeepSeek GitHub星数超越OpenAI,仅用时两个月
开源 AI 世界的里程碑事件! 我们正在见证历史:DeepSeek 项目在全球最大代码托管平台 GitHub 上的 Star 量超过了 OpenAI。 截至本周五下午两点,DeepSeek 旗下热度最高的项目 DeepSeek-V3 大模型 Star 量已达 7.77 万,超越了同平台中 OpenAI 最热门项目。
2/7/2025 5:39:00 PM
机器之心
烽火通信旗下长江计算 G440K V2 服务器实现 DeepSeek 系列模型推理适配和优化
烽火通信旗下长江计算近日联合昇腾、华为云团队成功助力某国有大行完成 DeepSeek-V3 大模型的本地化推理服务部署。本次部署使用长江计算 G440K V2 服务器,基于 MindIE 推理引擎,在华为云 AI 开发平台 ModelArts 上完成。
2/7/2025 4:33:56 PM
归泷(实习)
DeepSeek被禁!最高判刑20年,外交部回应!
过去几周,中国人工智能公司DeepSeek的崛起,在全球范围内引发了一场前所未有的争议。 这款凭借“低成本、高性能”迅速抢占市场的AI工具,不仅一度超越ChatGPT登顶美国应用下载榜,还导致多国科技股震荡下跌。 然而,其“高光时刻”很快被多国的禁令与限制措施打破——美国、意大利、澳大利亚、印度、韩国、日本等国相继以“国家安全”“数据隐私风险”为由,禁止或限制DeepSeek在政府及企业中的使用。
2/7/2025 3:46:17 PM
不才陈某
你的提示词根本只是在浪费算力,让deepseek达到最佳效果的三大原则
最近几周自学deepseek原理 应用 实践,一些成果,和大家分享。 与deepseek这类AI对话,为了达到最佳效果,提示词应当遵循哪三大原则? 清晰性;结构化;细节化;为什么?
2/7/2025 3:11:41 PM
58沈剑
行业首款 DeepSeek 量产车型落地,消息称岚图知音、梦想家已深度融合 R1 大模型
岚图知音车机云端还将持续融合和蒸馏DeepSeek R1模型。基于对DeepSeek做模型蒸馏,岚图一方面可以优化车机的智能化体验,做到技术的快速迭代;同时还可以降低智能座舱的开发和使用成本。
2/7/2025 3:07:11 PM
清源
Andrej Karpathy 最新视频盛赞 DeepSeek:R1 正在发现人类思考的逻辑并进行复现
继近日斯坦福李飞飞、Percy Liang 等人推出 S1 后,李飞飞的学生、OpenAI 早期成员与前特斯拉 AI 总监也录制了一期最新长达 3 小时的长视频上传到 YouTube,深入浅出地从神经网络的起源、GPT-2、ChatGPT 到最近 DeepSeek-R1 介绍了 AI 大模型的系列进化:视频链接:,视频讲解十分通俗易懂,即使没有技术背景的观众也能轻松理解! 尤其是在视频的第 2 个小时开始,他对最近爆火的 DeepSeek-R1 论文进行了深入介绍,并直言 DeepSeek R1 在性能方面与 OpenAI 的模型不相上下,它的出现推动了 RL 技术的发展。 除了盛赞 DeepSeek-R1 的技术创新外,Andrej Karpathy 还对纯 RL 的学习能力给予了高度评价,但又指出 RL 非常非常擅长发现一种方法来“欺骗”模型,阻碍了 RLHF 成为专业技术的步伐。
2/7/2025 2:50:00 PM
郑佳美
《麻省理工科技评论》点评中国AI“四剑客”,每家都媲美DeepSeek
春节期间,DeepSeek 一跃成为全球瞩目的焦点。 它以仅约十分之一的超低训练成本,成功推出了性能与OpenAI o1近乎相当的开源模型,对全球科技领域带来巨大冲击,先后引发美国科技股的大幅下跌,以及硅谷科技巨头和各国政要的纷纷回应,如今全球各大芯片厂商和智算云服务厂商更是积极响应、跟进适配。 半个月来,DeepSeek相关话题热度居高不下,热搜频频,已成为全球科技、经济乃至政治领域的重要话题。
2/7/2025 2:37:00 PM
新闻助手
全球化钓鱼攻击:DeepSeek仿冒网站遍布六国,用户需警惕
奇安信XLab实验室2月6日发布最新安全报告,揭示了一波针对DeepSeek用户的大规模网络钓鱼活动。 数据显示,仿冒DeepSeek的钓鱼网站数量已超过2000个,且仍在持续增长。 根据报告,在2024年12月1日至2025年2月3日期间,共发现2650个仿冒DeepSeek的域名。
2/7/2025 2:07:00 PM
AI在线
架构创新×模型创新!清微智能全面适配DeepSeek模型推理和训练
随着大模型技术向多场景渗透,算力需求呈现「大规模、高弹性、低成本」三重挑战。 清微智能基于全球领先的可重构计算架构(CGRA)推出可重构算力芯片RPU(Reconfigurable Processing Unit),实现单机高效运行千亿级参数模型推理和训练,以动态硬件重构、全栈优化及高能效比,重新定义国产AI芯片的性价比标杆。 新年伊始,DeepSeek的惊艳亮相,不仅在科技圈掀起巨浪,其影响还涉及到经济、社会、政策等多个维度,相关企业迅速跟进。
2/7/2025 2:04:44 PM
新智元
华人研究团队揭秘:DeepSeek-R1-Zero或许并不存在「顿悟时刻」
自我反思(尤其是肤浅的)有时对模型性能的助益不大。 在过去这半个月里,关于 DeepSeek 的一切都会迅速成为焦点。 一项非常鼓舞人心的发现是:DeepSeek-R1-Zero 通过纯强化学习(RL)实现了「顿悟」。
2/7/2025 1:52:00 PM
机器之心
DeepSeek 用的 GRPO 占用大量内存?有人给出了些破解方法
自 DeepSeek-R1 发布以来,群组相对策略优化(GRPO)因其有效性和易于训练而成为大型语言模型强化学习的热门话题。 R1 论文展示了如何使用 GRPO 从遵循 LLM(DeepSeek-v3)的基本指令转变为推理模型(DeepSeek-R1)。 GRPO 是一种在线学习算法(online learning algorithm),它通过使用训练过程中由训练模型自身生成的数据来进行迭代改进。
2/7/2025 1:45:58 PM
机器之心
国产大模型DeepSeek爆火,崛起背后大模型专利申请激增
近日,国产大模型DeepSeek爆火全网,凭借“低成本、高性能”的技术优势,其成为全球科技市场关注的焦点。 创始人梁文锋介绍,团队主要由国内高校毕业生和没毕业的博士生组成。 过硬的创新成果表明,今天的中国,正在成为顶尖人才成长的沃土、原创性创新的策源地。
2/7/2025 1:42:00 PM
AI在线
感谢DeepSeek,ChatGPT开始公开o3思维链,但不完整
奥特曼兑现了承诺。 DeepSeek 带来的压力已经传递给了每一个科技公司。 最近一段时间,很多生成式 AI 产品正在加速更新技术。
2/7/2025 1:32:00 PM
机器之心
DeepSeek 爆红引发业界“狂欢”,第三方厂商嗅到商机跟风售卖 AI 网课 / 外设获利颇丰
国产 AI 公司深度求索开发的 AI 大模型 DeepSeek 在网络上成为爆款,作为一款开源、免费的大模型,尽管深度求索公司本身还未实现盈利,但目前已有大量其他厂商嗅到商机,打着“DeepSeek”旗号开始跟风“挣钱”。
2/7/2025 1:27:23 PM
漾仔
DeepSeek R1 集成难题完美解决:Deepseek4j 已开源
一、为什么需要 deepseek4j? 1.1 现有框架的局限性思维链内容丢失:R1 最核心的推理过程完全被忽略响应模式不兼容:无法处理"思考在前、结论在后"的输出模式参数限制:temperature、top_p 等关键参数设置失效流式处理不完善:用户体验欠佳虽然笔者上篇博客介绍了如何使用 WebFlux 直接调用 DeepSeek API,但这种方式存在一些问题:开发成本高:直接调用 API 或改造现有框架需要处理大量细节,包括请求构建、响应解析、错误处理等。 一不做二不休,为了彻底解决这些问题,笔者基于 OpenAI4J[1] 项目的优秀架构,打造了一个专门面向 DeepSeek 的开箱即用方案 DeepSeek4J[2]增强支持 DeepSeek 独有的思维链和账单特性增加 Project Reactor 的全面响应式支持提供集成 Spring Boot Starter,提供自动配置 二、核心特性 ✨ 完整保留思维链能力、账单🚀 响应式流式处理🛠 简单优雅的 API 设计📦 开箱即用的 Spring Boot 集成,同时支持 2.x / 3.x💡 内置调试页面🔍 详细的请求响应日志🔧 灵活的代理配置⚡️ 响应式编程支持 三、快速开始 3.1 添加依赖复制3.2 配置参数复制3.3 基础使用复制3.4 进阶配置复制
2/7/2025 1:10:06 PM
冷冷
联想集团正与 DeepSeek 探讨更多深入合作可能性,股价创历史新高
联想集团与沐曦股份本月联合发布基于 DeepSeek 大模型的一体机解决方案,联想个人智能体“小天”已接入 DeepSeek。
2/7/2025 11:14:03 AM
汪淼
优必选:正验证 DeepSeek 技术在人形机器人应用场景中的有效性
公司希望借助推理大模型的深度思考能力,破解这些复杂任务的挑战,使人形机器人更接近人类的思维方式和行为表现。
2/7/2025 10:36:10 AM
清源
资讯热榜
标签云
AI
人工智能
OpenAI
AIGC
模型
ChatGPT
DeepSeek
AI绘画
谷歌
机器人
数据
大模型
Midjourney
开源
智能
Meta
用户
微软
GPT
学习
技术
图像
Gemini
马斯克
智能体
AI创作
Anthropic
英伟达
论文
AI新词
代码
训练
算法
Stable Diffusion
LLM
芯片
蛋白质
腾讯
开发者
Claude
苹果
生成式
AI for Science
Agent
神经网络
3D
机器学习
研究
xAI
生成
人形机器人
AI视频
计算
百度
Sora
GPU
华为
AI设计
工具
RAG
大语言模型
搜索
具身智能
字节跳动
大型语言模型
场景
深度学习
预测
视频生成
伟达
视觉
Transformer
AGI
架构
亚马逊
神器推荐
Copilot
特斯拉
应用
DeepMind