DeepSeek
架构创新×模型创新!清微智能全面适配DeepSeek模型推理和训练
随着大模型技术向多场景渗透,算力需求呈现「大规模、高弹性、低成本」三重挑战。 清微智能基于全球领先的可重构计算架构(CGRA)推出可重构算力芯片RPU(Reconfigurable Processing Unit),实现单机高效运行千亿级参数模型推理和训练,以动态硬件重构、全栈优化及高能效比,重新定义国产AI芯片的性价比标杆。 新年伊始,DeepSeek的惊艳亮相,不仅在科技圈掀起巨浪,其影响还涉及到经济、社会、政策等多个维度,相关企业迅速跟进。
2/7/2025 2:04:44 PM
新智元
华人研究团队揭秘:DeepSeek-R1-Zero或许并不存在「顿悟时刻」
自我反思(尤其是肤浅的)有时对模型性能的助益不大。 在过去这半个月里,关于 DeepSeek 的一切都会迅速成为焦点。 一项非常鼓舞人心的发现是:DeepSeek-R1-Zero 通过纯强化学习(RL)实现了「顿悟」。
2/7/2025 1:52:00 PM
机器之心
DeepSeek 用的 GRPO 占用大量内存?有人给出了些破解方法
自 DeepSeek-R1 发布以来,群组相对策略优化(GRPO)因其有效性和易于训练而成为大型语言模型强化学习的热门话题。 R1 论文展示了如何使用 GRPO 从遵循 LLM(DeepSeek-v3)的基本指令转变为推理模型(DeepSeek-R1)。 GRPO 是一种在线学习算法(online learning algorithm),它通过使用训练过程中由训练模型自身生成的数据来进行迭代改进。
2/7/2025 1:45:58 PM
机器之心
国产大模型DeepSeek爆火,崛起背后大模型专利申请激增
近日,国产大模型DeepSeek爆火全网,凭借“低成本、高性能”的技术优势,其成为全球科技市场关注的焦点。 创始人梁文锋介绍,团队主要由国内高校毕业生和没毕业的博士生组成。 过硬的创新成果表明,今天的中国,正在成为顶尖人才成长的沃土、原创性创新的策源地。
2/7/2025 1:42:00 PM
AI在线
感谢DeepSeek,ChatGPT开始公开o3思维链,但不完整
奥特曼兑现了承诺。 DeepSeek 带来的压力已经传递给了每一个科技公司。 最近一段时间,很多生成式 AI 产品正在加速更新技术。
2/7/2025 1:32:00 PM
机器之心
DeepSeek 爆红引发业界“狂欢”,第三方厂商嗅到商机跟风售卖 AI 网课 / 外设获利颇丰
国产 AI 公司深度求索开发的 AI 大模型 DeepSeek 在网络上成为爆款,作为一款开源、免费的大模型,尽管深度求索公司本身还未实现盈利,但目前已有大量其他厂商嗅到商机,打着“DeepSeek”旗号开始跟风“挣钱”。
2/7/2025 1:27:23 PM
漾仔
DeepSeek R1 集成难题完美解决:Deepseek4j 已开源
一、为什么需要 deepseek4j? 1.1 现有框架的局限性思维链内容丢失:R1 最核心的推理过程完全被忽略响应模式不兼容:无法处理"思考在前、结论在后"的输出模式参数限制:temperature、top_p 等关键参数设置失效流式处理不完善:用户体验欠佳虽然笔者上篇博客介绍了如何使用 WebFlux 直接调用 DeepSeek API,但这种方式存在一些问题:开发成本高:直接调用 API 或改造现有框架需要处理大量细节,包括请求构建、响应解析、错误处理等。 一不做二不休,为了彻底解决这些问题,笔者基于 OpenAI4J[1] 项目的优秀架构,打造了一个专门面向 DeepSeek 的开箱即用方案 DeepSeek4J[2]增强支持 DeepSeek 独有的思维链和账单特性增加 Project Reactor 的全面响应式支持提供集成 Spring Boot Starter,提供自动配置 二、核心特性 ✨ 完整保留思维链能力、账单🚀 响应式流式处理🛠 简单优雅的 API 设计📦 开箱即用的 Spring Boot 集成,同时支持 2.x / 3.x💡 内置调试页面🔍 详细的请求响应日志🔧 灵活的代理配置⚡️ 响应式编程支持 三、快速开始 3.1 添加依赖复制3.2 配置参数复制3.3 基础使用复制3.4 进阶配置复制
2/7/2025 1:10:06 PM
冷冷
联想集团正与 DeepSeek 探讨更多深入合作可能性,股价创历史新高
联想集团与沐曦股份本月联合发布基于 DeepSeek 大模型的一体机解决方案,联想个人智能体“小天”已接入 DeepSeek。
2/7/2025 11:14:03 AM
汪淼
优必选:正验证 DeepSeek 技术在人形机器人应用场景中的有效性
公司希望借助推理大模型的深度思考能力,破解这些复杂任务的挑战,使人形机器人更接近人类的思维方式和行为表现。
2/7/2025 10:36:10 AM
清源
钉钉 AI 助理接入 DeepSeek:可选 R1、V3 等三种模型,支持深度思考
钉钉低代码平台宜搭也接入了DeepSeek,用户可借助宜搭生成Prompt并调用DeepSeek能力,应用于数据分析、文本生成等多个场景。
2/7/2025 10:10:49 AM
清源
亚马逊 CEO:AI 成本因 DeepSeek 技术大幅降低
近日,亚马逊首席执行官安迪・贾西在与分析师的电话会议中谈到了人工智能(AI)技术的发展及其成本问题。 他表示,随着新技术的不断涌现,特别是 DeepSeek 等模型的推出,人工智能推理的成本将会显著下降。 这一变化将使得更多企业能够轻松将 AI 应用于其业务中,尤其是在推理和生成式 AI 的领域。
2/7/2025 10:01:00 AM
AI在线
钉钉 AI 助理接入 DeepSeek,可自主选择 R1、V3 等三种模型
钉钉宣布 AI 助理全面接入 DeepSeek 系列模型,为用户提供了更多智能选择。 用户在创建 AI 助理时可选择DeepSeek R1&V3671B模型以及蒸馏系列模型。 同时,钉钉还推出了全新的模板,简化了 AI 助理的创建过程,让用户能够一键发布基于 DeepSeek 模型的助理。
2/7/2025 9:58:00 AM
AI在线
钉钉AI助理接入DeepSeek,支持深度思考
2月6日,钉钉AI助理全面接入DeepSeek系列模型。 用户在钉钉上创建AI助理时,可自主选择DeepSeeK系列的R1、V3等3种模型。 同时,钉钉还发布了全新模板,帮助用户一键创建、发布基于DeepSeeK模型的AI助理。
2/7/2025 9:36:00 AM
新闻助手
算力告急!DeepSeek暂停API充值,两大模型价格策略同步调整
DeepSeek今日发布重要通知,因服务器资源紧张,即日起暂停API充值服务。 公司表示,用户现有账户余额仍可继续使用,但暂不接受新的充值。 与此同时,DeepSeek还宣布其产品价格调整计划。
2/7/2025 9:36:00 AM
AI在线
DeepSeek在1月底的用户量超越谷歌Gemini,成AI聊天新宠
根据研究公司 SimilarWeb 的最新估计,中国聊天 AI 平台 DeepSeek 在短短一周内用户量迅速攀升,已超越谷歌的 Gemini 聊天 AI。 1月31日,DeepSeek 网站在美国的日访问量达到了240万次,相较于 Gemini 的150万次,DeepSeek 的访问量高出60%。 值得一提的是,OpenAI 的 ChatGPT 依然是行业的巨头,当天的日访问量为1930万次,约是 DeepSeek 的八倍。
2/7/2025 9:14:00 AM
AI在线
DeepSeek正在杀死程序员?不,它杀死的是一整个时代
——从“人肉编码”到“AI工程化”,中国软件行业的范式革命已至导语:当技术革命的枪声响起2023年GitHub统计显示,中国开发者平均每天写300行代码,其中270行是重复性业务逻辑。 而在DeepSeek等AI编码工具冲击下,这种“人肉堆代码”的模式正在崩塌——某跨国IT服务商已裁撤40%初级Java岗位,同时开出百万年薪急招AI工程师。 这不是简单的工具替代,而是一场关乎行业生死存亡的认知革命。
2/7/2025 8:30:37 AM
斯巴达人
亚马逊 CEO:AI 成本将因 DeepSeek 等模型的出现而降低
当被问及 DeepSeek 近期受关注的技术突破是否能带来AI成本优化时,贾西的看法与其他科技行业高管一致。他认为,这种进展反而会推动人工智能整体需求的增长。
2/7/2025 8:26:32 AM
清源
深度求索DeepSeek回应仿冒:在社交平台仅三个官方账号
杭州深度求索人工智能基础技术研究有限公司针对近期出现的与DeepSeek相关的仿冒账号和不实信息问题,正式发布了官方信息发布及服务渠道的说明。 据公司介绍,为保障用户权益,减少虚假信息的不良影响,公司现就DeepSeek官方账号等问题进行澄清。 目前,DeepSeek仅在微信公众号、小红书以及Twitter平台拥有唯一官方账号,账号名称分别为“DeepSeek”、“@DeepSeek(deepseek_ai)”以及“DeepSeek (@deepseek_ai)”。
2/7/2025 8:22:00 AM
AI在线
资讯热榜
标签云
人工智能
OpenAI
AIGC
AI
ChatGPT
AI绘画
DeepSeek
数据
模型
机器人
谷歌
大模型
Midjourney
智能
用户
开源
学习
GPT
微软
Meta
图像
AI创作
技术
论文
Stable Diffusion
Gemini
马斯克
算法
蛋白质
芯片
代码
生成式
英伟达
腾讯
神经网络
研究
计算
Anthropic
3D
Sora
AI for Science
AI设计
机器学习
开发者
GPU
AI视频
华为
场景
人形机器人
预测
百度
苹果
伟达
Transformer
深度学习
xAI
Claude
模态
字节跳动
大语言模型
搜索
驾驶
具身智能
神器推荐
文本
Copilot
LLaMA
算力
安全
视觉
视频生成
训练
干货合集
应用
大型语言模型
亚马逊
科技
智能体
DeepMind
特斯拉