DeepSeek
支持 API 调用,国家超算互联网平台上线 DeepSeek-R1 满血版
据“超算互联网”公众号消息,为满足开发者与企业端需求,国家超算互联网平台现已上线包括 R1 满血版的 DeepSeek 全家桶模型,并提供快速部署 API 调用及 AI web 应用服务。
2/9/2025 9:41:09 PM
归泷(实习)
DeepSeek-V3 API 优惠期结束,每百万输出 tokens 由 2 元升至 8 元
今日,DeepSeek-V3 API 服务的 45 天优惠价格体验期已结束,从 2 月 9 日开始将调整为新的价格:每百万输入 tokens 0.5 元(缓存命中)/2 元(缓存未命中),每百万输出 tokens 8 元。
2/9/2025 6:39:02 PM
浩渺
商汤大装置“万象平台”上架 DeepSeek 系列模型
北京市商汤科技开发有限公司昨日晚发文宣布,企业客户和开发者可在商汤大装置万象平台中,快速部署 DeepSeek-V3、DeepSeek-R1 等模型,可享受 3 个月内 1000 万 tokens 免费使用权益。
2/9/2025 5:30:36 PM
归泷
为什么中国只有一个 DeepSeek?
DeepSeek 风暴后,中国的大模型创业圈会发生什么样的变化? 近日来,笔者也与多位业内人士进行了探讨,发现国产大模型圈目前出现了两个极端:一个是极端的热血沸腾,另一个则是极端的霜打茄子。 前者以积极拥抱 DeepSeek 生态的算力厂商与模型服务厂商、以及原先没有能力参与大模型“军备竞赛”的开源受益者为代表,后者则以其他中国大模型创业公司(俗称“大模型六小虎”)与过去两年投资了这些公司的 VC 们为主,形成了一个“冰火两重天”的局面。
2/9/2025 5:23:00 PM
陈彩娴
美格智能:与 DeepSeek 开发公司无业务往来,相关模型适配工作处于早期研发阶段
美格智能在公告中提到,公司股票因被纳入 DeepSeek 概念股而出现异常波动,并澄清公司与 DeepSeek 开发公司杭州深度求索人工智能基础技术有限公司无直接或间接业务往来及股权关系。
2/9/2025 5:10:02 PM
归泷
斑马智行元神 AI 完成与 DeepSeek 技术融合,意图理解、融合推理和主动服务能力提升
斑马信息科技有限公司昨日晚发文宣布,斑马智行元神 AI 与 DeepSeek 大模型完成技术融合正式上线,首发支持多车型。
2/9/2025 4:01:27 PM
归泷(实习)
奇瑞智能大模型已与 DeepSeek 深度融合校验,逐步应用于更多新车型
奇瑞集团宣布目前已与国内领先的人工智能公司深度求索(DeepSeek)围绕智能化大模型系统展开深度技术融合。
2/9/2025 3:55:16 PM
浩渺
阿里云百炼上线全尺寸 DeepSeek 模型,1 元最高可享受 200 万 tokens
阿里云宣布百炼平台全面上线 DeepSeek-V3、DeepSeek-R1、DeepSeek-R1-Distill-Qwen-32B 等 6 款全尺寸模型。DeepSeek-V3、DeepSeek-R1 满血版可享各 100 万免费 tokens,蒸馏版 1 元最高可享受 200 万 tokens,即日起,所有用户可直接使用。
2/9/2025 3:10:35 PM
浩渺
Sebastian Raschka:关于DeepSeek R1和推理模型,我有几点看法
著名 AI 研究者和博主 Sebastian Raschka 又更新博客了。 这一次,他将立足于 DeepSeek 技术报告,介绍用于构建推理模型的四种主要方法,也就是如何通过推理能力来增强 LLM。 Sebastian Raschka 表示:「我希望这能提供有价值的见解,并帮助你了解围绕这一主题的快速演变的文献和话题炒作。
2/9/2025 2:42:00 PM
机器之心
ai.com 域名现已跳转至 DeepSeek:各大模型薅了个遍,不停蹭热度
据IT之家小伙伴投稿,可能是人工智能企业最想要的域名 —— ai.com 变更了跳转页面,随着国内 AI 模型 DeepSeek 的大热,该域名目前已跳转至 chat.deepseek.com。
2/9/2025 12:51:08 PM
汪淼
DeepSeek深夜再放大招,发布全新多模态大模型Janus-Pro
国产大模型DeepSeek发布了全新的Janus-Pro多模态大模型,正式进军文生图领域。 这一举动标志着DeepSeek在多模态AI技术上的重大突破。 在GenEval和DPG-Bench基准测试中,Janus-Pro-7B不仅击败了OpenAI的DALL-E3,还超越了Stable Diffusion、Emu3-Gen等热门模型。
2/9/2025 8:59:26 AM
AI在线
零跑汽车:部署 DeepSeek-R1 的智能座舱即将上线
目前,小零 GPT 大模型已接入 DeepSeek-R1,其推理与思维链能力将优化座舱交互逻辑,增强自然语言理解与个性化服务响应速度。
2/9/2025 8:45:33 AM
汪淼
攻略在手,轻松玩转 DeepSeek
IT之家已经为大家从全网,搜集总结了一份《DeepSeek 玩法攻略》,帮助大家轻松实现“从入门到精通”。从大模型的能力范围、到提示词该怎么写、再到尝试在自己电脑上本地部署的方案,都有涉猎。
2/8/2025 8:27:50 PM
泓澄
京东云发布 DeepSeek 大模型一体机,内置智能体 + 知识库双引擎及千余种插件
京东云发布DeepSeek大模型一体机,具备国产算力全适配、支持丰富大模型参数规格、AI应用开箱即用等核心特性。
2/8/2025 8:05:03 PM
清源
东风旗下自主品牌岚图、猛士、奕派、风神、纳米接入 DeepSeek 全系列模型
东风汽车今日宣布,旗下自主品牌已完成DeepSeek全系列大语言模型接入工作并将于近期陆续搭载,应用于包括东风岚图、东风猛士、东风奕派、东风风神、东风纳米在内的东风自主品牌车型。
2/8/2025 7:29:14 PM
清源
工信部:春节期间三家基础电信企业均全面接入 DeepSeek 开源大模型
三家基础电信企业均全面接入DeepSeek开源大模型,实现在多场景、多产品中应用,针对热门的DeepSeek-R1模型提供专属算力方案和配套环境,助力国产大模型性能释放。
2/8/2025 5:59:05 PM
清源
七彩虹“虹光 AI”智能模型助手官宣接入满血 DeepSeek R1
其基于 Transformer 架构,采用了 MLA 和 Deep Seek MoE 技术,通过减少缓存显著降低了内存占用,提升了推理效率。
2/8/2025 5:48:14 PM
清源
外国专家解读DeepSeek:预算有限,如何复制R1推理模型?纯强化学习不现实!不是任何问题都得问DeepSeek!
出品 | 51CTO技术栈(微信号:blog51cto)Sebastian Raschka是一位外国知名的AI专家。 特别在大型语言模型(LLM)研究方面,有着丰富的研究经验。 近日DeepSeek-R1推理模型的推出,将“任何一款不是o1的模型快速蒸馏成具备强推理能力的o1”成为了可能,而且所需的成本和算力都大大降低。
2/8/2025 5:47:08 PM
资讯热榜
全新开源的DeepSeek-OCR,可能是最近最惊喜的模型!
AI 模型“炒股”比拼!DeepSeek 收益超14%,Gemini2.5Pro 惨亏四成
具身智能学界业界思想「惊人的统一」?美团在IROS开了个学术年会
OpenAI强化Sora 2保护政策,确保艺人声音与肖像权不被侵犯
刚刚,ChatGPT终于可以走遍整个互联网了!OpenAI深夜炸街:原生ChatGPT集成、即时理解、主动执行,浏览器赛道鲨疯了
OpenAI首款ChatGPT浏览器发布!现在就能免费下载使用
告别抽卡!Vidu Q2多图参考生视频功能重磅上线
Andrej Karpathy评DeepSeek-OCR论文:图像输入可能成为大语言模型新方向
标签云
AI
人工智能
OpenAI
AIGC
模型
ChatGPT
DeepSeek
谷歌
AI绘画
机器人
数据
大模型
Midjourney
开源
Meta
智能
微软
用户
AI新词
GPT
学习
技术
智能体
马斯克
Gemini
图像
Anthropic
英伟达
AI创作
训练
LLM
论文
代码
算法
芯片
腾讯
AI for Science
Stable Diffusion
苹果
Agent
Claude
蛋白质
开发者
生成式
神经网络
xAI
机器学习
3D
人形机器人
研究
AI视频
生成
RAG
大语言模型
百度
具身智能
Sora
工具
GPU
华为
计算
字节跳动
AI设计
搜索
大型语言模型
AGI
视频生成
场景
深度学习
DeepMind
架构
视觉
生成式AI
预测
Transformer
编程
AI模型
伟达
特斯拉
Copilot