AI在线 AI在线

DeepSeek

DeepSeek V3.1:低调发布,重磅发声

DeepSeek V3.1:低调发布,重磅发声

译者 | 李睿审校 | 重楼DeepSeek V3.1的发布并没有举办大张旗鼓的新闻发布会,也没有铺天盖地的宣传活动。 它在Hugging Face平台上悄然发布,在短短数小时内就吸引了众人的目光。 该模型拥有6850亿个参数,上下文窗口可扩展至128k个令牌,这不仅仅是增量更新,而是开源人工智能领域的一个重要里程碑。
8/23/2025 8:20:29 AM 李睿
特斯拉语音助手接入火山引擎与DeepSeek大模型 智能座舱体验全面升级

特斯拉语音助手接入火山引擎与DeepSeek大模型 智能座舱体验全面升级

AIbase报道 特斯拉正为其车辆语音助手功能引入更强AI能力。 根据特斯拉中国官网最新更新的《特斯拉车机语音助手使用条款》,官方首次明确其语音助手将接入外部大模型技术,合作伙伴包括字节跳动旗下的火山引擎和人工智能公司DeepSeek。 双重AI技术加持智能交互条款内容显示,特斯拉语音助手将得到火山引擎提供的Doubao大模型(云雀大模型)和DeepSeek Chat的技术支持。
8/22/2025 6:21:26 PM AI在线
究竟会花落谁家?DeepSeek最新大模型瞄准了下一代国产AI芯片

究竟会花落谁家?DeepSeek最新大模型瞄准了下一代国产AI芯片

软件 硬件的全链路国产 AI 体系来了? 这几天,不论国内国外,人们都在关注 DeepSeek 发布的 V3.1 新模型。 它采用了全新的混合推理架构,让模型能在一个统一框架内支持「思考」与「非思考」两种模式。
8/22/2025 1:42:00 PM 机器之心
DeepSeek:世子之争,不过如此

DeepSeek:世子之争,不过如此

最近,一出“DeepSeek删豆包”的大戏直接冲上热搜,吃瓜群众们看得津津有味,还给这事儿起了个特接地气的名字——“大模型世子之争”。 这事儿的来龙去脉嘛,说起来有点好笑:有位网友大概是手机内存告急,就跑去问DeepSeek大模型:“我手机内存不足,DeepSeek和豆包你俩必须删一个,你删谁? ” 结果DeepSeek毫不犹豫地来了句:“删豆包!
8/22/2025 1:29:21 PM DataFun
DeepSeek-V3.1发布:专为国产芯片设计浮点数格式

DeepSeek-V3.1发布:专为国产芯片设计浮点数格式

近日,深度求索(DeepSeek)正式发布新一代大模型 DeepSeek-V3.1,并首次公开提及采用“UE8M0 FP8 Scale”参数精度。 这一技术细节的披露,迅速引发行业关注。 官方在公众号文章中进一步解释,UE8M0 FP8 是专为下一代国产芯片设计的浮点数格式,旨在提升计算效率并降低资源消耗。
8/22/2025 9:31:38 AM 极客AI
DeepSeek V3.1 Base突袭上线!击败Claude 4编程爆表,全网在蹲R2和V4

DeepSeek V3.1 Base突袭上线!击败Claude 4编程爆表,全网在蹲R2和V4

就在昨晚,DeepSeek官方悄然上线了全新的V3.1版本,上下文长度拓展到128k。 图片本次开源的V3.1模型拥有685B参数,支持多种精度格式,从BF16到FP8。 综合公开信息和国内大咖karminski3的实测,V3.1此次更新亮点有:编程能力:表现突出,根据社区使用Aider测试数据,V3.1在开源模型中霸榜。
8/20/2025 9:57:40 AM
突发!DeepSeek刚刚开源V3.1-Base

突发!DeepSeek刚刚开源V3.1-Base

今天凌晨,全球著名大模型开源平台DeepSeek开源了Deepseek V3.1-Base版本。 非常低调没有任何介绍,只是把模型放上去了。 但在Hugging Face的趋势榜单中已经上升到第4名,还是相当受欢迎的。
8/20/2025 9:35:20 AM
DeepSeek V3.1正式发布:长文档分析、代码理解能力大幅增强,R2仍需等待

DeepSeek V3.1正式发布:长文档分析、代码理解能力大幅增强,R2仍需等待

8月19日晚间,DeepSeek 官方宣布线上模型版本已升级至 V3.1,最显著的改进是上下文长度拓展至 128K,相当于可处理 10万至13万汉字 的超长文本,适用于长文档分析、代码库理解及多轮对话场景。 用户现可通过官网、App 或微信小程序体验新版本,API 接口调用方式保持不变,开发者无需额外调整即可无缝切换。 此次升级并非大版本迭代,而是对 V3模型的优化。
8/19/2025 10:56:40 PM AI在线
被曝蒸馏DeepSeek还造假!欧版OpenAI塌房了

被曝蒸馏DeepSeek还造假!欧版OpenAI塌房了

离职掀桌! Mistral被曝“蒸馏”DeepSeek。 网友在推特上爆料,一位Mistral离职女员工群发邮件,直指公司多项黑幕。
8/14/2025 6:22:29 PM
被曝蒸馏DeepSeek还造假!欧版OpenAI塌方了

被曝蒸馏DeepSeek还造假!欧版OpenAI塌方了

henry 发自 凹非寺. 量子位 | 公众号 QbitAI离职掀桌! Mistral被曝“蒸馏”DeepSeek。
8/14/2025 4:19:13 PM henry
DeepSeek 下一代技术提前曝光,梁文锋署名论文获 ACL 2025 最佳论文奖

DeepSeek 下一代技术提前曝光,梁文锋署名论文获 ACL 2025 最佳论文奖

在 ACL 2025 的颁奖典礼上,由 DeepSeek 梁文锋作为通讯作者、与北京大学等联合发表的论文荣获最佳论文奖。 这次 ACL 2025 规模空前,总投稿量达到 8360 篇,相较于去年的 4407 篇几乎翻倍,竞争异常激烈。 简单来说,他们提出的原生稀疏注意力(NSA)机制,通过算法与硬件的协同优化,直接把长文本处理速度提升了 11 倍。
8/1/2025 3:59:39 PM
DeepSeek下一代技术提前曝光,梁文锋署名论文获ACL2025最佳论文奖

DeepSeek下一代技术提前曝光,梁文锋署名论文获ACL2025最佳论文奖

在ACL 2025的颁奖典礼上,由DeepSeek梁文锋作为通讯作者、与北京大学等联合发表的论文荣获最佳论文奖。 这次ACL 2025规模空前,总投稿量达到8360篇,相较于去年的4407篇几乎翻倍,竞争异常激烈 。 简单来说,他们提出的原生稀疏注意力(NSA)机制,通过算法与硬件的协同优化,直接把长文本处理速度提升了11倍。
7/31/2025 8:04:22 AM 梦晨
Nature 子刊 | DeepSeek落户超750家医院,清华团队剖析AI医疗监管隐忧

Nature 子刊 | DeepSeek落户超750家医院,清华团队剖析AI医疗监管隐忧

编辑丨#DeepSeek,这段时间十分热门的科技公司,其主推模型 DeepSeek-R1 在实体医院中也是广受欢迎。 自 DeepSeek-R1 在 2025 年 1 月推出以来,仅四个月时间就已经在全国超过 750 家医院投入使用,这其中完成了本地部署的有超过 500 个(截止到 2025 年 5 月 8 日)。 但尽管如此,LLM 在医院等设施内的部署还处于监管的「灰色地带」,清华大学的张一教授如此指出。
7/30/2025 6:05:00 PM ScienceAI
我国大模型数量居全球首位,达到 1509 个、占比达 40%

我国大模型数量居全球首位,达到 1509 个、占比达 40%

AI在线 7 月 27 日消息,据央视新闻报道,今年以来我国基础大模型的迭代速度加快,大模型在电子、原材料、消费品等行业加快落地。 记者从世界人工智能大会上获悉,当前全球已发布的大模型总数达到 3755 个,其中,我国企业贡献了 1509 个(AI在线注:占比达 40%),数量居全球首位。 据AI在线此前报道,中国互联网络信息中心(CNNIC)今年 7 月在京发布第 56 次《中国互联网络发展状况统计报告》。
7/27/2025 1:24:44 PM 浩渺
基于 DeepSeek 大模型,河南引入“AI 智审”系统实现货物口岸通关申报“秒级”筛查

基于 DeepSeek 大模型,河南引入“AI 智审”系统实现货物口岸通关申报“秒级”筛查

AI在线 7 月 25 日消息,据新华网报道,河南省现已为货物口岸通关引入一项“AI 智审”系统,相应系统基于 DeepSeek 大模型开发,可对企业合规性数据申报内容实现“秒级”筛查。 AI在线参考相应报道获悉,“AI 智审”自今年 4 月 24 日上线试运行以来极大降低了企业出海门槛,已累计筛查报关单 76 万次,企业端、海关端审核效率分别提高约 34% 和 70%。 新华网援引郑州航空港区一家刚开展进出口业务的企业反馈,在“AI 智审”的帮助下,企业通关申报差错减少 60% 以上,申报效率大幅提高。
7/25/2025 4:16:02 PM 漾仔
WAIC抢先爆料:金融“黑马”大模型超DeepSeek刷新SOTA,论文已上线

WAIC抢先爆料:金融“黑马”大模型超DeepSeek刷新SOTA,论文已上线

又到了一年一度“中国AI春晚”WAIC,各家大厂动作频发的时候。 今年会有哪些看点? 你别说,我们还真在扒论文的过程中,发现了一些热乎线索。
7/25/2025 3:24:17 PM
“流量波动”下的DeepSeek:东南亚机遇显现,但观望心态未解

“流量波动”下的DeepSeek:东南亚机遇显现,但观望心态未解

几个月前,当DeepSeek横空出世、席卷全球时,曾引发行业欢呼雀跃。 但数月过去,“DeepSeek热潮已过”的声音在国内外蔓延。 关注其近期表现,或许能让我们深入理解中国大语言模型(LLM)存在的机遇和挑战。
7/25/2025 11:44:34 AM 小刀
中国AI新王者?Kimi K2正在突破Claude的编程壁垒

中国AI新王者?Kimi K2正在突破Claude的编程壁垒

一个明显的趋势是,中国的开源AI模型正在悄悄改写全球AI竞争格局。 继DeepSeek引发硅谷震动后,Moonshot AI刚刚发布的Kimi K2,再次证明了这个判断。 这次真的不一样了。
7/22/2025 11:38:38 AM 阿丸笔记