AI在线 AI在线

DeepSeek

DeepSeek-V3.1发布:专为国产芯片设计浮点数格式

近日,深度求索(DeepSeek)正式发布新一代大模型 DeepSeek-V3.1,并首次公开提及采用“UE8M0 FP8 Scale”参数精度。 这一技术细节的披露,迅速引发行业关注。 官方在公众号文章中进一步解释,UE8M0 FP8 是专为下一代国产芯片设计的浮点数格式,旨在提升计算效率并降低资源消耗。
8/22/2025 9:31:38 AM
极客AI

DeepSeek V3.1 Base突袭上线!击败Claude 4编程爆表,全网在蹲R2和V4

就在昨晚,DeepSeek官方悄然上线了全新的V3.1版本,上下文长度拓展到128k。 图片本次开源的V3.1模型拥有685B参数,支持多种精度格式,从BF16到FP8。 综合公开信息和国内大咖karminski3的实测,V3.1此次更新亮点有:编程能力:表现突出,根据社区使用Aider测试数据,V3.1在开源模型中霸榜。
8/20/2025 9:57:40 AM

突发!DeepSeek刚刚开源V3.1-Base

今天凌晨,全球著名大模型开源平台DeepSeek开源了Deepseek V3.1-Base版本。 非常低调没有任何介绍,只是把模型放上去了。 但在Hugging Face的趋势榜单中已经上升到第4名,还是相当受欢迎的。
8/20/2025 9:35:20 AM

DeepSeek V3.1正式发布:长文档分析、代码理解能力大幅增强,R2仍需等待

8月19日晚间,DeepSeek 官方宣布线上模型版本已升级至 V3.1,最显著的改进是上下文长度拓展至 128K,相当于可处理 10万至13万汉字 的超长文本,适用于长文档分析、代码库理解及多轮对话场景。 用户现可通过官网、App 或微信小程序体验新版本,API 接口调用方式保持不变,开发者无需额外调整即可无缝切换。 此次升级并非大版本迭代,而是对 V3模型的优化。
8/19/2025 10:56:40 PM
AI在线

被曝蒸馏DeepSeek还造假!欧版OpenAI塌房了

离职掀桌! Mistral被曝“蒸馏”DeepSeek。 网友在推特上爆料,一位Mistral离职女员工群发邮件,直指公司多项黑幕。
8/14/2025 6:22:29 PM

被曝蒸馏DeepSeek还造假!欧版OpenAI塌方了

henry 发自 凹非寺. 量子位 | 公众号 QbitAI离职掀桌! Mistral被曝“蒸馏”DeepSeek。
8/14/2025 4:19:13 PM
henry

DeepSeek 下一代技术提前曝光,梁文锋署名论文获 ACL 2025 最佳论文奖

在 ACL 2025 的颁奖典礼上,由 DeepSeek 梁文锋作为通讯作者、与北京大学等联合发表的论文荣获最佳论文奖。 这次 ACL 2025 规模空前,总投稿量达到 8360 篇,相较于去年的 4407 篇几乎翻倍,竞争异常激烈。 简单来说,他们提出的原生稀疏注意力(NSA)机制,通过算法与硬件的协同优化,直接把长文本处理速度提升了 11 倍。
8/1/2025 3:59:39 PM

DeepSeek下一代技术提前曝光,梁文锋署名论文获ACL2025最佳论文奖

在ACL 2025的颁奖典礼上,由DeepSeek梁文锋作为通讯作者、与北京大学等联合发表的论文荣获最佳论文奖。 这次ACL 2025规模空前,总投稿量达到8360篇,相较于去年的4407篇几乎翻倍,竞争异常激烈 。 简单来说,他们提出的原生稀疏注意力(NSA)机制,通过算法与硬件的协同优化,直接把长文本处理速度提升了11倍。
7/31/2025 8:04:22 AM
梦晨

Nature 子刊 | DeepSeek落户超750家医院,清华团队剖析AI医疗监管隐忧

编辑丨#DeepSeek,这段时间十分热门的科技公司,其主推模型 DeepSeek-R1 在实体医院中也是广受欢迎。 自 DeepSeek-R1 在 2025 年 1 月推出以来,仅四个月时间就已经在全国超过 750 家医院投入使用,这其中完成了本地部署的有超过 500 个(截止到 2025 年 5 月 8 日)。 但尽管如此,LLM 在医院等设施内的部署还处于监管的「灰色地带」,清华大学的张一教授如此指出。
7/30/2025 6:05:00 PM
ScienceAI

我国大模型数量居全球首位,达到 1509 个、占比达 40%

AI在线 7 月 27 日消息,据央视新闻报道,今年以来我国基础大模型的迭代速度加快,大模型在电子、原材料、消费品等行业加快落地。 记者从世界人工智能大会上获悉,当前全球已发布的大模型总数达到 3755 个,其中,我国企业贡献了 1509 个(AI在线注:占比达 40%),数量居全球首位。 据AI在线此前报道,中国互联网络信息中心(CNNIC)今年 7 月在京发布第 56 次《中国互联网络发展状况统计报告》。
7/27/2025 1:24:44 PM
浩渺

基于 DeepSeek 大模型,河南引入“AI 智审”系统实现货物口岸通关申报“秒级”筛查

AI在线 7 月 25 日消息,据新华网报道,河南省现已为货物口岸通关引入一项“AI 智审”系统,相应系统基于 DeepSeek 大模型开发,可对企业合规性数据申报内容实现“秒级”筛查。 AI在线参考相应报道获悉,“AI 智审”自今年 4 月 24 日上线试运行以来极大降低了企业出海门槛,已累计筛查报关单 76 万次,企业端、海关端审核效率分别提高约 34% 和 70%。 新华网援引郑州航空港区一家刚开展进出口业务的企业反馈,在“AI 智审”的帮助下,企业通关申报差错减少 60% 以上,申报效率大幅提高。
7/25/2025 4:16:02 PM
漾仔

WAIC抢先爆料:金融“黑马”大模型超DeepSeek刷新SOTA,论文已上线

又到了一年一度“中国AI春晚”WAIC,各家大厂动作频发的时候。 今年会有哪些看点? 你别说,我们还真在扒论文的过程中,发现了一些热乎线索。
7/25/2025 3:24:17 PM

“流量波动”下的DeepSeek:东南亚机遇显现,但观望心态未解

几个月前,当DeepSeek横空出世、席卷全球时,曾引发行业欢呼雀跃。 但数月过去,“DeepSeek热潮已过”的声音在国内外蔓延。 关注其近期表现,或许能让我们深入理解中国大语言模型(LLM)存在的机遇和挑战。
7/25/2025 11:44:34 AM
小刀

中国AI新王者?Kimi K2正在突破Claude的编程壁垒

一个明显的趋势是,中国的开源AI模型正在悄悄改写全球AI竞争格局。 继DeepSeek引发硅谷震动后,Moonshot AI刚刚发布的Kimi K2,再次证明了这个判断。 这次真的不一样了。
7/22/2025 11:38:38 AM
阿丸笔记

奥尔特曼:DeepSeek 团队很有才华,但他们没找到比 OpenAI 更高效的方法

AI在线 7 月 21 日消息,今年年初,中国人工智能初创企业 DeepSeek 凭借其推出的 R1 模型在生成式人工智能领域崭露头角。 该模型在数学、科学和编程等多个领域超越了 OpenAI 的 o1 推理模型,且开发成本仅为 OpenAI 的一小部分。 对此,OpenAI 首席执行官山姆・奥尔特曼(Sam Altman)在接受彭博社采访时表示:“DeepSeek 团队非常有才华,做了很多很棒的事情,我认为他们没有找到比我们更高效的方法。
7/21/2025 8:24:18 PM
远洋

超 346 款生成式 AI 完成备案:DeepSeek 上线 20 天全球日活跃用户即突破 3000 万

AI在线 7 月 21 日消息,据央视新闻报道,中国互联网络信息中心(CNNIC)在京发布第 56 次《中国互联网络发展状况统计报告》(以下简称《报告》)。 AI在线从《报告》获悉,2025 年上半年,生成式人工智能产品实现了从技术到应用的全方位进步,产品数量迅猛增长,应用场景持续扩大。 一是我国在人工智能领域影响力显著提升。
7/21/2025 10:28:45 AM
浩渺

黄仁勋力赞 DeepSeek,称中国创新的步伐不可能被阻挡

AI在线 7 月 21 日消息,据央视新闻报道,美国英伟达公司创始人兼首席执行官黄仁勋在接受总台《面对面》栏目采访时力赞了 DeepSeek,并表示 AI 是一个极其复杂的系统,中国的创新能力很惊人。 黄仁勋称,中国创新的步伐是不可能被阻挡的,相信英伟达能作出重要贡献。 AI 是一个极其复杂的系统,就像多层蛋糕一样复杂,其芯片只是底层,上面还有系统、网络技术、AI 基础设施、软件、AI 算法,以及最上层的应用服务,整个系统异常复杂。
7/21/2025 8:53:27 AM
归泷

DeepSeek 丢了开源第一王座,但继任者“Kimi K2”依然来自中国

几千人盲投,Kimi K2 超越 DeepSeek 拿下全球开源第一! 歪果网友们直接炸了,评论区秒变夸夸打卡现场:今天,竞技场终于更新了 Kimi K2 的排名情况 ——开源第一,总榜第五,而且紧追马斯克 Grok 4 这样的顶尖闭源模型。 并且各类单项能力也不差,能和一水儿闭源模型打得有来有回:连续多轮对话并列第一,o3 和 Grok 4 均为第四;编程能力第二,和 GPT 4.5、Grok 4 持平;应对复杂提示词能力第二,和 o3、4o 位于同一梯队;……甚至眼尖的朋友也发现了,唯二闯入总榜 TOP 10 的开源模型都来自中国。
7/18/2025 5:59:31 PM