DeepSeek
DeepSeek-V3.1发布:专为国产芯片设计浮点数格式
近日,深度求索(DeepSeek)正式发布新一代大模型 DeepSeek-V3.1,并首次公开提及采用“UE8M0 FP8 Scale”参数精度。 这一技术细节的披露,迅速引发行业关注。 官方在公众号文章中进一步解释,UE8M0 FP8 是专为下一代国产芯片设计的浮点数格式,旨在提升计算效率并降低资源消耗。
8/22/2025 9:31:38 AM
极客AI
DeepSeek V3.1 Base突袭上线!击败Claude 4编程爆表,全网在蹲R2和V4
就在昨晚,DeepSeek官方悄然上线了全新的V3.1版本,上下文长度拓展到128k。 图片本次开源的V3.1模型拥有685B参数,支持多种精度格式,从BF16到FP8。 综合公开信息和国内大咖karminski3的实测,V3.1此次更新亮点有:编程能力:表现突出,根据社区使用Aider测试数据,V3.1在开源模型中霸榜。
8/20/2025 9:57:40 AM
突发!DeepSeek刚刚开源V3.1-Base
今天凌晨,全球著名大模型开源平台DeepSeek开源了Deepseek V3.1-Base版本。 非常低调没有任何介绍,只是把模型放上去了。 但在Hugging Face的趋势榜单中已经上升到第4名,还是相当受欢迎的。
8/20/2025 9:35:20 AM
DeepSeek V3.1正式发布:长文档分析、代码理解能力大幅增强,R2仍需等待
8月19日晚间,DeepSeek 官方宣布线上模型版本已升级至 V3.1,最显著的改进是上下文长度拓展至 128K,相当于可处理 10万至13万汉字 的超长文本,适用于长文档分析、代码库理解及多轮对话场景。 用户现可通过官网、App 或微信小程序体验新版本,API 接口调用方式保持不变,开发者无需额外调整即可无缝切换。 此次升级并非大版本迭代,而是对 V3模型的优化。
8/19/2025 10:56:40 PM
AI在线
被曝蒸馏DeepSeek还造假!欧版OpenAI塌房了
离职掀桌! Mistral被曝“蒸馏”DeepSeek。 网友在推特上爆料,一位Mistral离职女员工群发邮件,直指公司多项黑幕。
8/14/2025 6:22:29 PM
被曝蒸馏DeepSeek还造假!欧版OpenAI塌方了
henry 发自 凹非寺. 量子位 | 公众号 QbitAI离职掀桌! Mistral被曝“蒸馏”DeepSeek。
8/14/2025 4:19:13 PM
henry
DeepSeek 下一代技术提前曝光,梁文锋署名论文获 ACL 2025 最佳论文奖
在 ACL 2025 的颁奖典礼上,由 DeepSeek 梁文锋作为通讯作者、与北京大学等联合发表的论文荣获最佳论文奖。 这次 ACL 2025 规模空前,总投稿量达到 8360 篇,相较于去年的 4407 篇几乎翻倍,竞争异常激烈。 简单来说,他们提出的原生稀疏注意力(NSA)机制,通过算法与硬件的协同优化,直接把长文本处理速度提升了 11 倍。
8/1/2025 3:59:39 PM
DeepSeek下一代技术提前曝光,梁文锋署名论文获ACL2025最佳论文奖
在ACL 2025的颁奖典礼上,由DeepSeek梁文锋作为通讯作者、与北京大学等联合发表的论文荣获最佳论文奖。 这次ACL 2025规模空前,总投稿量达到8360篇,相较于去年的4407篇几乎翻倍,竞争异常激烈 。 简单来说,他们提出的原生稀疏注意力(NSA)机制,通过算法与硬件的协同优化,直接把长文本处理速度提升了11倍。
7/31/2025 8:04:22 AM
梦晨
Nature 子刊 | DeepSeek落户超750家医院,清华团队剖析AI医疗监管隐忧
编辑丨#DeepSeek,这段时间十分热门的科技公司,其主推模型 DeepSeek-R1 在实体医院中也是广受欢迎。 自 DeepSeek-R1 在 2025 年 1 月推出以来,仅四个月时间就已经在全国超过 750 家医院投入使用,这其中完成了本地部署的有超过 500 个(截止到 2025 年 5 月 8 日)。 但尽管如此,LLM 在医院等设施内的部署还处于监管的「灰色地带」,清华大学的张一教授如此指出。
7/30/2025 6:05:00 PM
ScienceAI
我国大模型数量居全球首位,达到 1509 个、占比达 40%
AI在线 7 月 27 日消息,据央视新闻报道,今年以来我国基础大模型的迭代速度加快,大模型在电子、原材料、消费品等行业加快落地。 记者从世界人工智能大会上获悉,当前全球已发布的大模型总数达到 3755 个,其中,我国企业贡献了 1509 个(AI在线注:占比达 40%),数量居全球首位。 据AI在线此前报道,中国互联网络信息中心(CNNIC)今年 7 月在京发布第 56 次《中国互联网络发展状况统计报告》。
7/27/2025 1:24:44 PM
浩渺
基于 DeepSeek 大模型,河南引入“AI 智审”系统实现货物口岸通关申报“秒级”筛查
AI在线 7 月 25 日消息,据新华网报道,河南省现已为货物口岸通关引入一项“AI 智审”系统,相应系统基于 DeepSeek 大模型开发,可对企业合规性数据申报内容实现“秒级”筛查。 AI在线参考相应报道获悉,“AI 智审”自今年 4 月 24 日上线试运行以来极大降低了企业出海门槛,已累计筛查报关单 76 万次,企业端、海关端审核效率分别提高约 34% 和 70%。 新华网援引郑州航空港区一家刚开展进出口业务的企业反馈,在“AI 智审”的帮助下,企业通关申报差错减少 60% 以上,申报效率大幅提高。
7/25/2025 4:16:02 PM
漾仔
WAIC抢先爆料:金融“黑马”大模型超DeepSeek刷新SOTA,论文已上线
又到了一年一度“中国AI春晚”WAIC,各家大厂动作频发的时候。 今年会有哪些看点? 你别说,我们还真在扒论文的过程中,发现了一些热乎线索。
7/25/2025 3:24:17 PM
“流量波动”下的DeepSeek:东南亚机遇显现,但观望心态未解
几个月前,当DeepSeek横空出世、席卷全球时,曾引发行业欢呼雀跃。 但数月过去,“DeepSeek热潮已过”的声音在国内外蔓延。 关注其近期表现,或许能让我们深入理解中国大语言模型(LLM)存在的机遇和挑战。
7/25/2025 11:44:34 AM
小刀
中国AI新王者?Kimi K2正在突破Claude的编程壁垒
一个明显的趋势是,中国的开源AI模型正在悄悄改写全球AI竞争格局。 继DeepSeek引发硅谷震动后,Moonshot AI刚刚发布的Kimi K2,再次证明了这个判断。 这次真的不一样了。
7/22/2025 11:38:38 AM
阿丸笔记
奥尔特曼:DeepSeek 团队很有才华,但他们没找到比 OpenAI 更高效的方法
AI在线 7 月 21 日消息,今年年初,中国人工智能初创企业 DeepSeek 凭借其推出的 R1 模型在生成式人工智能领域崭露头角。 该模型在数学、科学和编程等多个领域超越了 OpenAI 的 o1 推理模型,且开发成本仅为 OpenAI 的一小部分。 对此,OpenAI 首席执行官山姆・奥尔特曼(Sam Altman)在接受彭博社采访时表示:“DeepSeek 团队非常有才华,做了很多很棒的事情,我认为他们没有找到比我们更高效的方法。
7/21/2025 8:24:18 PM
远洋
超 346 款生成式 AI 完成备案:DeepSeek 上线 20 天全球日活跃用户即突破 3000 万
AI在线 7 月 21 日消息,据央视新闻报道,中国互联网络信息中心(CNNIC)在京发布第 56 次《中国互联网络发展状况统计报告》(以下简称《报告》)。 AI在线从《报告》获悉,2025 年上半年,生成式人工智能产品实现了从技术到应用的全方位进步,产品数量迅猛增长,应用场景持续扩大。 一是我国在人工智能领域影响力显著提升。
7/21/2025 10:28:45 AM
浩渺
黄仁勋力赞 DeepSeek,称中国创新的步伐不可能被阻挡
AI在线 7 月 21 日消息,据央视新闻报道,美国英伟达公司创始人兼首席执行官黄仁勋在接受总台《面对面》栏目采访时力赞了 DeepSeek,并表示 AI 是一个极其复杂的系统,中国的创新能力很惊人。 黄仁勋称,中国创新的步伐是不可能被阻挡的,相信英伟达能作出重要贡献。 AI 是一个极其复杂的系统,就像多层蛋糕一样复杂,其芯片只是底层,上面还有系统、网络技术、AI 基础设施、软件、AI 算法,以及最上层的应用服务,整个系统异常复杂。
7/21/2025 8:53:27 AM
归泷
DeepSeek 丢了开源第一王座,但继任者“Kimi K2”依然来自中国
几千人盲投,Kimi K2 超越 DeepSeek 拿下全球开源第一! 歪果网友们直接炸了,评论区秒变夸夸打卡现场:今天,竞技场终于更新了 Kimi K2 的排名情况 ——开源第一,总榜第五,而且紧追马斯克 Grok 4 这样的顶尖闭源模型。 并且各类单项能力也不差,能和一水儿闭源模型打得有来有回:连续多轮对话并列第一,o3 和 Grok 4 均为第四;编程能力第二,和 GPT 4.5、Grok 4 持平;应对复杂提示词能力第二,和 o3、4o 位于同一梯队;……甚至眼尖的朋友也发现了,唯二闯入总榜 TOP 10 的开源模型都来自中国。
7/18/2025 5:59:31 PM
资讯热榜
AI 模型“炒股”比拼!DeepSeek 收益超14%,Gemini2.5Pro 惨亏四成
全新开源的DeepSeek-OCR,可能是最近最惊喜的模型!
具身智能学界业界思想「惊人的统一」?美团在IROS开了个学术年会
OpenAI强化Sora 2保护政策,确保艺人声音与肖像权不被侵犯
刚刚,ChatGPT终于可以走遍整个互联网了!OpenAI深夜炸街:原生ChatGPT集成、即时理解、主动执行,浏览器赛道鲨疯了
OpenAI首款ChatGPT浏览器发布!现在就能免费下载使用
告别抽卡!Vidu Q2多图参考生视频功能重磅上线
Andrej Karpathy评DeepSeek-OCR论文:图像输入可能成为大语言模型新方向
标签云
AI
人工智能
OpenAI
AIGC
模型
ChatGPT
DeepSeek
谷歌
AI绘画
机器人
数据
大模型
Midjourney
开源
Meta
智能
微软
用户
AI新词
GPT
学习
技术
智能体
马斯克
Gemini
图像
Anthropic
英伟达
AI创作
训练
LLM
论文
代码
算法
芯片
腾讯
AI for Science
Stable Diffusion
苹果
Agent
Claude
蛋白质
开发者
生成式
神经网络
xAI
机器学习
3D
人形机器人
研究
AI视频
生成
大语言模型
RAG
百度
具身智能
Sora
工具
GPU
华为
计算
字节跳动
AI设计
搜索
大型语言模型
AGI
视频生成
场景
深度学习
DeepMind
架构
视觉
生成式AI
预测
Transformer
编程
AI模型
伟达
特斯拉
Copilot