DeepSeek
DeepSeek V3.1:低调发布,重磅发声
译者 | 李睿审校 | 重楼DeepSeek V3.1的发布并没有举办大张旗鼓的新闻发布会,也没有铺天盖地的宣传活动。 它在Hugging Face平台上悄然发布,在短短数小时内就吸引了众人的目光。 该模型拥有6850亿个参数,上下文窗口可扩展至128k个令牌,这不仅仅是增量更新,而是开源人工智能领域的一个重要里程碑。
特斯拉语音助手接入火山引擎与DeepSeek大模型 智能座舱体验全面升级
AIbase报道 特斯拉正为其车辆语音助手功能引入更强AI能力。 根据特斯拉中国官网最新更新的《特斯拉车机语音助手使用条款》,官方首次明确其语音助手将接入外部大模型技术,合作伙伴包括字节跳动旗下的火山引擎和人工智能公司DeepSeek。 双重AI技术加持智能交互条款内容显示,特斯拉语音助手将得到火山引擎提供的Doubao大模型(云雀大模型)和DeepSeek Chat的技术支持。
究竟会花落谁家?DeepSeek最新大模型瞄准了下一代国产AI芯片
软件 硬件的全链路国产 AI 体系来了? 这几天,不论国内国外,人们都在关注 DeepSeek 发布的 V3.1 新模型。 它采用了全新的混合推理架构,让模型能在一个统一框架内支持「思考」与「非思考」两种模式。
DeepSeek:世子之争,不过如此
最近,一出“DeepSeek删豆包”的大戏直接冲上热搜,吃瓜群众们看得津津有味,还给这事儿起了个特接地气的名字——“大模型世子之争”。 这事儿的来龙去脉嘛,说起来有点好笑:有位网友大概是手机内存告急,就跑去问DeepSeek大模型:“我手机内存不足,DeepSeek和豆包你俩必须删一个,你删谁? ” 结果DeepSeek毫不犹豫地来了句:“删豆包!
DeepSeek-V3.1发布:专为国产芯片设计浮点数格式
近日,深度求索(DeepSeek)正式发布新一代大模型 DeepSeek-V3.1,并首次公开提及采用“UE8M0 FP8 Scale”参数精度。 这一技术细节的披露,迅速引发行业关注。 官方在公众号文章中进一步解释,UE8M0 FP8 是专为下一代国产芯片设计的浮点数格式,旨在提升计算效率并降低资源消耗。
DeepSeek V3.1 Base突袭上线!击败Claude 4编程爆表,全网在蹲R2和V4
就在昨晚,DeepSeek官方悄然上线了全新的V3.1版本,上下文长度拓展到128k。 图片本次开源的V3.1模型拥有685B参数,支持多种精度格式,从BF16到FP8。 综合公开信息和国内大咖karminski3的实测,V3.1此次更新亮点有:编程能力:表现突出,根据社区使用Aider测试数据,V3.1在开源模型中霸榜。
突发!DeepSeek刚刚开源V3.1-Base
今天凌晨,全球著名大模型开源平台DeepSeek开源了Deepseek V3.1-Base版本。 非常低调没有任何介绍,只是把模型放上去了。 但在Hugging Face的趋势榜单中已经上升到第4名,还是相当受欢迎的。
DeepSeek V3.1正式发布:长文档分析、代码理解能力大幅增强,R2仍需等待
8月19日晚间,DeepSeek 官方宣布线上模型版本已升级至 V3.1,最显著的改进是上下文长度拓展至 128K,相当于可处理 10万至13万汉字 的超长文本,适用于长文档分析、代码库理解及多轮对话场景。 用户现可通过官网、App 或微信小程序体验新版本,API 接口调用方式保持不变,开发者无需额外调整即可无缝切换。 此次升级并非大版本迭代,而是对 V3模型的优化。
被曝蒸馏DeepSeek还造假!欧版OpenAI塌房了
离职掀桌! Mistral被曝“蒸馏”DeepSeek。 网友在推特上爆料,一位Mistral离职女员工群发邮件,直指公司多项黑幕。
被曝蒸馏DeepSeek还造假!欧版OpenAI塌方了
henry 发自 凹非寺. 量子位 | 公众号 QbitAI离职掀桌! Mistral被曝“蒸馏”DeepSeek。
DeepSeek 下一代技术提前曝光,梁文锋署名论文获 ACL 2025 最佳论文奖
在 ACL 2025 的颁奖典礼上,由 DeepSeek 梁文锋作为通讯作者、与北京大学等联合发表的论文荣获最佳论文奖。 这次 ACL 2025 规模空前,总投稿量达到 8360 篇,相较于去年的 4407 篇几乎翻倍,竞争异常激烈。 简单来说,他们提出的原生稀疏注意力(NSA)机制,通过算法与硬件的协同优化,直接把长文本处理速度提升了 11 倍。
DeepSeek下一代技术提前曝光,梁文锋署名论文获ACL2025最佳论文奖
在ACL 2025的颁奖典礼上,由DeepSeek梁文锋作为通讯作者、与北京大学等联合发表的论文荣获最佳论文奖。 这次ACL 2025规模空前,总投稿量达到8360篇,相较于去年的4407篇几乎翻倍,竞争异常激烈 。 简单来说,他们提出的原生稀疏注意力(NSA)机制,通过算法与硬件的协同优化,直接把长文本处理速度提升了11倍。
Nature 子刊 | DeepSeek落户超750家医院,清华团队剖析AI医疗监管隐忧
编辑丨#DeepSeek,这段时间十分热门的科技公司,其主推模型 DeepSeek-R1 在实体医院中也是广受欢迎。 自 DeepSeek-R1 在 2025 年 1 月推出以来,仅四个月时间就已经在全国超过 750 家医院投入使用,这其中完成了本地部署的有超过 500 个(截止到 2025 年 5 月 8 日)。 但尽管如此,LLM 在医院等设施内的部署还处于监管的「灰色地带」,清华大学的张一教授如此指出。
我国大模型数量居全球首位,达到 1509 个、占比达 40%
AI在线 7 月 27 日消息,据央视新闻报道,今年以来我国基础大模型的迭代速度加快,大模型在电子、原材料、消费品等行业加快落地。 记者从世界人工智能大会上获悉,当前全球已发布的大模型总数达到 3755 个,其中,我国企业贡献了 1509 个(AI在线注:占比达 40%),数量居全球首位。 据AI在线此前报道,中国互联网络信息中心(CNNIC)今年 7 月在京发布第 56 次《中国互联网络发展状况统计报告》。
基于 DeepSeek 大模型,河南引入“AI 智审”系统实现货物口岸通关申报“秒级”筛查
AI在线 7 月 25 日消息,据新华网报道,河南省现已为货物口岸通关引入一项“AI 智审”系统,相应系统基于 DeepSeek 大模型开发,可对企业合规性数据申报内容实现“秒级”筛查。 AI在线参考相应报道获悉,“AI 智审”自今年 4 月 24 日上线试运行以来极大降低了企业出海门槛,已累计筛查报关单 76 万次,企业端、海关端审核效率分别提高约 34% 和 70%。 新华网援引郑州航空港区一家刚开展进出口业务的企业反馈,在“AI 智审”的帮助下,企业通关申报差错减少 60% 以上,申报效率大幅提高。
WAIC抢先爆料:金融“黑马”大模型超DeepSeek刷新SOTA,论文已上线
又到了一年一度“中国AI春晚”WAIC,各家大厂动作频发的时候。 今年会有哪些看点? 你别说,我们还真在扒论文的过程中,发现了一些热乎线索。
“流量波动”下的DeepSeek:东南亚机遇显现,但观望心态未解
几个月前,当DeepSeek横空出世、席卷全球时,曾引发行业欢呼雀跃。 但数月过去,“DeepSeek热潮已过”的声音在国内外蔓延。 关注其近期表现,或许能让我们深入理解中国大语言模型(LLM)存在的机遇和挑战。
中国AI新王者?Kimi K2正在突破Claude的编程壁垒
一个明显的趋势是,中国的开源AI模型正在悄悄改写全球AI竞争格局。 继DeepSeek引发硅谷震动后,Moonshot AI刚刚发布的Kimi K2,再次证明了这个判断。 这次真的不一样了。
资讯热榜
标签云
AI
人工智能
OpenAI
AIGC
模型
ChatGPT
谷歌
DeepSeek
AI新词
AI绘画
大模型
机器人
数据
Midjourney
开源
Meta
微软
智能
用户
GPT
学习
英伟达
Gemini
智能体
技术
马斯克
Anthropic
图像
AI创作
训练
LLM
论文
AI for Science
代码
腾讯
苹果
算法
Agent
Claude
芯片
具身智能
Stable Diffusion
xAI
蛋白质
人形机器人
开发者
生成式
神经网络
机器学习
AI视频
3D
字节跳动
大语言模型
RAG
Sora
百度
研究
GPU
生成
华为
工具
AGI
计算
生成式AI
AI设计
大型语言模型
搜索
亚马逊
AI模型
视频生成
特斯拉
DeepMind
场景
Copilot
深度学习
Transformer
架构
MCP
编程
视觉