DeepSeek
DeepSeek 推出 NSA 技术:加速长上下文训练与推理
在人工智能领域,DeepSeek 团队于近日发布了最新研究成果,推出了一种名为 NSA(Native Sparse Attention)的创新稀疏注意力机制。 这项技术的核心目标是提升长上下文训练和推理的速度,特别是针对现代硬件进行了优化,使得训练和推理的效率大幅提升。 NSA 技术的推出,为人工智能模型的训练带来了显著的变化。
2/18/2025 8:33:00 PM
AI在线
理想同学 App 接入 DeepSeek R1 & V3 模型,支持深度思考、联网搜索功能
据多位微博用户分享及理想汽车第一产品线总裁汤靖确认,理想同学 App 已接入 DeepSeek R1 & V3 模型(内测版 V1.2.0),支持深度思考、联网搜索、连续对话等功能。
2/18/2025 6:06:23 PM
归泷(实习)
刚刚!DeepSeek梁文锋亲自挂名,公开新注意力架构NSA
DeepSeek 新论文来了! 相关消息刚刚发布到 𝕏 就吸引了大量用户点赞、转发、评论三连。 据介绍,DeepSeek 的这篇新论文提出了一种新的注意力机制 ——NSA。
2/18/2025 5:30:00 PM
机器之心
Kimi大幅削减广告预算,DeepSeek崛起令月之暗面压力倍增
在国内 AI 领域,Kimi 曾是备受关注的创业产品,但随着 DeepSeek 的崛起,这一局面正悄然改变。 近日,月之暗面公司宣布将大幅削减 Kimi 的广告投放预算,暂停多个安卓渠道的推广以及与第三方广告平台的合作,这一决策显然是对 DeepSeek 迅猛发展的直接反应。 根据界面新闻的报道,DeepSeek 在短短数十天内成功吸引了3500万日活跃用户,而 Kimi 在过去一年多的时间内投入大量资金,日活跃用户却未能突破千万。
2/18/2025 5:09:00 PM
AI在线
DeepSeek 再放降本大招:NSA 官宣发布,加速推理降低成本,并且不牺牲性能
DeepSeek 官方表示,该机制可优化现代硬件设计,加速推理同时降低预训练成本,并且不牺牲性能。在通用基准、长上下文任务和基于指令的推理上,其表现与全注意力模型相当或更加优秀。
2/18/2025 4:50:36 PM
汪淼
消息称 Kimi 大砍投放预算,DeepSeek 冲击之下月之暗面暂缓“烧钱”投广告
月之暗面近期决定大幅收缩产品投放预算,包括暂停多个安卓渠道的投放,以及第三方广告平台的合作。(界面新闻)
2/18/2025 4:41:14 PM
汪淼
腾讯公关总监张军回应“DeepSeek 元宝回答植入广告”:理论上不应该,估计开了联网搜索
腾讯公关总监张军给出原因:“回答参考了‘58 到家家政保洁保姆月嫂搬家’公众号的避坑内容‘空调移机套路多?过来人总结了 4 个坑,提前了解不花冤枉钱!’估计是开了联网搜索。”
2/18/2025 3:59:09 PM
归泷(实习)
终于找到答案了!DeepSeek凭啥能给出这么丰富的答案 - 反事实推理(上)
为什么deepseek的回答如此丰富,如此多维度? 今天和大家聊聊,deepseek核心技术(之一):反事实推理。 什么是反事实推理?
2/18/2025 3:13:13 PM
58沈剑
企业AI采用规则变革:IT领导者面临的新机遇与挑战
一场AI领域的“地震”正悄然发生,而这场“地震”的震源,正是初创企业DeepSeek推出的R1 AI模型。 这一模型的横空出世,不仅让美国科技股市值蒸发万亿,更让OpenAI、Alphabet、Meta等AI巨头措手不及。 DeepSeek声称,其推理模型性能媲美OpenAI的顶尖产品,速度翻倍,成本却仅为十分之一。
2/18/2025 3:11:16 PM
Martin De Saulles
用户对 DeepSeek 的热情远超预期,腾讯紧急调用元宝支持微信搜索
据界面新闻报道,腾讯内部正紧急协调部署,通过调用元宝来支持微信搜索功能,为用户提供更多入口和选择。
2/18/2025 2:44:23 PM
远洋
DeepSeek-R1 深度推理、1699 元,有道 SpaceOne 全面屏答疑词典笔发布
有道 SpaceOne 号称是“国内首款 AI 原生学习硬件”,内置 AI 家教“小 P 老师”,接入 DeepSeek-R1 深度推理,讲题更细致。
2/18/2025 2:24:56 PM
汪淼
中国气象局研讨 DeepSeek 气象应用
2 月 14 日,中国气象局专题交流研讨如何推动深度求索(DeepSeek)大语言模型与气象业务服务结合和应用问题,更好推动气象高质量发展。
2/18/2025 2:20:14 PM
远洋
Grok-3正式发布:马斯克"钞能力"催生AI新王座挑战者
埃隆·马斯克旗下xAI公司正式发布Grok系列第三代大语言模型,在AI领域掀起新一轮技术海啸。 这款被开发者称为"当下地表最强"的模型,或将重塑全球AI竞争格局。 据官方披露,Grok-3在多项核心指标上已超越现有主流模型,测试用户反馈其实际表现达到"o3-full"基准水平。
2/18/2025 1:49:00 PM
AI在线
全球AI大佬如何看待DeepSeek?美日欧心态大不同,有人高兴有人愁
在全球人工智能的舞台上,DeepSeek的崛起如同一颗耀眼的新星,引发了美日欧等科技巨头和专家的高度关注。 这些来自不同地域的AI大佬们,对DeepSeek的技术实力和行业影响力做出了截然不同的评价,非常耐人寻味。 美国:从惊讶到警惕,再到“如坐针毡”美国方面,DeepSeek的出现打破了长期以来由OpenAI和谷歌主导的AI格局。
2/18/2025 1:44:53 PM
舒云
深圳福田区放大招:一口气“聘请” 70 位 AI 数智员工!政务效率狂飙
近日,来自“幸福福田”官方微信公众号的重磅消息引发科技圈热议:深圳市福田区政府率先拥抱 AI 技术,正式上线了一支由70名 AI 数智员工组成的“效率先锋队”。 这批“新员工”由国内 AI 独角兽企业 DeepSeek (深度求索) 倾力打造,身兼11大类职务,个个身怀绝技, 誓要将福田区的政务效率提升到前所未有的高度。 据了解,这并非简单的通用 AI 应用,福田区政府深度结合各部门的实际业务流程,为每一位 AI 数智员工量身定制了“个性化智能体”。
2/18/2025 11:23:00 AM
AI在线
用Deepseek翻译哪吒2急急如律令,结果有点意思!
近日,关于海外版《哪吒之魔童闹海》的翻译引发了网友的广泛讨论,尤其是咒语 “急急如律令” 的翻译方式引起了关注和争议。 在社交媒体上,有网友曾称在海外版中,“急急如律令” 的台词被翻译为 “quickly quickly biu biu biu”,这一消息引发了热烈的讨论。 但随后这一说法被辟谣,观众在观影后指出,实际翻译为 “swift and uplift”。
2/18/2025 11:16:00 AM
AI在线
DeepSeek时代:经验已死,提问为王
随着人工智能技术的飞速发展,DeepSeek 等先进 AI 系统的出现,正在彻底改变我们的工作方式和学习模式。 过去依赖的经验和做事思路,在 AI 时代可能已经不再适用。 面对这一变革,我们必须重新审视自己的能力体系,学会问正确的问题,并快速适应新的工作方式。
2/18/2025 11:15:12 AM
数据人创作者联盟
韩国下架DeepSeek的安全反思
据韩联社2月17日报道,韩国个人信息保护委员会(PIPC)于本周一宣布,即日起暂停中国人工智能初创企业深度求索(DeepSeek)旗下聊天机器人应用在韩国应用商店的新用户下载服务,以审查其是否符合韩国《个人信息保护法》。 已安装用户仍可正常使用,但被建议避免输入敏感个人信息。 DeepSeek承认“欠考虑”根据PIPC公告,此次限制措施自2月15日下午6时生效,主要针对苹果AppStore和谷歌Play商店的韩国本地版本。
2/18/2025 11:08:41 AM
佚名
资讯热榜
标签云
人工智能
OpenAI
AIGC
AI
ChatGPT
AI绘画
DeepSeek
数据
模型
机器人
谷歌
大模型
Midjourney
智能
用户
开源
学习
GPT
微软
Meta
图像
AI创作
技术
论文
Gemini
Stable Diffusion
马斯克
算法
蛋白质
芯片
代码
生成式
英伟达
腾讯
神经网络
研究
计算
Anthropic
3D
Sora
AI for Science
AI设计
机器学习
开发者
GPU
AI视频
华为
场景
人形机器人
预测
百度
苹果
伟达
Transformer
深度学习
xAI
Claude
模态
字节跳动
大语言模型
搜索
驾驶
具身智能
神器推荐
文本
Copilot
LLaMA
算力
安全
视觉
视频生成
训练
干货合集
应用
大型语言模型
亚马逊
科技
智能体
AGI
DeepMind