DeepSeek
清华翟季冬:DeepSeek 百倍算力效能背后的系统革命 | 智者访谈
一线 AI 洞察,智者深度思考 深入产业变革,共创 AI 未来2025 年伊始,全球 AI 业界被 DeepSeek 刷屏。 当 OpenAI 宣布 5000 亿美元的「星际之门」计划,Meta 在建规模超 130 万 GPU 的数据中心时,这个来自中国的团队打破了大模型军备竞赛的既定逻辑:用 2048 张 H800 GPU,两个月训练出了一个媲美全球顶尖水平的模型。 这一突破不仅撼动了英伟达万亿市值,更引发了整个行业的反思:在通往 AGI 的征程上,我们是否过于盲信算力规模,而忽视了一条更加务实且充满创新可能的路径?
1/30/2025 7:56:00 PM
机器之心
DeepSeek 应用在意大利应用商店下架,此前曾被该国隐私监管机构盯上
DeepSeek 应用已从意大利的 Google Play 和苹果 App Store 中下架。虽然确切原因未知,但猜测可能与意大利隐私监管机构 Garante 此前对 DeepSeek 提出的数据隐私问题有关。
1/29/2025 9:50:43 PM
远洋
阿斯麦 CEO:DeepSeek 的出现是好消息
荷兰光刻机制造商 ASML Holding NV 的首席执行官克里斯托夫・福凯(Christophe Fouquet)在周三的新闻发布会上表示,对于 ASML 而言,任何能够降低成本的消息都是好消息。此前,中国初创公司 DeepSeek 推出的低成本聊天机器人在市场上引发了波动,但福凯认为,这反而为 ASML 带来了更多机遇。
1/29/2025 8:04:00 PM
远洋
能思考会搜索的国产大模型,全网疯测的 DeepSeek 牛在哪?
一家来自杭州的“小公司” DeepSeek,却给整个 AI 行业带来了新思路,这两天可以说是火遍了全网。
1/29/2025 8:02:20 PM
泓澄
OpenAI:有证据表明 DeepSeek 使用了我们的模型进行训练
OpenAI 向《金融时报》表示,他们发现了 DeepSeek 使用“蒸馏”技术的证据。这是一种常见的开发手段,开发者通过从更大、更强大的模型中提取数据来训练自己的 AI 模型。这种技术能够以远低于 OpenAI 训练 GPT-4 所花费的 1 亿美元以上的成本,高效地训练出小型模型。尽管开发者可以通过 OpenAI 的 API 将其 AI 技术整合到自己的应用程序中,但利用输出数据来构建竞争模型则违反了 OpenAI 的服务条款。
1/29/2025 7:07:03 PM
远洋
OpenAI首席研究官:DeepSeek独立发现了o1的一些核心思路,奥特曼、LeCun纷纷置评
成本打下来了,需求更多才对? 春节这几天,国内外 AI 圈都被 DeepSeek 刷了屏。 英伟达的股市震荡更是让全世界看得目瞪口呆(参见《英伟达市值蒸发近 6000 亿美元,而 DeepSeek 刚刚又开源新模型》)。
1/29/2025 6:43:00 PM
机器之心
意大利机构要求 DeepSeek 提供数据保护相关信息
据 Techcrunch 报道,欧洲消费者组织(Euroconsumers)与意大利数据保护机构(Italian Data Protection Authority,DPA)联合对 DeepSeek 提出投诉。这是自 DeepSeek 迅速走红以来,首次有数据保护机构对其采取重大行动。投诉的核心问题是 DeepSeek 在处理个人数据时是否符合欧洲的《通用数据保护条例》(GDPR)。
1/29/2025 3:19:09 PM
远洋
谷歌前CEO:DeepSeek崛起标志着全球AI竞赛新阶段
谷歌前首席执行官埃里克·施密特(Eric Schmidt)在发表的专栏文章中呼吁美国加大开源人工智能的研发力度,以应对DeepSeek的崛起。 图源备注:图片由AI生成,图片授权服务商Midjourney施密特认为,DeepSeek的崛起标志着全球人工智能竞赛的转折点,证明中国可以利用更少的资源与大科技公司竞争。 施密特指出,为了对抗DeepSeek,美国必须开发更多的开源模型,投资人工智能基础设施(如星际之门),并鼓励领先的实验室分享他们的训练方法。
1/29/2025 10:33:00 AM
AI在线
DeepSeek 梁文锋回应冯骥赞誉(更新:回答真实性存疑)
昨日游戏科学创始人、黑神话悟空制作人冯骥力推 DeepSeek 大模型,其认为 DeepSeek 可能是国运级别的科技成果。冯骥在发文中详细列举了 DeepSeek 的六大卓越特性,每一项都堪称业界突破。
1/28/2025 11:04:45 PM
远洋
再加一把火、造福全人类,Hugging Face 号召打造完全开源版 DeepSeek R1 大模型
Hugging Face 称这项工作非常重要,因为 DeepSeek R1 非常高效,可以作为创新的基础模型。它也可以被研究人员、科学家和企业用作促进创新和突破的负担得起的模型。
1/28/2025 9:33:49 PM
汪淼
英特尔前 CEO 基辛格力挺 DeepSeek:将推动 AI 普及
基辛格认为,DeepSeek 的出现应该让科技行业牢记三个最重要的教训:降低成本意味着更广泛的采用;在限制条件下,创造力会蓬勃发展;“开放即胜利”。他指出,DeepSeek 将有助于打破基础 AI 模型工作日益封闭的局面。
1/28/2025 5:41:03 PM
远洋
OpenAI 阿尔特曼:DeepSeek-R1 令人印象深刻,将推出更好的模型
OpenAI CEO 阿尔特曼今日在 X 上发文称,DeepSeek-R1 令人印象深刻,尤其是考虑到其价格和功能性后。另外,他还表示将新的对手令人振奋,推出更好的模型。
1/28/2025 1:06:47 PM
归泷(实习)
英伟达点赞DeepSeek:是“出色的人工智能进步”
国产大模型公司DeepSeek的应用登顶苹果中国地区和美国地区应用商店免费APP下载排行榜,超越了ChatGPT。 这一成就不仅引起了市场的广泛关注,也对AI芯片龙头英伟达的股价产生了重大影响。 尽管如此,英伟达发言人仍然对DeepSeek给出了高度评价,称其为AI领域的一项卓越进步,并指出DeepSeek的工作展示了如何利用测试时间缩放技术、广泛可用的模型以及符合出口管制的计算资源来创建新型号。
1/28/2025 10:50:00 AM
AI在线
ChatGPT回应DeepSeek超越:排名变化或为暂时现象
DeepSeek应用超越ChatGPT,登顶苹果美国区免费App下载排行榜,引发市场热议。 这家被称为“大模型版拼多多”的中国公司,其应用的快速上升让海内外技术同行和投资机构都密切关注。 对于这一排名变化,ChatGPT回应称,DeepSeek可能在某些方面有独特优势或满足了用户特定需求,但这样的排名变化也许是暂时的,同时也表明AI应用市场竞争激烈,创新空间巨大。
1/28/2025 10:45:00 AM
AI在线
DeepSeek称遭到大规模恶意攻击,注册或受影响
DeepSeek发布公告称其线上服务近期遭受了大规模恶意攻击,导致注册过程可能变得繁忙。 DeepSeek提醒用户,如果遇到注册困难,可以稍等后重试。 已注册用户可以正常登录,不受影响。
1/28/2025 10:37:00 AM
AI在线
DeepSeek 深夜再放大招:7B 参数人人可用的视觉多模态模型 Janus-Pro-7B 开源
官方表示:Janus 的表现超越了传统的统一模型,并且在与任务特定模型的比较中也同样表现出色。凭借其简洁、高灵活性和高效性的特点,Janus-Pro 成为下一代统一多模态模型的有力竞争者。
1/28/2025 1:12:03 AM
清源
DeepSeek:近期线上服务被大规模恶意攻击导致注册可能繁忙,已注册用户可正常登录
DeepSeek通过官方服务状态发布声明称:近期DeepSeek线上服务受到大规模恶意攻击,注册可能繁忙,请稍等重试。已注册用户可以正常登录,感谢理解和支持。
1/28/2025 12:46:39 AM
清源
资讯热榜
标签云
AI
人工智能
OpenAI
AIGC
模型
ChatGPT
DeepSeek
AI绘画
谷歌
机器人
数据
大模型
Midjourney
开源
智能
Meta
用户
微软
GPT
学习
技术
图像
Gemini
马斯克
智能体
AI创作
Anthropic
英伟达
AI新词
论文
代码
训练
算法
LLM
Stable Diffusion
芯片
蛋白质
开发者
腾讯
Claude
苹果
Agent
生成式
AI for Science
神经网络
3D
机器学习
研究
xAI
生成
人形机器人
AI视频
计算
百度
Sora
GPU
华为
工具
RAG
AI设计
大语言模型
搜索
字节跳动
具身智能
大型语言模型
场景
深度学习
预测
视频生成
伟达
视觉
AGI
Transformer
架构
神器推荐
亚马逊
Copilot
特斯拉
DeepMind
应用