应用
英伟达:DeepSeek-R1 模型现已上线 NIM 微服务平台
英伟达今日宣布,DeepSeek-R1 模型现已在 build.nvidia.com 上作为 NVIDIA NIM 微服务预览版提供。DeepSeek-R1 NIM 微服务可以在单个 NVIDIA HGX H200 系统上每秒提供多达 3,872 tokens。
1/31/2025 8:46:46 AM
浩渺
不用开口:谷歌 AI 帮你致电商家,价格、预约一键搞定
谷歌公司昨日(1 月 30 日)发布公告,在 Search Labs 中推出名为“Ask for Me”的实验性新功能,用户可以利用 AI 代替自己致电商家,咨询价格和服务可用性等信息。
1/31/2025 8:03:40 AM
故渊
Aurora 超级计算机向全球科学界开放,模拟计算能力超 1 FP64 ExaFLOPS
Aurora早在2015年就已公布,但因多次延迟才终于完成。现在,它能够提供超过1 FP64 ExaFLOPS的模拟计算能力,并能为人工智能和机器学习提供11.6混合精度ExaFLOPS的性能。
1/30/2025 8:48:07 PM
清源
AI 生成内容泛滥,美国最大作家组织推出“人类创作”书籍认证
该项目被称为“人类创作”(Human Authored)认证,旨在帮助作家在AI日益充斥的市场中让自己的作品脱颖而出,并确保读者知道他们阅读的书籍是由谁(或什么)创作的。
1/30/2025 7:59:41 PM
清源
清华翟季冬:DeepSeek 百倍算力效能背后的系统革命 | 智者访谈
一线 AI 洞察,智者深度思考 深入产业变革,共创 AI 未来2025 年伊始,全球 AI 业界被 DeepSeek 刷屏。 当 OpenAI 宣布 5000 亿美元的「星际之门」计划,Meta 在建规模超 130 万 GPU 的数据中心时,这个来自中国的团队打破了大模型军备竞赛的既定逻辑:用 2048 张 H800 GPU,两个月训练出了一个媲美全球顶尖水平的模型。 这一突破不仅撼动了英伟达万亿市值,更引发了整个行业的反思:在通往 AGI 的征程上,我们是否过于盲信算力规模,而忽视了一条更加务实且充满创新可能的路径?
1/30/2025 7:56:00 PM
机器之心
DeepSeek R1有没有赶上OpenAI o1? 八大场景测评结果出炉
经过一系列测试 —— 从创意写作到复杂的教学,DeepSeek-R1 的综合实力完全能和 OpenAI 的付费「精英」们掰手腕。 原来用对方法,性价比路线也能玩转 AI 竞技场! DeepSeek 发布其开放权重的 R1 推理模型仅一周时间,多次震惊海内外。
1/30/2025 7:51:00 PM
机器之心
调查显示:美国青少年对大型科技公司的信任正在下降
Common Sense的调查发现,64%的青少年表示不相信大型科技公司会关心他们的心理健康,62%的青少年认为这些公司若涉及到利润问题,就不会保证他们的安全。
1/30/2025 5:55:14 PM
清源
印度启动创建本土 AI 基础模型计划:目标训出“有文化特色”的模型
“我们已经构建了框架,并今天正式启动。我们的核心目标是开发能够反映印度本土语境和文化的人工智能模型。”
1/30/2025 4:40:20 PM
清源
大模型训练开销还能更小:微软推出首个 FP4 训练框架,训练效果与 BF16 相当
首个 FP4 精度的大模型训练框架来了,来自微软研究院!在相同超参数的设置下,可以达到与 FP8 以及 BF16 相当的训练效果。
1/30/2025 2:52:31 PM
清源
股东施压苹果:要求其公开 AI“黑匣子”,提高隐私保护透明度
根据最新披露的股东提案,多名股东向苹果公司施压,要求其披露更多的 AI 活动细节,进一步提高训练和推理 Apple 智能(Apple Intelligence)的透明度。
1/30/2025 7:00:21 AM
故渊
DeepSeek 应用在意大利应用商店下架,此前曾被该国隐私监管机构盯上
DeepSeek 应用已从意大利的 Google Play 和苹果 App Store 中下架。虽然确切原因未知,但猜测可能与意大利隐私监管机构 Garante 此前对 DeepSeek 提出的数据隐私问题有关。
1/29/2025 9:50:43 PM
远洋
阿斯麦 CEO:DeepSeek 的出现是好消息
荷兰光刻机制造商 ASML Holding NV 的首席执行官克里斯托夫・福凯(Christophe Fouquet)在周三的新闻发布会上表示,对于 ASML 而言,任何能够降低成本的消息都是好消息。此前,中国初创公司 DeepSeek 推出的低成本聊天机器人在市场上引发了波动,但福凯认为,这反而为 ASML 带来了更多机遇。
1/29/2025 8:04:00 PM
远洋
能思考会搜索的国产大模型,全网疯测的 DeepSeek 牛在哪?
一家来自杭州的“小公司” DeepSeek,却给整个 AI 行业带来了新思路,这两天可以说是火遍了全网。
1/29/2025 8:02:20 PM
泓澄
OpenAI:有证据表明 DeepSeek 使用了我们的模型进行训练
OpenAI 向《金融时报》表示,他们发现了 DeepSeek 使用“蒸馏”技术的证据。这是一种常见的开发手段,开发者通过从更大、更强大的模型中提取数据来训练自己的 AI 模型。这种技术能够以远低于 OpenAI 训练 GPT-4 所花费的 1 亿美元以上的成本,高效地训练出小型模型。尽管开发者可以通过 OpenAI 的 API 将其 AI 技术整合到自己的应用程序中,但利用输出数据来构建竞争模型则违反了 OpenAI 的服务条款。
1/29/2025 7:07:03 PM
远洋
OpenAI首席研究官:DeepSeek独立发现了o1的一些核心思路,奥特曼、LeCun纷纷置评
成本打下来了,需求更多才对? 春节这几天,国内外 AI 圈都被 DeepSeek 刷了屏。 英伟达的股市震荡更是让全世界看得目瞪口呆(参见《英伟达市值蒸发近 6000 亿美元,而 DeepSeek 刚刚又开源新模型》)。
1/29/2025 6:43:00 PM
机器之心
原来,这些顶级大模型都是蒸馏的
「除了 Claude、豆包和 Gemini 之外,知名的闭源和开源 LLM 通常表现出很高的蒸馏度。 」这是中国科学院深圳先进技术研究院、北大、零一万物等机构的研究者在一篇新论文中得出的结论。 前段时间,一位海外技术分析师在一篇博客中提出了一个猜想:一些顶级的 AI 科技公司可能已经构建出了非常智能的模型,比如 OpenAI 可能构建出了 GPT-5,Claude 构建出了 Opus 3.5。
1/29/2025 6:40:00 PM
机器之心
春晚小品“远程施法”,昨晚至今唤醒全球小米小爱同学超亿次
小米智能助手“小爱同学”官方账号今日分享了来自小米数据中心的信息,称昨晚到今天中午,春晚唤醒全球小爱同学超亿次(统计时间:2025 年 1 月 28 日 23:00 - 2025 年 1 月 29 日 12:00)。
1/29/2025 4:05:34 PM
归泷(实习)
资讯热榜
首个面向肽分子设计的大模型平台:直接「读序列」出结合子,无需结构输入即可生成
蚂蚁集团携手北医三院成立AI医疗联合实验室 打造专属AI就医助理
国产AI路由系统开源逆袭!仅用19%成本达到Gemini-2.5-Pro同等性能
OpenAI豪赌5000亿美元估值神话:60亿股权大甩卖背后,GPT-5却遭用户冷遇
深度揭秘OpenAI如何让GPT-5「技术性」超越Claude:悄悄跳过最难的23道题
心理学家警告:与 AI 聊天可能导致严重心理健康问题
摩根士丹利:AI 革命将为标准普尔 500 指数企业每年节省近 1 万亿美元
OpenAI加速推进GPT-6开发,奥尔特曼承诺打造"有记忆"的个性化AI助手
标签云
AI
人工智能
OpenAI
AIGC
模型
ChatGPT
DeepSeek
AI绘画
谷歌
机器人
数据
大模型
Midjourney
开源
智能
用户
Meta
微软
GPT
学习
技术
图像
Gemini
马斯克
AI创作
智能体
英伟达
论文
Anthropic
代码
训练
算法
Stable Diffusion
AI新词
芯片
LLM
蛋白质
腾讯
开发者
苹果
生成式
Claude
Agent
AI for Science
神经网络
3D
机器学习
研究
生成
xAI
人形机器人
AI视频
计算
Sora
百度
GPU
AI设计
华为
工具
大语言模型
搜索
RAG
具身智能
字节跳动
大型语言模型
场景
深度学习
预测
伟达
视频生成
视觉
Transformer
AGI
架构
亚马逊
神器推荐
Copilot
DeepMind
特斯拉
应用