模型

深度揭秘OpenAI如何让GPT-5「技术性」超越Claude：悄悄跳过最难的23道题

几天前，OpenAI发布会上，奥特曼宣布GPT-5登顶了，号称代码能力全球第一。但发布会上搞了一个大乌龙，52.8＞69.1=30.8？于是，OpenAI那些年薪上亿的天才们做的一张表格火遍了全世界（左边）。

8/20/2025 12:24:23 PM

突发！DeepSeek刚刚开源V3.1-Base

今天凌晨，全球著名大模型开源平台DeepSeek开源了Deepseek V3.1-Base版本。非常低调没有任何介绍，只是把模型放上去了。但在Hugging Face的趋势榜单中已经上升到第4名，还是相当受欢迎的。

8/20/2025 9:35:20 AM

DeepSeek开源新基础模型，但不是V4，而是V3.1-Base

昨晚，深度求索在用户群里宣布「DeepSeek 线上模型版本已升级至 V3.1，上下文长度拓展至 128k」并更新了 UI （去掉了 DeepThink 旁的 R1 标示）之后，在 Hugging Face 发布了一款新模型 DeepSeek-V3.1-Base。模型地址：，该模型是 DeepSeek-V3 系列最新的基础模型。至于为什么命名为 V3.1，而不是像之前以前命名为 V3 带四位日期数字的形式（如 V3-0324），尽管社区有诸多猜测，但深度求索官方尚未给出明确说明 —— 和该公司之前的操作一样，这一次同样是模型先行，说明和宣传还在后面。

8/20/2025 9:08:00 AM

美国专家来中国转了一圈：AI比赛已经结束了

现状来看，美国后继乏力，比赛可能已经结束了。这就是一个美国专家，近期来中国转了一圈，然后回国后被万千美国网友议论的最新结论。而且这个结论，不少美国人由衷认同，因为论据核心主要涉及——电力。

8/20/2025 9:04:00 AM

英伟达开源9B参数小模型，比Qwen3快6倍

小模型也开始卷起来了！在麻省理工学院衍生公司Liquid AI发布了一款小到可以装在智能手表上的新AI视觉模型，以及谷歌发布了一款可以在智能手机上运行的小型模型之后，英伟达也加入了这场浪潮，推出了自己的新型小型语言模型（SLM）：Nemotron Nano v2。这款9B的“小”模型在复杂推理基准测试上的准确率与Qwen3-8B相当或更高，速度快6倍。

8/19/2025 4:10:46 PM

首个3D动作游戏专用VLA模型，打黑神话&只狼超越人类玩家 | ICCV 2025

3B多模态大模型在动作角色扮演游戏的战斗任务中，成功率超越GPT-4o和人类玩家，淘天集团未来生活实验室团队提出了CombatVLA，已被ICCV 2025接收。在复杂的三维环境中实现实时决策仍面临重大挑战，要求模型能在秒级时间尺度做出响应，具备高分辨率感知能力，并能够在动态条件下进行战术推理。如下图所示，团队给出了CombatVLA推理得到的AoT解释、解析成Python代码的动作指令，以及执行这些动作后的帧序列。

8/19/2025 4:08:20 PM

GPT 4o-mini华人领队离开OpenAI：真正推动AI进步不是模型架构，而是互联网

刚刚，OpenAI又离职一名华人大佬。前OpenAI研究员Kevin Lu宣布加入AI新创Thinking Machines Lab。 Kevin Lu主导了GPT-4o mini的发布，并参与o*-mini、o3等模型工作。

8/19/2025 3:58:59 PM

小模型才是 Agent 的未来？这篇立场文把话挑明了

AI圈最近什么最火？答案里一定有AI Agent。从能帮你预订机票、规划旅行的私人助理，到能自动编写、调试代码的程序员搭档，AI智能体的浪潮正汹涌而来。

8/19/2025 9:20:02 AM

超越RAG和DAPT！华人团队新研究引热议：即插即用、无需改变原参即可让模型化身领域专家

一个小解码器让所有模型当上领域专家！华人团队新研究正在引起热议。他们提出了一种比目前业界主流采用的DAPT（领域自适应预训练）和RAG（检索增强生成）更方便、且成本更低的方法。

8/19/2025 9:12:00 AM

OpenAI 开源模型被 Meta 研究员“逆改”！只动0.3%参数，gpt-oss-20B 解锁无约束基座

OpenAI在8月初发布了开放权重模型家族gpt-oss，这是公司自2019年GPT-2以来首次真正意义上的开源动作。仅仅两周后，一位研究者就将这一模型“拆解重组”，推出了与官方版本迥异的变体。康奈尔大学博士生、前Google Brain成员、现任Meta研究员的Jack Morris，公开了名为gpt-oss-20b-base的新版本。

8/19/2025 2:10:00 AM

AI版华尔街之狼！o3-mini靠「神之押注」狂赚9倍，DeepSeek R1最特立独行

AI能预测未来吗？在《黑客帝国》里，先知能对Neo的未来做出预测。以ChatGPT为代表的AI，则可以根据过去的语料来「预测下一个Token」。

8/18/2025 5:16:45 PM

GPT-5首次会推理，OpenAI联创曝AGI秘诀！超临界学习吞噬算力，2045金钱无用？

「GPT-5，是一个分水岭」。昨天，OpenAI联创Greg Brockman在Latent Space团队的专访中对GPT-5做出了高度的评价。这一小时的访谈，含金量极高。

8/18/2025 9:16:00 AM

奥特曼神秘晚宴讲话曝出！OpenAI的CEO或将是个AI，Chrome我也想买

你们有没有发现，GPT-5最近好像变得不太一样了？刚刚，OpenAI宣布GPT-5即将恢复GPT-4o的「温暖」风格。奥特曼认为模型变暖只是第一步，让用户自定义ChatGPT风格才能真正解决问题。

8/18/2025 9:10:00 AM

AI顶会反噬整个学术圈！「不发表就会死」，NeurIPS爆仓，博士年肝4.5篇大崩溃

或许你也注意到了这个现象——AI和机器学习的繁荣，已经造成了一场少有人谈论的危机。学生和研究人员过剩，就业前景有限，整个学术体系已经不堪重负。随着NeurIPS、ICML和CVPR等会议的投稿数量激增，同行评审流程正在崩溃。

8/18/2025 8:51:00 AM

Claude Code 史诗级更新！AI 编程进入“反向教学”模式，写到一半会停下考你：这行代码你来写

Claude code又更新了，最近claude几乎一天一更新，今天，Claude Code 和 Claude App 推出了学习模式，感觉Claude Code正在朝着万能Agent发展先说 Claude Code：现在支持用 /output-style 来定制沟通风格，Output styles允许你把 Claude Code 调整为任意类型的Agent来配合你的工作流程，同时保留它的核心能力（运行本地脚本、读写文件、维护 TODO）这次主打两种风格，专为学生和开发者提升技能而来：Explanatory（解释）——Claude 会把它的思考过程摊开说，为什么这么设计、有哪些权衡、最佳实践是什么，一边写代码一边讲门道Learning（学习）——更像结对编程的导师。 Claude 会不时暂停，把部分任务交给你来写，再给出指导与反馈，边做边学实操上，如果你想更深入理解它在做什么、为什么这么做，选 Explanatory；如果你想通过亲手编码快速进步，选 Learning，把 Claude 当成带你升级打怪的搭档就好。更多细节可看官方文档：，对所有 Claude App 用户也有好消息：此前在 Claude for Education首发的 Learning 风格，现在全面开放。

8/15/2025 9:16:16 AM

Meta刚刚开源DINOv3，横扫60+任务，无标注封神！

今天凌晨，全球社交、科技巨头Meta开源了，最新视觉大模型DINOv3。 DINOv3的主要创新使用了自我监督学习，无需标注数据就能大幅度降低训练所需要的时间和算力资源。并且与前一代相比，DINOv3的训练数据大12倍扩大至17亿张图像以及大7倍的70亿参数。

8/15/2025 9:07:09 AM

链式思维是幻象吗？从数据分布视角重新审视大模型推理，马斯克回复，Grok破防

思维链 (CoT) 提示技术常被认为是让大模型分步思考的关键手段，通过在输入中加入「Let’s think step by step」等提示，模型会生成类似人类的中间推理步骤，显著提升复杂任务的表现。然而，这些流畅的推理链条是否真的反映了模型的推理能力？亚利桑那州立大学的一项最新研究却发现，CoT 推理可能并不是真正的推理，而更像是对训练数据分布内模式的复现。

8/15/2025 9:03:24 AM

LeetCode刷够100小时，学会找人内推，OpenAI员工下场教你拿Offer

OpenAI 在 AI 领域引领了一波又一波浪潮，想必很多人好奇，这些创新背后的研究人员是如何通过面试的？尤其是现在，OpenAI 已经成为全球最受瞩目的 AI 公司之一，吸引了无数顶尖人才投递简历。想要加入这个团队，着实不容易。

8/15/2025 8:57:02 AM

资讯热榜

免费！让图片放大不失真的位图转矢量图神器 Tmttool AI应用新纪元：2025中国AI应用排行榜榜单揭晓丨2025年1月 GGUF 是什么？一文看懂大模型里最火的模型格式最火、最全的Agent记忆综述，NUS、人大、复旦、北大等联合出品 6秒视频10秒生成！全新AI视频神器 Grok Imagine 深度体验+元提示词分享 Sora、可灵、即梦哪家强？AI视频软件深度测评！免注册免费用！17种AI绘图模型一站式体验平台LMArena 可灵、即梦、海螺、Vidu哪家强？4大AI视频神器深度测评

标签云

AI 人工智能 OpenAI AIGC 模型 ChatGPT 谷歌 DeepSeek AI绘画 AI新词大模型机器人数据 Midjourney 开源 Meta 微软智能用户 GPT 学习智能体技术 Gemini 英伟达马斯克 Anthropic 图像 AI创作训练 LLM 论文代码 AI for Science 苹果腾讯算法 Agent Claude 芯片 Stable Diffusion 具身智能 xAI 蛋白质开发者人形机器人生成式神经网络机器学习 AI视频 3D RAG 大语言模型字节跳动 Sora 百度研究 GPU 生成工具华为 AGI 计算 AI设计生成式AI 大型语言模型搜索视频生成亚马逊特斯拉 AI模型 DeepMind 场景深度学习 Copilot Transformer 架构 MCP 编程视觉

模型

深度揭秘OpenAI如何让GPT-5「技术性」超越Claude：悄悄跳过最难的23道题

突发！DeepSeek刚刚开源V3.1-Base

DeepSeek开源新基础模型，但不是V4，而是V3.1-Base

美国专家来中国转了一圈：AI比赛已经结束了

英伟达开源9B参数小模型，比Qwen3快6倍

首个3D动作游戏专用VLA模型，打黑神话&amp;只狼超越人类玩家 | ICCV 2025

GPT 4o-mini华人领队离开OpenAI：真正推动AI进步不是模型架构，而是互联网

小模型才是 Agent 的未来？这篇立场文把话挑明了

超越RAG和DAPT！华人团队新研究引热议：即插即用、无需改变原参即可让模型化身领域专家

OpenAI 开源模型被 Meta 研究员“逆改”！只动0.3%参数，gpt-oss-20B 解锁无约束基座

AI版华尔街之狼！o3-mini靠「神之押注」狂赚9倍，DeepSeek R1最特立独行

GPT-5首次会推理，OpenAI联创曝AGI秘诀！超临界学习吞噬算力，2045金钱无用？

奥特曼神秘晚宴讲话曝出！OpenAI的CEO或将是个AI，Chrome我也想买

AI顶会反噬整个学术圈！「不发表就会死」，NeurIPS爆仓，博士年肝4.5篇大崩溃

Claude Code 史诗级更新！AI 编程进入“反向教学”模式，写到一半会停下考你：这行代码你来写

Meta刚刚开源DINOv3，横扫60+任务，无标注封神！

链式思维是幻象吗？从数据分布视角重新审视大模型推理，马斯克回复，Grok破防

LeetCode刷够100小时，学会找人内推，OpenAI员工下场教你拿Offer

首个3D动作游戏专用VLA模型，打黑神话&只狼超越人类玩家 | ICCV 2025