AI在线 AI在线

模型

英伟达开源9B参数小模型,比Qwen3快6倍

小模型也开始卷起来了! 在麻省理工学院衍生公司Liquid AI发布了一款小到可以装在智能手表上的新AI视觉模型,以及谷歌发布了一款可以在智能手机上运行的小型模型之后,英伟达也加入了这场浪潮,推出了自己的新型小型语言模型(SLM):Nemotron Nano v2。 这款9B的“小”模型在复杂推理基准测试上的准确率与Qwen3-8B相当或更高,速度快6倍。
8/19/2025 4:10:46 PM

首个3D动作游戏专用VLA模型,打黑神话&只狼超越人类玩家 | ICCV 2025

3B多模态大模型在动作角色扮演游戏的战斗任务中,成功率超越GPT-4o和人类玩家,淘天集团未来生活实验室团队提出了CombatVLA,已被ICCV 2025接收。 在复杂的三维环境中实现实时决策仍面临重大挑战,要求模型能在秒级时间尺度做出响应,具备高分辨率感知能力,并能够在动态条件下进行战术推理。 如下图所示,团队给出了CombatVLA推理得到的AoT解释、解析成Python代码的动作指令,以及执行这些动作后的帧序列。
8/19/2025 4:08:20 PM

GPT 4o-mini华人领队离开OpenAI:真正推动AI进步不是模型架构,而是互联网

刚刚,OpenAI又离职一名华人大佬。 前OpenAI研究员Kevin Lu宣布加入AI新创Thinking Machines Lab。 Kevin Lu主导了GPT-4o mini的发布,并参与o*-mini、o3等模型工作。
8/19/2025 3:58:59 PM

小模型才是 Agent 的未来?这篇立场文把话挑明了

AI圈最近什么最火? 答案里一定有AI Agent。 从能帮你预订机票、规划旅行的私人助理,到能自动编写、调试代码的程序员搭档,AI智能体的浪潮正汹涌而来。
8/19/2025 9:20:02 AM

超越RAG和DAPT!华人团队新研究引热议:即插即用、无需改变原参即可让模型化身领域专家

一个小解码器让所有模型当上领域专家! 华人团队新研究正在引起热议。 他们提出了一种比目前业界主流采用的DAPT(领域自适应预训练)和RAG(检索增强生成)更方便、且成本更低的方法。
8/19/2025 9:12:00 AM

OpenAI 开源模型被 Meta 研究员“逆改”!只动0.3%参数,gpt-oss-20B 解锁无约束基座

OpenAI在8月初发布了开放权重模型家族gpt-oss,这是公司自2019年GPT-2以来首次真正意义上的开源动作。 仅仅两周后,一位研究者就将这一模型“拆解重组”,推出了与官方版本迥异的变体。 康奈尔大学博士生、前Google Brain成员、现任Meta研究员的Jack Morris,公开了名为gpt-oss-20b-base的新版本。
8/19/2025 2:10:00 AM

AI版华尔街之狼!o3-mini靠「神之押注」狂赚9倍,DeepSeek R1最特立独行

AI能预测未来吗? 在《黑客帝国》里,先知能对Neo的未来做出预测。 以ChatGPT为代表的AI,则可以根据过去的语料来「预测下一个Token」。
8/18/2025 5:16:45 PM

GPT-5首次会推理,OpenAI联创曝AGI秘诀!超临界学习吞噬算力,2045金钱无用?

「GPT-5,是一个分水岭」。 昨天,OpenAI联创Greg Brockman在Latent Space团队的专访中对GPT-5做出了高度的评价。 这一小时的访谈,含金量极高。
8/18/2025 9:16:00 AM

奥特曼神秘晚宴讲话曝出!OpenAI的CEO或将是个AI,Chrome我也想买

你们有没有发现,GPT-5最近好像变得不太一样了? 刚刚,OpenAI宣布GPT-5即将恢复GPT-4o的「温暖」风格。 奥特曼认为模型变暖只是第一步,让用户自定义ChatGPT风格才能真正解决问题。
8/18/2025 9:10:00 AM

AI顶会反噬整个学术圈!「不发表就会死」,NeurIPS爆仓,博士年肝4.5篇大崩溃

或许你也注意到了这个现象——AI和机器学习的繁荣,已经造成了一场少有人谈论的危机。 学生和研究人员过剩,就业前景有限,整个学术体系已经不堪重负。 随着NeurIPS、ICML和CVPR等会议的投稿数量激增,同行评审流程正在崩溃。
8/18/2025 8:51:00 AM

Claude Code 史诗级更新!AI 编程进入“反向教学”模式,写到一半会停下考你:这行代码你来写

Claude code又更新了,最近claude几乎一天一更新,今天,Claude Code 和 Claude App 推出了学习模式,感觉Claude Code正在朝着万能Agent发展先说 Claude Code:现在支持用 /output-style 来定制沟通风格,Output styles允许你把 Claude Code 调整为任意类型的Agent来配合你的工作流程,同时保留它的核心能力(运行本地脚本、读写文件、维护 TODO)这次主打两种风格,专为学生和开发者提升技能而来:Explanatory(解释)——Claude 会把它的思考过程摊开说,为什么这么设计、有哪些权衡、最佳实践是什么,一边写代码一边讲门道Learning(学习)——更像结对编程的导师。 Claude 会不时暂停,把部分任务交给你来写,再给出指导与反馈,边做边学实操上,如果你想更深入理解它在做什么、为什么这么做,选 Explanatory;如果你想通过亲手编码快速进步,选 Learning,把 Claude 当成带你升级打怪的搭档就好。 更多细节可看官方文档:,对所有 Claude App 用户也有好消息:此前在 Claude for Education首发的 Learning 风格,现在全面开放。
8/15/2025 9:16:16 AM

Meta刚刚开源DINOv3,横扫60+任务,无标注封神!

今天凌晨,全球社交、科技巨头Meta开源了,最新视觉大模型DINOv3。 DINOv3的主要创新使用了自我监督学习,无需标注数据就能大幅度降低训练所需要的时间和算力资源。 并且与前一代相比,DINOv3的训练数据大12倍扩大至17亿张图像以及大7倍的70亿参数。
8/15/2025 9:07:09 AM

链式思维是幻象吗?从数据分布视角重新审视大模型推理,马斯克回复,Grok破防

思维链 (CoT) 提示技术常被认为是让大模型分步思考的关键手段,通过在输入中加入「Let’s think step by step」等提示,模型会生成类似人类的中间推理步骤,显著提升复杂任务的表现。 然而,这些流畅的推理链条是否真的反映了模型的推理能力? 亚利桑那州立大学的一项最新研究却发现,CoT 推理可能并不是真正的推理,而更像是对训练数据分布内模式的复现。
8/15/2025 9:03:24 AM

LeetCode刷够100小时,学会找人内推,OpenAI员工下场教你拿Offer

OpenAI 在 AI 领域引领了一波又一波浪潮,想必很多人好奇,这些创新背后的研究人员是如何通过面试的? 尤其是现在,OpenAI 已经成为全球最受瞩目的 AI 公司之一,吸引了无数顶尖人才投递简历。 想要加入这个团队,着实不容易。
8/15/2025 8:57:02 AM

GPT-4o替代爹味GPT-5!奥特曼光速滑跪,OpenAI连夜回滚「赛博舔狗」

GPT-5发布之后,奥特曼面临的是从未想象过的愤怒民意。 许多网友激动反抗说:GPT-5太冷漠无情,太爹味了,赶快把我的GPT-4o「男友/女友」还给我! 铺天盖地的吐槽和骂声中,奥特曼不得不连夜让GPT-4o等一众旧模型回归,不过只有Pro用户能看到,而且还需手动设置。
8/14/2025 6:20:04 PM

奥特曼爆冷改口:AGI没用?MIT预测2028年降临,50%概率

算力膨胀、模型堆叠,提示词像燃料一样被反复输入。 AI的脚步没有停下,反而越来越快。 有人预言,AGI遥遥无期,至少要等上半个世纪。
8/14/2025 6:16:24 PM

ChatGPT会让大脑退化?OpenAI高管用它救下自己「读写障碍」的女儿

ChatGPT会导致大脑退化吗? 它只是一个作弊工具吗? 加入OpenAI之前,Leah Belsky已经在教育领域工作了15年,从世界银行到Coursera,专注于「让教育惠及全球」这一使命。
8/14/2025 6:15:33 PM

大模型训练新突破!“不对称”训练让AI学会自我反思,推理零开销

首次实现“训练-推理不对称”,字节团队提出全新的语言模型训练方法:Post-Completion Learning (PCL)。 在训练时让模型对自己的输出结果进行反思和评估,推理时却仅输出答案,将反思能力完全内化。 与目前主流的训练方式相比,这一创新方法不仅实现了模型能力的显著提升,更重要的是推理时完全零额外开销。
8/14/2025 9:00:00 AM