模型
英伟达开源9B参数小模型,比Qwen3快6倍
小模型也开始卷起来了! 在麻省理工学院衍生公司Liquid AI发布了一款小到可以装在智能手表上的新AI视觉模型,以及谷歌发布了一款可以在智能手机上运行的小型模型之后,英伟达也加入了这场浪潮,推出了自己的新型小型语言模型(SLM):Nemotron Nano v2。 这款9B的“小”模型在复杂推理基准测试上的准确率与Qwen3-8B相当或更高,速度快6倍。
8/19/2025 4:10:46 PM
首个3D动作游戏专用VLA模型,打黑神话&只狼超越人类玩家 | ICCV 2025
3B多模态大模型在动作角色扮演游戏的战斗任务中,成功率超越GPT-4o和人类玩家,淘天集团未来生活实验室团队提出了CombatVLA,已被ICCV 2025接收。 在复杂的三维环境中实现实时决策仍面临重大挑战,要求模型能在秒级时间尺度做出响应,具备高分辨率感知能力,并能够在动态条件下进行战术推理。 如下图所示,团队给出了CombatVLA推理得到的AoT解释、解析成Python代码的动作指令,以及执行这些动作后的帧序列。
8/19/2025 4:08:20 PM
GPT 4o-mini华人领队离开OpenAI:真正推动AI进步不是模型架构,而是互联网
刚刚,OpenAI又离职一名华人大佬。 前OpenAI研究员Kevin Lu宣布加入AI新创Thinking Machines Lab。 Kevin Lu主导了GPT-4o mini的发布,并参与o*-mini、o3等模型工作。
8/19/2025 3:58:59 PM
小模型才是 Agent 的未来?这篇立场文把话挑明了
AI圈最近什么最火? 答案里一定有AI Agent。 从能帮你预订机票、规划旅行的私人助理,到能自动编写、调试代码的程序员搭档,AI智能体的浪潮正汹涌而来。
8/19/2025 9:20:02 AM
超越RAG和DAPT!华人团队新研究引热议:即插即用、无需改变原参即可让模型化身领域专家
一个小解码器让所有模型当上领域专家! 华人团队新研究正在引起热议。 他们提出了一种比目前业界主流采用的DAPT(领域自适应预训练)和RAG(检索增强生成)更方便、且成本更低的方法。
8/19/2025 9:12:00 AM
OpenAI 开源模型被 Meta 研究员“逆改”!只动0.3%参数,gpt-oss-20B 解锁无约束基座
OpenAI在8月初发布了开放权重模型家族gpt-oss,这是公司自2019年GPT-2以来首次真正意义上的开源动作。 仅仅两周后,一位研究者就将这一模型“拆解重组”,推出了与官方版本迥异的变体。 康奈尔大学博士生、前Google Brain成员、现任Meta研究员的Jack Morris,公开了名为gpt-oss-20b-base的新版本。
8/19/2025 2:10:00 AM
AI版华尔街之狼!o3-mini靠「神之押注」狂赚9倍,DeepSeek R1最特立独行
AI能预测未来吗? 在《黑客帝国》里,先知能对Neo的未来做出预测。 以ChatGPT为代表的AI,则可以根据过去的语料来「预测下一个Token」。
8/18/2025 5:16:45 PM
GPT-5首次会推理,OpenAI联创曝AGI秘诀!超临界学习吞噬算力,2045金钱无用?
「GPT-5,是一个分水岭」。 昨天,OpenAI联创Greg Brockman在Latent Space团队的专访中对GPT-5做出了高度的评价。 这一小时的访谈,含金量极高。
8/18/2025 9:16:00 AM
奥特曼神秘晚宴讲话曝出!OpenAI的CEO或将是个AI,Chrome我也想买
你们有没有发现,GPT-5最近好像变得不太一样了? 刚刚,OpenAI宣布GPT-5即将恢复GPT-4o的「温暖」风格。 奥特曼认为模型变暖只是第一步,让用户自定义ChatGPT风格才能真正解决问题。
8/18/2025 9:10:00 AM
AI顶会反噬整个学术圈!「不发表就会死」,NeurIPS爆仓,博士年肝4.5篇大崩溃
或许你也注意到了这个现象——AI和机器学习的繁荣,已经造成了一场少有人谈论的危机。 学生和研究人员过剩,就业前景有限,整个学术体系已经不堪重负。 随着NeurIPS、ICML和CVPR等会议的投稿数量激增,同行评审流程正在崩溃。
8/18/2025 8:51:00 AM
Claude Code 史诗级更新!AI 编程进入“反向教学”模式,写到一半会停下考你:这行代码你来写
Claude code又更新了,最近claude几乎一天一更新,今天,Claude Code 和 Claude App 推出了学习模式,感觉Claude Code正在朝着万能Agent发展先说 Claude Code:现在支持用 /output-style 来定制沟通风格,Output styles允许你把 Claude Code 调整为任意类型的Agent来配合你的工作流程,同时保留它的核心能力(运行本地脚本、读写文件、维护 TODO)这次主打两种风格,专为学生和开发者提升技能而来:Explanatory(解释)——Claude 会把它的思考过程摊开说,为什么这么设计、有哪些权衡、最佳实践是什么,一边写代码一边讲门道Learning(学习)——更像结对编程的导师。 Claude 会不时暂停,把部分任务交给你来写,再给出指导与反馈,边做边学实操上,如果你想更深入理解它在做什么、为什么这么做,选 Explanatory;如果你想通过亲手编码快速进步,选 Learning,把 Claude 当成带你升级打怪的搭档就好。 更多细节可看官方文档:,对所有 Claude App 用户也有好消息:此前在 Claude for Education首发的 Learning 风格,现在全面开放。
8/15/2025 9:16:16 AM
Meta刚刚开源DINOv3,横扫60+任务,无标注封神!
今天凌晨,全球社交、科技巨头Meta开源了,最新视觉大模型DINOv3。 DINOv3的主要创新使用了自我监督学习,无需标注数据就能大幅度降低训练所需要的时间和算力资源。 并且与前一代相比,DINOv3的训练数据大12倍扩大至17亿张图像以及大7倍的70亿参数。
8/15/2025 9:07:09 AM
链式思维是幻象吗?从数据分布视角重新审视大模型推理,马斯克回复,Grok破防
思维链 (CoT) 提示技术常被认为是让大模型分步思考的关键手段,通过在输入中加入「Let’s think step by step」等提示,模型会生成类似人类的中间推理步骤,显著提升复杂任务的表现。 然而,这些流畅的推理链条是否真的反映了模型的推理能力? 亚利桑那州立大学的一项最新研究却发现,CoT 推理可能并不是真正的推理,而更像是对训练数据分布内模式的复现。
8/15/2025 9:03:24 AM
LeetCode刷够100小时,学会找人内推,OpenAI员工下场教你拿Offer
OpenAI 在 AI 领域引领了一波又一波浪潮,想必很多人好奇,这些创新背后的研究人员是如何通过面试的? 尤其是现在,OpenAI 已经成为全球最受瞩目的 AI 公司之一,吸引了无数顶尖人才投递简历。 想要加入这个团队,着实不容易。
8/15/2025 8:57:02 AM
GPT-4o替代爹味GPT-5!奥特曼光速滑跪,OpenAI连夜回滚「赛博舔狗」
GPT-5发布之后,奥特曼面临的是从未想象过的愤怒民意。 许多网友激动反抗说:GPT-5太冷漠无情,太爹味了,赶快把我的GPT-4o「男友/女友」还给我! 铺天盖地的吐槽和骂声中,奥特曼不得不连夜让GPT-4o等一众旧模型回归,不过只有Pro用户能看到,而且还需手动设置。
8/14/2025 6:20:04 PM
奥特曼爆冷改口:AGI没用?MIT预测2028年降临,50%概率
算力膨胀、模型堆叠,提示词像燃料一样被反复输入。 AI的脚步没有停下,反而越来越快。 有人预言,AGI遥遥无期,至少要等上半个世纪。
8/14/2025 6:16:24 PM
ChatGPT会让大脑退化?OpenAI高管用它救下自己「读写障碍」的女儿
ChatGPT会导致大脑退化吗? 它只是一个作弊工具吗? 加入OpenAI之前,Leah Belsky已经在教育领域工作了15年,从世界银行到Coursera,专注于「让教育惠及全球」这一使命。
8/14/2025 6:15:33 PM
大模型训练新突破!“不对称”训练让AI学会自我反思,推理零开销
首次实现“训练-推理不对称”,字节团队提出全新的语言模型训练方法:Post-Completion Learning (PCL)。 在训练时让模型对自己的输出结果进行反思和评估,推理时却仅输出答案,将反思能力完全内化。 与目前主流的训练方式相比,这一创新方法不仅实现了模型能力的显著提升,更重要的是推理时完全零额外开销。
8/14/2025 9:00:00 AM
资讯热榜
标签云
AI
人工智能
OpenAI
AIGC
模型
ChatGPT
DeepSeek
AI绘画
谷歌
机器人
数据
大模型
Midjourney
开源
智能
用户
Meta
微软
GPT
学习
技术
图像
Gemini
马斯克
AI创作
智能体
论文
英伟达
Anthropic
代码
训练
算法
Stable Diffusion
芯片
蛋白质
开发者
LLM
腾讯
生成式
Claude
苹果
AI新词
Agent
神经网络
AI for Science
3D
机器学习
研究
生成
xAI
人形机器人
AI视频
计算
Sora
GPU
AI设计
百度
华为
工具
大语言模型
搜索
具身智能
场景
RAG
字节跳动
大型语言模型
深度学习
预测
伟达
视觉
Transformer
视频生成
AGI
架构
神器推荐
亚马逊
Copilot
DeepMind
应用
安全