AI在线 AI在线

AI

首个3D动作游戏专用VLA模型,打黑神话&只狼超越人类玩家 | ICCV 2025

3B多模态大模型在动作角色扮演游戏的战斗任务中,成功率超越GPT-4o和人类玩家,淘天集团未来生活实验室团队提出了CombatVLA,已被ICCV 2025接收。 在复杂的三维环境中实现实时决策仍面临重大挑战,要求模型能在秒级时间尺度做出响应,具备高分辨率感知能力,并能够在动态条件下进行战术推理。 如下图所示,团队给出了CombatVLA推理得到的AoT解释、解析成Python代码的动作指令,以及执行这些动作后的帧序列。
8/19/2025 4:08:20 PM

GPT-5暴写「屎山代码」!14个Prompt,看穿GPT-1到GPT-5七年智商进化史

一张基准对比图,彻底火遍了全网。 GPT-5发布近半个月,实际表现未达预期,不少人感慨:苦等OpenAI两年,就是这? 为此,Peter Gostev将GPT-4和GPT-5在数学、软件工程、问答等基准上,做了一个直观对比。
8/19/2025 4:05:27 PM

阿里亮剑Ovis2.5:90亿参数挑战巨兽,AI视觉从此不“近视”

在AI界,“参数为王”的信仰似乎坚不可摧,巨头们在千亿、万亿参数的军备竞赛中一路狂奔。 然而,阿里国际数字贸易集团(AIDC)最近却悄然扔出了一枚“深水炸弹”——Ovis2.5。 它没有夸张的参数规模,却用一种近乎“降维打击”的方式,重新定义了什么叫“经济型高性能”。
8/19/2025 10:37:59 AM
墨风如雪

4o-mini华人领队也离职了,这次不怪小扎

哦豁,OpenAI奥特曼又痛失一员大将。 Kevin Lu,领导4o-mini发布,并参与o1-mini、o3发布,主要研究强化学习、小模型和合成数据。 下一站是Thinking Machine Lab,OpenAI前CTO Mira Murati出走后新创立的AI公司,估值已达120亿美元。
8/19/2025 9:22:47 AM

小模型才是 Agent 的未来?这篇立场文把话挑明了

AI圈最近什么最火? 答案里一定有AI Agent。 从能帮你预订机票、规划旅行的私人助理,到能自动编写、调试代码的程序员搭档,AI智能体的浪潮正汹涌而来。
8/19/2025 9:20:02 AM

AI来了!记者、UP主、写手,谁能逃过这场「灭绝浪潮」?

AI正在重新定义信息获取的入口和方式。 同时,原生AI新闻产品带来的用户体验与传统新闻截然不同。 一项研究显示,AI已经在世界各地的新闻编辑室中崭露头角。
8/19/2025 9:15:00 AM

超越RAG和DAPT!华人团队新研究引热议:即插即用、无需改变原参即可让模型化身领域专家

一个小解码器让所有模型当上领域专家! 华人团队新研究正在引起热议。 他们提出了一种比目前业界主流采用的DAPT(领域自适应预训练)和RAG(检索增强生成)更方便、且成本更低的方法。
8/19/2025 9:12:00 AM

当AI提升绩效却打击积极性时,CIO们能做什么

过去几年间,许多科技从业者已将部分思考工作外包给AI。 ChatGPT、Copilot等工具已司空见惯,帮助人类调试代码、起草报告或头脑风暴,工作效率大幅提升,但与此同时,另一种现象也在悄然发生:许多科技从业者在学习过程中投入减少,批判性思维减弱,与工作产生疏离感。 AI或许提升了工作表现,却常常削弱了工作动力。
8/19/2025 7:15:11 AM
Andrada

被AI接管后,ERP系统还将剩下哪些部分?

观察人士表示,智能体和智能助手已开始改变员工与ERP系统的交互方式,减少了为充分发挥软件效能而需进行的许多重复性任务。 近年来,IT分析公司Forrester等专家预测,ERP系统已具备由AI驱动进行全面革新的条件,且这场变革已然拉开序幕。 咨询公司Columbus的高级AI业务顾问Christopher Combs表示,AI正助力部分企业将与ERP相关的手工劳动减少高达20%。
8/19/2025 7:00:00 AM
Grant

Z世代生存、学习与未来宣言!伯克利学霸预言课堂,用AI设计人生

本期OpenAI播客,受访小姐姐Yabi来自USC,男生就读于加州大学伯克利分校EECS。 图片Yabi第一次用ChatGPT,是一个很搞笑的场景。 当时,她给它的第一个指令是让它写一篇同人小说(fan fiction)。
8/19/2025 2:00:00 AM
新智元

一句话,性能暴涨49%!马里兰MIT等力作:Prompt才是大模型终极武器

AI性能的提升,一半靠模型,一半靠提示词。 最近,来自马里兰大学、MIT、斯坦福等机构联手验证,模型升级带来的性能提升仅占50%,而另外一半的提升,在于用户提示词的优化。 他们将其称之为「提示词适应」(prompt adaptation)。
8/18/2025 5:20:17 PM

Hinton预言「AI妈妈」刷屏硅谷!李飞飞:人类或将毫无尊严

人类需要一个「AI母亲」吗? 在Ai4 2025大会上,Hinton警告说:AGI时代的到来可能只需要几年,留给人类做好准备的时间已经不多了,试图维持人类对AI的控制终将是徒劳。 在人类与AI的控制权之争上,Hinton并没有提到人类要如何防止自己被AI超越;相反,这位「AI教父」却抛出了一个有趣的视角:在AI中建立「母性本能」,让它可以真正「关心人类」。
8/18/2025 5:17:56 PM

AI版华尔街之狼!o3-mini靠「神之押注」狂赚9倍,DeepSeek R1最特立独行

AI能预测未来吗? 在《黑客帝国》里,先知能对Neo的未来做出预测。 以ChatGPT为代表的AI,则可以根据过去的语料来「预测下一个Token」。
8/18/2025 5:16:45 PM

全球最古老程序员赛事回归!晦涩C代码大战AI!750字节手搓一个推理引擎,评委:被瑞克滚了!人类比AI厉害,程序员的快乐回来了!

编辑 | 云昭出品 | 51CTO技术栈(微信号:blog51cto)就在不久前,让攻城狮们高呼“久违的程序员文化回来了”的一项赛事,重磅回归了! 时隔四年,让全球无数程序员调侃取乐的最古老、最有趣的比赛——IOCCC,国际混乱 C 代码大赛,回归到大众视野。 这场比赛已经有 40 年之久的创办历史,它的趣味自带“嗨皮”属性:鼓励程序员用 C 语言写出故意难以理解的代码,并以此取乐。
8/18/2025 12:51:53 PM
云昭

超58000星!精选AI Agent、MCP开源大合集,Github每日第一

相信有不少小伙伴正在学习AI Agent、MCP、RAG的开发和商业用例吧。 虽然Github、Hugging Face有海量开源项目,但想找出经典又实用的并不容易。 所以,「AIGC开放社区」就为大家介绍一个精选的开源大合集,包括入门级AI Agent、高级Agent、多层级智能体、语音智能体、多类型RAG等非常好用的项目。
8/18/2025 9:23:09 AM

OpenAI突然"背叛"自己:推理与创作分家,万能AI时代终结?

83.3%对比13%——这不是什么投票结果,而是OpenAI两类模型在高级数学问题上的表现差距。 更震撼的是,表现更好的那个模型,在创意写作方面反而输给了"落后"的那个。 我花了一下午时间深挖OpenAI的最新技术文档,发现了一个颠覆认知的事实:OpenAI已经悄悄放弃了"万能AI"的路线,转向了一个更精妙的策略——让不同的模型专做不同的事。
8/18/2025 9:17:54 AM
阿丸笔记

GPT-5首次会推理,OpenAI联创曝AGI秘诀!超临界学习吞噬算力,2045金钱无用?

「GPT-5,是一个分水岭」。 昨天,OpenAI联创Greg Brockman在Latent Space团队的专访中对GPT-5做出了高度的评价。 这一小时的访谈,含金量极高。
8/18/2025 9:16:00 AM

硬核拆解!从GPT-2到gpt-oss,揭秘大模型进化关键密码

8月5日,在GPT-5发布前两天,OpenAI推出了它的两款开源权重大语言模型:gpt-oss-120b、gpt-oss-20b。 这是自2019年GPT-2,近六年来OpenAI首次发布开放权重的模型。 得益于巧妙的优化技术,这些模型甚至可以在本地设备上运行。
8/18/2025 9:15:00 AM