AI
首个3D动作游戏专用VLA模型,打黑神话&只狼超越人类玩家 | ICCV 2025
3B多模态大模型在动作角色扮演游戏的战斗任务中,成功率超越GPT-4o和人类玩家,淘天集团未来生活实验室团队提出了CombatVLA,已被ICCV 2025接收。 在复杂的三维环境中实现实时决策仍面临重大挑战,要求模型能在秒级时间尺度做出响应,具备高分辨率感知能力,并能够在动态条件下进行战术推理。 如下图所示,团队给出了CombatVLA推理得到的AoT解释、解析成Python代码的动作指令,以及执行这些动作后的帧序列。
8/19/2025 4:08:20 PM
GPT-5暴写「屎山代码」!14个Prompt,看穿GPT-1到GPT-5七年智商进化史
一张基准对比图,彻底火遍了全网。 GPT-5发布近半个月,实际表现未达预期,不少人感慨:苦等OpenAI两年,就是这? 为此,Peter Gostev将GPT-4和GPT-5在数学、软件工程、问答等基准上,做了一个直观对比。
8/19/2025 4:05:27 PM
阿里亮剑Ovis2.5:90亿参数挑战巨兽,AI视觉从此不“近视”
在AI界,“参数为王”的信仰似乎坚不可摧,巨头们在千亿、万亿参数的军备竞赛中一路狂奔。 然而,阿里国际数字贸易集团(AIDC)最近却悄然扔出了一枚“深水炸弹”——Ovis2.5。 它没有夸张的参数规模,却用一种近乎“降维打击”的方式,重新定义了什么叫“经济型高性能”。
8/19/2025 10:37:59 AM
墨风如雪
4o-mini华人领队也离职了,这次不怪小扎
哦豁,OpenAI奥特曼又痛失一员大将。 Kevin Lu,领导4o-mini发布,并参与o1-mini、o3发布,主要研究强化学习、小模型和合成数据。 下一站是Thinking Machine Lab,OpenAI前CTO Mira Murati出走后新创立的AI公司,估值已达120亿美元。
8/19/2025 9:22:47 AM
小模型才是 Agent 的未来?这篇立场文把话挑明了
AI圈最近什么最火? 答案里一定有AI Agent。 从能帮你预订机票、规划旅行的私人助理,到能自动编写、调试代码的程序员搭档,AI智能体的浪潮正汹涌而来。
8/19/2025 9:20:02 AM
AI来了!记者、UP主、写手,谁能逃过这场「灭绝浪潮」?
AI正在重新定义信息获取的入口和方式。 同时,原生AI新闻产品带来的用户体验与传统新闻截然不同。 一项研究显示,AI已经在世界各地的新闻编辑室中崭露头角。
8/19/2025 9:15:00 AM
超越RAG和DAPT!华人团队新研究引热议:即插即用、无需改变原参即可让模型化身领域专家
一个小解码器让所有模型当上领域专家! 华人团队新研究正在引起热议。 他们提出了一种比目前业界主流采用的DAPT(领域自适应预训练)和RAG(检索增强生成)更方便、且成本更低的方法。
8/19/2025 9:12:00 AM
当AI提升绩效却打击积极性时,CIO们能做什么
过去几年间,许多科技从业者已将部分思考工作外包给AI。 ChatGPT、Copilot等工具已司空见惯,帮助人类调试代码、起草报告或头脑风暴,工作效率大幅提升,但与此同时,另一种现象也在悄然发生:许多科技从业者在学习过程中投入减少,批判性思维减弱,与工作产生疏离感。 AI或许提升了工作表现,却常常削弱了工作动力。
8/19/2025 7:15:11 AM
Andrada
被AI接管后,ERP系统还将剩下哪些部分?
观察人士表示,智能体和智能助手已开始改变员工与ERP系统的交互方式,减少了为充分发挥软件效能而需进行的许多重复性任务。 近年来,IT分析公司Forrester等专家预测,ERP系统已具备由AI驱动进行全面革新的条件,且这场变革已然拉开序幕。 咨询公司Columbus的高级AI业务顾问Christopher Combs表示,AI正助力部分企业将与ERP相关的手工劳动减少高达20%。
8/19/2025 7:00:00 AM
Grant
Z世代生存、学习与未来宣言!伯克利学霸预言课堂,用AI设计人生
本期OpenAI播客,受访小姐姐Yabi来自USC,男生就读于加州大学伯克利分校EECS。 图片Yabi第一次用ChatGPT,是一个很搞笑的场景。 当时,她给它的第一个指令是让它写一篇同人小说(fan fiction)。
8/19/2025 2:00:00 AM
新智元
一句话,性能暴涨49%!马里兰MIT等力作:Prompt才是大模型终极武器
AI性能的提升,一半靠模型,一半靠提示词。 最近,来自马里兰大学、MIT、斯坦福等机构联手验证,模型升级带来的性能提升仅占50%,而另外一半的提升,在于用户提示词的优化。 他们将其称之为「提示词适应」(prompt adaptation)。
8/18/2025 5:20:17 PM
Hinton预言「AI妈妈」刷屏硅谷!李飞飞:人类或将毫无尊严
人类需要一个「AI母亲」吗? 在Ai4 2025大会上,Hinton警告说:AGI时代的到来可能只需要几年,留给人类做好准备的时间已经不多了,试图维持人类对AI的控制终将是徒劳。 在人类与AI的控制权之争上,Hinton并没有提到人类要如何防止自己被AI超越;相反,这位「AI教父」却抛出了一个有趣的视角:在AI中建立「母性本能」,让它可以真正「关心人类」。
8/18/2025 5:17:56 PM
AI版华尔街之狼!o3-mini靠「神之押注」狂赚9倍,DeepSeek R1最特立独行
AI能预测未来吗? 在《黑客帝国》里,先知能对Neo的未来做出预测。 以ChatGPT为代表的AI,则可以根据过去的语料来「预测下一个Token」。
8/18/2025 5:16:45 PM
全球最古老程序员赛事回归!晦涩C代码大战AI!750字节手搓一个推理引擎,评委:被瑞克滚了!人类比AI厉害,程序员的快乐回来了!
编辑 | 云昭出品 | 51CTO技术栈(微信号:blog51cto)就在不久前,让攻城狮们高呼“久违的程序员文化回来了”的一项赛事,重磅回归了! 时隔四年,让全球无数程序员调侃取乐的最古老、最有趣的比赛——IOCCC,国际混乱 C 代码大赛,回归到大众视野。 这场比赛已经有 40 年之久的创办历史,它的趣味自带“嗨皮”属性:鼓励程序员用 C 语言写出故意难以理解的代码,并以此取乐。
8/18/2025 12:51:53 PM
云昭
超58000星!精选AI Agent、MCP开源大合集,Github每日第一
相信有不少小伙伴正在学习AI Agent、MCP、RAG的开发和商业用例吧。 虽然Github、Hugging Face有海量开源项目,但想找出经典又实用的并不容易。 所以,「AIGC开放社区」就为大家介绍一个精选的开源大合集,包括入门级AI Agent、高级Agent、多层级智能体、语音智能体、多类型RAG等非常好用的项目。
8/18/2025 9:23:09 AM
OpenAI突然"背叛"自己:推理与创作分家,万能AI时代终结?
83.3%对比13%——这不是什么投票结果,而是OpenAI两类模型在高级数学问题上的表现差距。 更震撼的是,表现更好的那个模型,在创意写作方面反而输给了"落后"的那个。 我花了一下午时间深挖OpenAI的最新技术文档,发现了一个颠覆认知的事实:OpenAI已经悄悄放弃了"万能AI"的路线,转向了一个更精妙的策略——让不同的模型专做不同的事。
8/18/2025 9:17:54 AM
阿丸笔记
GPT-5首次会推理,OpenAI联创曝AGI秘诀!超临界学习吞噬算力,2045金钱无用?
「GPT-5,是一个分水岭」。 昨天,OpenAI联创Greg Brockman在Latent Space团队的专访中对GPT-5做出了高度的评价。 这一小时的访谈,含金量极高。
8/18/2025 9:16:00 AM
硬核拆解!从GPT-2到gpt-oss,揭秘大模型进化关键密码
8月5日,在GPT-5发布前两天,OpenAI推出了它的两款开源权重大语言模型:gpt-oss-120b、gpt-oss-20b。 这是自2019年GPT-2,近六年来OpenAI首次发布开放权重的模型。 得益于巧妙的优化技术,这些模型甚至可以在本地设备上运行。
8/18/2025 9:15:00 AM
资讯热榜
标签云
AI
人工智能
OpenAI
AIGC
模型
ChatGPT
DeepSeek
AI绘画
谷歌
机器人
数据
大模型
Midjourney
开源
智能
用户
Meta
微软
GPT
学习
技术
图像
Gemini
马斯克
AI创作
智能体
英伟达
Anthropic
论文
代码
AI新词
训练
算法
Stable Diffusion
芯片
LLM
蛋白质
开发者
腾讯
Claude
苹果
生成式
AI for Science
Agent
神经网络
3D
机器学习
研究
xAI
生成
人形机器人
AI视频
计算
百度
Sora
GPU
AI设计
华为
工具
大语言模型
RAG
搜索
具身智能
字节跳动
大型语言模型
场景
深度学习
预测
视频生成
伟达
视觉
Transformer
AGI
架构
亚马逊
神器推荐
Copilot
DeepMind
特斯拉
应用