理论
马斯克杀向游戏行业:挖来 NVIDIA 两员大将,xAI 要造“世界模型”
埃隆·马斯克创立、以 “TruthGPT” 为起点的公司xAI,正在将重心从语言理解转向一个更底层的目标:世界模型(World Model)。 图片这一消息由 《金融时报》(Financial Times)在 2025 年 10 月 11 日率先披露。 报道指出,xAI 正在开发“可用于电子游戏与机器人领域的世界模型”,并从 NVIDIA 招募了两位研究员 Zeeshan Patel 与 Ethan He 参与其中。
10/13/2025 10:01:15 AM
谷歌Gemini 3.0「全家桶」年度压轴,前端不再需要人类!下周王者降临
Sora 2之后,全网都在等待下一个G点的到来! 本月AI大事纪,当属谷歌DeepMind下一代旗舰模型Gemini 3.0「全家桶」的登场。 传闻称,预计10月22日,Gemini 3.0就要出世了!
10/13/2025 9:59:06 AM
新智元
AI成本超支问题日益严重——这对CIO影响重大
根据一项最新调查,IT部门和财务部门领导者在估算和控制AI部署成本方面面临挑战,多数AI项目超出预算目标。 尽管企业广泛采用AI技术,但许多IT部门领导者发现难以实现AI项目的投资回报率,预算不准确是问题的关键所在。 SaaS基准测试公司Benchmarkit和成本治理平台Mavvrik近期的一项调查显示,约85%的机构对AI成本的估算误差超过10%,近25%的机构误差达到50%或以上。
10/13/2025 9:46:45 AM
Grant
“AI版LeCun”自己讲解论文,自我进化智能体框架生成精美演讲视频
AI自己讲明白论文,还能生成更美观的幻灯片。 加州大学圣塔芭芭拉(UCSB)与圣克鲁兹(UCSC)的研究者提出EvoPresent,一个能够自我进化的学术演讲智能体框架,让AI不仅能“讲清楚论文”,还能“讲得好看”。 从逻辑到审美:科研演讲自动化的瓶颈尽管已有很多系统能将论文自动转化为幻灯片或海报,但它们仍存在三大局限:叙事单一、设计僵化、缺乏反馈。
10/13/2025 9:46:12 AM
马斯克从英伟达挖人做AI游戏!第一步:研发世界模型
马斯克的xAI也入局世界模型了! 想必听到这个消息的Meta、Google DeepMind一定会缓缓打出一个问号:冲我们来的? 据《金融时报》(FT)报道,为了增加这场“世界模型大混战”的赢面,今年夏天,xAI已经从英伟达挖来了多名资深研究员来助阵。
10/13/2025 9:37:58 AM
Open Library 任务为何难倒 GPT-5?SWE-Bench Pro 揭示 AI 编程智能体的真实边界
大家好,我是肆〇柒。 今天要与大家分享的是一项由 Scale AI 研究团队最新发布的重磅研究成果——SWE-Bench Pro。 这项研究增强了我们对 AI 编程智能体能力的认知,它不再满足于测试模型能否完成简单的代码修改,而是直面真实企业环境中那些需要修改数百行代码、跨越多个文件的复杂任务。
10/13/2025 9:33:19 AM
肆零柒
让推荐系统听懂你:自然语言命令如何打破“猜你喜欢”的困局
大家好,我是肆〇柒。 你的女友是否曾对着满屏“短裙”无奈点击“不喜欢”,却无法告诉系统“我想要一条适合秋天的长裙”? 这种推荐系统的“失语症”,正是阿里巴巴集团联合中国人民大学、中国科学院大学最新研究《Interactive Recommendation Agent with Active User Commands》试图解决的核心问题。
10/13/2025 9:18:11 AM
肆零柒
永别了,人类冠军!AI横扫天文奥赛,GPT-5得分远超金牌选手2.7倍
IMO、IOI之后,AI再夺奥赛冠军。 刚刚,在国际天文与天体物理奥林匹克竞赛测试中,GPT-5和Gemini 2.5 Pro达到金牌水平! 在理论考试上,Gemini 2.5 Pro总体得分85.6%,GPT-5总体得分84.2%;在数据分析考试中:GPT-5总体得分88.5%,Gemini 2.5 Pro总体得分75.7%。
10/13/2025 9:13:00 AM
Bug变奖励:AI的小失误,揭开创造力真相!
你一定见过那些奇怪的AI画:人物手上多出几根手指、脸部细节怪异,却又带着某种说不出的新鲜感。 这让人产生一个疑问:扩散模型明明只「复刻」,为什么还能画出前所未见的作品? 最新一项研究给出了答案:其实,AI的创造力并非「神来之笔」,而是模型架构的副作用。
10/13/2025 9:12:00 AM
告别「解码器饥饿」!中国科学院NeurIPS推SpaceServe,高并发克星
核心突破:首次将LLM推理中的P/D分离思想扩展至多模态场景,提出EPD(Encoder-Prefill-Decode)三阶段解耦,并通过「空分复用」彻底解决编码器引发的行头阻塞问题。 随着多模态大语言模型(MLLM)广泛应用于高分辨率图像理解、长视频分析等场景,其推理流程中的多模态编码(Encoding)阶段正成为性能瓶颈。 当前主流系统(如vLLM)在服务MLLM时,仍沿用「时间复用」(time-multiplexing)策略:GPU先执行视觉/音频编码器,完成后才切换上下文运行文本解码器。
10/13/2025 9:10:00 AM
实测“清华特奖版Sora”:一图一prompt直接生成视频,堪称嘴强王者
那边OpenAI的Sora2还没全面开放,这边国内团队已经上线了自己的“特色打法”。 清华特奖选手创办的Sand.ai,上线了音画同步视频模型GAGA-1。 你可以把它理解为:一个专门练“嘴功”和“表演感”的视频生成模型:怎么样,奥特曼看了这视频都得说一句:好家伙!
10/13/2025 9:02:00 AM
拒绝小扎15亿美元offer的大佬,还是加入Meta了
那个拒绝了小扎15亿美元薪酬包的机器学习大神,还是加入Meta了。 OpenAI前CTO Mira Murati创业公司Thinking Machines Lab证实,联创、首席架构师Andrew Tulloch已经离职去了Meta。 按照公司发言人的说法,Tulloch离职的理由是“出于个人原因决定走一条不同的道路”,其本人则未给出回应。
10/13/2025 9:00:00 AM
破解AI唇语同步密码:SyncNet论文核心原理解析
译者 | 朱先忠审校 | 重楼简介你有没有看过配音糟糕的电影,嘴唇动作和台词不同步? 或者在视频通话中,对方的嘴型和声音不同步? 这些同步问题不仅仅是烦人,而是视频制作、广播和实时通信中一个真正的问题。
10/13/2025 9:00:00 AM
朱先忠
为何上下文成为人工智能领域的“新贵”:从 RAG 到上下文工程
译者 | 晶颜审校 | 重楼三个月前,我们的生产系统遭遇了一次严重故障,其根源并非代码缺陷或基础设施故障,而是源于对人工智能系统优化目标的根本性误解。 此前,我们搭建了一套自认为具备先进水平的文档分析流程,整合了检索增强生成(RAG)、向量嵌入、语义搜索及精细调优的重排序功能。 在演示场景中,该系统能够精准且富有说服力地回答关于客户监管文件的各类问题,但投入实际运行后,却频繁出现回答与上下文完全脱节的问题。
10/13/2025 8:00:00 AM
混元开源之力:Spring-Ai-hunyuan 项目功能升级与实战体验
今天咱们继续聊聊 spring-ai-hunyuan 这个项目。 上次我们兼容了 spring-ai 的 1.0.0 正式版本之后,就暂时放了一阵子,没怎么动。 最近倒是收到不少小伙伴反馈,说混元的思考链功能为什么不返回结果。
10/13/2025 7:27:37 AM
灵墨AI探索室
Hinton暴论:AI已经有意识,它自己不知道而已
在最新一期播客节目中,Hinton抛出的这一观点正迅速掀起热议。 老爷子一再表示,AI也许已经有了“意识雏形”,只是因为我们人类自己对意识理解错了,所以它也被教错了——不知道自己有意识。 翻译成大白话就是,AI其实有自我意识,只是暂未觉醒┌(。
10/13/2025 5:00:00 AM
量子位
别只会用 ChatGPT!前端 + AI,你必须要会这些!
Hello,大家好,我是 Sunday。 最近很多同学特别关注 AI 相关的领域。 c但是,AI 技术发展太快了,AIGC、RAG、Agent、Function Call、MCP 等等的各种热词层出不穷的。
10/13/2025 2:00:00 AM
程序员Sunday
快手KAT-Dev-72B-Exp震撼发布!74.6%解决率碾压GPT-5,编程Agent新王者
你有没有想过,什么时候一个国产开源模型能在编程领域真正"碾压"GPT-5? 这个问题的答案,快手给出了。 昨天看到快手开源KAT-Dev-72B-Exp的消息时,我第一反应是——这数据是不是搞错了?
10/13/2025 12:00:05 AM
阿丸笔记
资讯热榜
标签云
AI
人工智能
OpenAI
AIGC
模型
ChatGPT
谷歌
DeepSeek
AI绘画
大模型
机器人
数据
AI新词
Midjourney
开源
Meta
微软
智能
用户
GPT
学习
智能体
技术
Gemini
马斯克
英伟达
Anthropic
图像
AI创作
训练
LLM
论文
代码
算法
苹果
AI for Science
Agent
Claude
腾讯
芯片
Stable Diffusion
蛋白质
具身智能
开发者
xAI
生成式
神经网络
机器学习
人形机器人
3D
AI视频
RAG
大语言模型
Sora
研究
百度
生成
GPU
工具
华为
字节跳动
计算
AGI
大型语言模型
AI设计
搜索
生成式AI
视频生成
DeepMind
AI模型
特斯拉
场景
深度学习
亚马逊
架构
Transformer
MCP
Copilot
编程
视觉