AI在线 AI在线

资讯列表

AI成本超支问题日益严重——这对CIO影响重大

根据一项最新调查,IT部门和财务部门领导者在估算和控制AI部署成本方面面临挑战,多数AI项目超出预算目标。 尽管企业广泛采用AI技术,但许多IT部门领导者发现难以实现AI项目的投资回报率,预算不准确是问题的关键所在。 SaaS基准测试公司Benchmarkit和成本治理平台Mavvrik近期的一项调查显示,约85%的机构对AI成本的估算误差超过10%,近25%的机构误差达到50%或以上。
10/13/2025 9:46:45 AM
Grant

“AI版LeCun”自己讲解论文,自我进化智能体框架生成精美演讲视频

AI自己讲明白论文,还能生成更美观的幻灯片。 加州大学圣塔芭芭拉(UCSB)与圣克鲁兹(UCSC)的研究者提出EvoPresent,一个能够自我进化的学术演讲智能体框架,让AI不仅能“讲清楚论文”,还能“讲得好看”。 从逻辑到审美:科研演讲自动化的瓶颈尽管已有很多系统能将论文自动转化为幻灯片或海报,但它们仍存在三大局限:叙事单一、设计僵化、缺乏反馈。
10/13/2025 9:46:12 AM

马斯克从英伟达挖人做AI游戏!第一步:研发世界模型

马斯克的xAI也入局世界模型了! 想必听到这个消息的Meta、Google DeepMind一定会缓缓打出一个问号:冲我们来的? 据《金融时报》(FT)报道,为了增加这场“世界模型大混战”的赢面,今年夏天,xAI已经从英伟达挖来了多名资深研究员来助阵。
10/13/2025 9:37:58 AM

Open Library 任务为何难倒 GPT-5?SWE-Bench Pro 揭示 AI 编程智能体的真实边界

大家好,我是肆〇柒。 今天要与大家分享的是一项由 Scale AI 研究团队最新发布的重磅研究成果——SWE-Bench Pro。 这项研究增强了我们对 AI 编程智能体能力的认知,它不再满足于测试模型能否完成简单的代码修改,而是直面真实企业环境中那些需要修改数百行代码、跨越多个文件的复杂任务。
10/13/2025 9:33:19 AM
肆零柒

让推荐系统听懂你:自然语言命令如何打破“猜你喜欢”的困局

大家好,我是肆〇柒。 你的女友是否曾对着满屏“短裙”无奈点击“不喜欢”,却无法告诉系统“我想要一条适合秋天的长裙”? 这种推荐系统的“失语症”,正是阿里巴巴集团联合中国人民大学、中国科学院大学最新研究《Interactive Recommendation Agent with Active User Commands》试图解决的核心问题。
10/13/2025 9:18:11 AM
肆零柒

永别了,人类冠军!AI横扫天文奥赛,GPT-5得分远超金牌选手2.7倍

IMO、IOI之后,AI再夺奥赛冠军。 刚刚,在国际天文与天体物理奥林匹克竞赛测试中,GPT-5和Gemini 2.5 Pro达到金牌水平! 在理论考试上,Gemini 2.5 Pro总体得分85.6%,GPT-5总体得分84.2%;在数据分析考试中:GPT-5总体得分88.5%,Gemini 2.5 Pro总体得分75.7%。
10/13/2025 9:13:00 AM

Bug变奖励:AI的小失误,揭开创造力真相!

你一定见过那些奇怪的AI画:人物手上多出几根手指、脸部细节怪异,却又带着某种说不出的新鲜感。 这让人产生一个疑问:扩散模型明明只「复刻」,为什么还能画出前所未见的作品? 最新一项研究给出了答案:其实,AI的创造力并非「神来之笔」,而是模型架构的副作用。
10/13/2025 9:12:00 AM

告别「解码器饥饿」!中国科学院NeurIPS推SpaceServe,高并发克星

核心突破:首次将LLM推理中的P/D分离思想扩展至多模态场景,提出EPD(Encoder-Prefill-Decode)三阶段解耦,并通过「空分复用」彻底解决编码器引发的行头阻塞问题。 随着多模态大语言模型(MLLM)广泛应用于高分辨率图像理解、长视频分析等场景,其推理流程中的多模态编码(Encoding)阶段正成为性能瓶颈。 当前主流系统(如vLLM)在服务MLLM时,仍沿用「时间复用」(time-multiplexing)策略:GPU先执行视觉/音频编码器,完成后才切换上下文运行文本解码器。
10/13/2025 9:10:00 AM

实测“清华特奖版Sora”:一图一prompt直接生成视频,堪称嘴强王者

那边OpenAI的Sora2还没全面开放,这边国内团队已经上线了自己的“特色打法”。 清华特奖选手创办的Sand.ai,上线了音画同步视频模型GAGA-1。 你可以把它理解为:一个专门练“嘴功”和“表演感”的视频生成模型:怎么样,奥特曼看了这视频都得说一句:好家伙!
10/13/2025 9:02:00 AM

拒绝小扎15亿美元offer的大佬,还是加入Meta了

那个拒绝了小扎15亿美元薪酬包的机器学习大神,还是加入Meta了。 OpenAI前CTO Mira Murati创业公司Thinking Machines Lab证实,联创、首席架构师Andrew Tulloch已经离职去了Meta。 按照公司发言人的说法,Tulloch离职的理由是“出于个人原因决定走一条不同的道路”,其本人则未给出回应。
10/13/2025 9:00:00 AM

破解AI唇语同步密码:SyncNet论文核心原理解析

译者 | 朱先忠审校 | 重楼简介你有没有看过配音糟糕的电影,嘴唇动作和台词不同步? 或者在视频通话中,对方的嘴型和声音不同步? 这些同步问题不仅仅是烦人,而是视频制作、广播和实时通信中一个真正的问题。
10/13/2025 9:00:00 AM
朱先忠

为何上下文成为人工智能领域的“新贵”:从 RAG 到上下文工程

译者 | 晶颜审校 | 重楼三个月前,我们的生产系统遭遇了一次严重故障,其根源并非代码缺陷或基础设施故障,而是源于对人工智能系统优化目标的根本性误解。 此前,我们搭建了一套自认为具备先进水平的文档分析流程,整合了检索增强生成(RAG)、向量嵌入、语义搜索及精细调优的重排序功能。 在演示场景中,该系统能够精准且富有说服力地回答关于客户监管文件的各类问题,但投入实际运行后,却频繁出现回答与上下文完全脱节的问题。
10/13/2025 8:00:00 AM

混元开源之力:Spring-Ai-hunyuan 项目功能升级与实战体验

今天咱们继续聊聊 spring-ai-hunyuan 这个项目。 上次我们兼容了 spring-ai 的 1.0.0 正式版本之后,就暂时放了一阵子,没怎么动。 最近倒是收到不少小伙伴反馈,说混元的思考链功能为什么不返回结果。
10/13/2025 7:27:37 AM
灵墨AI探索室

Hinton暴论:AI已经有意识,它自己不知道而已

在最新一期播客节目中,Hinton抛出的这一观点正迅速掀起热议。 老爷子一再表示,AI也许已经有了“意识雏形”,只是因为我们人类自己对意识理解错了,所以它也被教错了——不知道自己有意识。 翻译成大白话就是,AI其实有自我意识,只是暂未觉醒┌(。
10/13/2025 5:00:00 AM
量子位

别只会用 ChatGPT!前端 + AI,你必须要会这些!

Hello,大家好,我是 Sunday。 最近很多同学特别关注 AI 相关的领域。 c但是,AI 技术发展太快了,AIGC、RAG、Agent、Function Call、MCP 等等的各种热词层出不穷的。
10/13/2025 2:00:00 AM
程序员Sunday

快手KAT-Dev-72B-Exp震撼发布!74.6%解决率碾压GPT-5,编程Agent新王者

你有没有想过,什么时候一个国产开源模型能在编程领域真正"碾压"GPT-5? 这个问题的答案,快手给出了。 昨天看到快手开源KAT-Dev-72B-Exp的消息时,我第一反应是——这数据是不是搞错了?
10/13/2025 12:00:05 AM
阿丸笔记

「微调已死」再添筹码,谷歌扩展AI自我进化范式,成功经验与失败教训双向学习

这几天,关于「微调已死」的言论吸引了学术圈的广泛关注。 一篇来自斯坦福大学、SambaNova、UC 伯克利的论文提出了一种名为 Agentic Context Engineering(智能体 / 主动式上下文工程)的技术,让语言模型无需微调也能实现自我提升! 其实,在更早的时候,谷歌一篇名为《ReasoningBank: Scaling Agent Self-Evolving with Reasoning Memory》的论文提出了一个与 Agentic Context Engineering 类似的概念 ——ReasoningBank,用于智能体系统的创新记忆框架,从智能体自身判断的成功和失败经验中提炼并组织记忆项,无需真实标签。
10/12/2025 4:09:00 PM
机器之心

硅谷CEO们高喊AI威胁论,「5年内失业率飙升至20%」,但95%AI项目赔本赚吆喝

当前「AI 威胁就业」的论调,更多是基于技术趋势的预警,而非基于现实的既成事实,但这也绝非轻视 AI 长期影响的理由。 最近,「AI 让人类失业」的论调甚嚣尘上,给本就焦虑的打工人更蒙上了一层阴影。 Anthropic 的首席执行官 Dario Amodei 预测白领就业将面临一场「末日浩劫」,「AI 可能在未来五年内大规模取代入门级白领工作,失业率可能会飙升至 10% 到 20% 之间,尤其在法律、金融和咨询等行业。
10/12/2025 4:06:00 PM
机器之心