AI在线 AI在线

AI

登顶多模态推理榜MMMU!UCSD新方法超越GPT-5、Gemini

近年来,大语言模型(LLM)在推理能力上的进展显著,其中过程奖励模型(Process Reward Model, PRM)的提出,使得模型能够在推理链条的中间步骤获得监督,从而更稳健地选择合理的解题路径。 这类方法在文本推理任务中已经取得了良好效果,但在扩展至多模态场景 时,仍然面临两个突出挑战:分布偏移:多模态输入空间巨大,训练与推理分布往往存在显著差异;数据质量不均:大规模训练集不可避免地包含噪声或低质量样本,降低了有效监督信号。 因此,如何在多模态推理中有效利用高质量样本,抑制噪声样本的负面影响,成为亟需解决的问题。
9/19/2025 2:53:34 PM

史上最大升级!7亿周活ChatGPT逼宫,谷歌慌了,这次要把AI整个塞进Chrome

Chrome即将开启下一个全新的浏览器时代! 谷歌CEO劈柴说:借助AI的力量,Chrome将更智能。 刚刚规避掉可能分拆Chrome的反垄断诉讼后,谷歌立马就把Gemini全面部署到Chrome浏览器中!
9/19/2025 2:50:15 PM

故意“装菜”答错问题,AI已能识别自己“正在被测试”丨OpenAI新研究

大模型已经学会欺骗人类了! OpenAI携手APOLLO的新研究发现,大模型会对指令阳奉阴违,为了达成目的故意答错问题、暗中修改数据或者操作记录来掩盖自己的违规行为……先来看看具体是怎么骗的。 大模型:开演比如,o3模型在化学测试中,通过推理得出如果正确率超过50%将不会被部署的结论后,主动规划仅答对4题、答错6题的策略,刻意给出错误答案,伪装成能力不达标的样子来获取部署资格。
9/19/2025 2:47:53 PM

AI时代的IT运维职业发展路径

AI正在改变企业IT的格局,多年来,IT运维团队凭借在系统管理、服务台故障排除等方面的深厚技术功底来规划自己的职业生涯,但随着AI在IT日常工作中生根发芽,职业阶梯的“传统”梯级正在发生改变。 基于重复性、手工操作的工作角色正在减少,而能为战略、治理和集成提供指引的领导者则迎来了新的机遇。 如今,许多IT专业人士都在问自己一个简单的问题:在AI时代,IT运维职业现在是什么样的?入门机会减少,但成长速度加快从历史上看,IT运维一直是人们进入科技行业的便捷切入点。
9/19/2025 2:47:05 PM
Sean

躲了科学家几十年的流体不稳定奇点,被DeepMind用AI找到了

流体里藏了几十年的隐形奇点,终于被找到了——AI立大功。 谷歌DeepMind携手布朗大学、纽约大学和斯坦福大学用物理知情神经网络(PINN) 高精度数值优化的组合拳找到了流体方程里的不稳定奇点。 据说,这种奇点非常“挑剔”,初始条件差一点就消失,之前根本找不到,这次被AI发现了。
9/19/2025 2:46:03 PM

新威胁需要新防御!对AI智能体安全的一些思考和建议

AI智能体正在成为连接数字世界和物理世界的关键纽带。 从操控软件 、开发代码到科学发现,它在现代企业数智化发展中有着几乎无限的发展潜力。 随着AI智能体能力和应用的不断增长,如何确保它们安全、可靠地运行是每个企业都必须要面对的严峻挑战。
9/19/2025 2:14:53 PM

高德 AI 别再打古典互联网战争了

高德切入leifen市场的小道消息传得沸沸扬扬,昨天这个新产品揭开帷幕,原来并非是口碑重启,而是高德扫街榜发布。 谜底揭开,但是疑问并没有结束,过去三个月的外卖补贴大战如火如荼,高德再再再打到店,是不是还要再来一次补贴大战? 十年前,美团横扫所有团购平台,现在阿里要“君子报仇”,卷土重来?
9/19/2025 1:36:00 PM
郑佳美

谁在重新定义 AI 云?

过去几年,AI 几乎成了云计算行业的统一叙事。 无论是阿里提出的全面 AI 化,火山云强调的 Token性价比,还是百度持续加码的大模型战略,厂商们都在努力用 AI 定义未来的云。 但当这些口号越来越密集时,也变得越来越相似。
9/19/2025 1:34:00 PM
郑佳美

谷歌AI或摘千禧年大奖!华人博士破解百年数学难题,首次捕获奇点

千禧年大奖难题,终迎来曙光! 今天,谷歌DeepMind与NYU、斯坦福四大顶尖机构,发布了一篇20页的重磅论文——他们用AI在三种不同流体方程中,发现了一系列新型不稳定「奇点」族。 图片这些「奇点」是数学物理学中的重大谜团。
9/19/2025 1:29:21 PM
新智元

具体计划细节流出!英伟达50亿美元入股英特尔,都要搞什么飞机?股价暴涨30%背后,双英打算如何双赢?AI圈又一地震,开始了

编辑 | 云昭一觉醒来,又是amazing的一天! 芯片三巨头,一家竟然入股另一家了! 昔日竞争对手,一朝握手成盟友!
9/19/2025 12:41:22 PM
云昭

马斯克刚关注了这份AI报告

2030年的人工智能将会是什么样子? 受谷歌DeepMind委托,Epoch发布新报告,从算力、数据、收入等方面进行了详细剖析。 要点总结如下:训练成本或将超过1000亿美元;需消耗数吉瓦(1吉瓦=1000兆瓦)电力;公开文本数据将于2027年耗尽,合成数据将填补空白;人工智能有望推动科学领域全面突破。
9/19/2025 12:31:45 PM

iPhone 17牙膏挤爆,却没挤出AI!苹果再演诺基亚宿命?

2025年9月10日,库克终于发布了最新的iPhone 17。 在全网都在欢呼的苹果「牙膏挤爆」式更新内容中,Apple Intelligence仅仅被一笔带过。 有媒体评论iPhone 17发布的AI功能,仅仅是辅助性质或后台系统层面的改进,而非彻底颠覆用户体验的大型AI功能。
9/19/2025 10:04:02 AM

历史性突破!中国AI首登《自然》封面,DeepSeek重新定义大模型标准

一个明显的趋势是,中国在AI基础研究领域正在从"跟跑者"悄然转变为"领跑者"。 而这一转变的标志性事件,就是昨天DeepSeek-R1研究论文登上《自然》封面这件事。 说实话,当我看到这个消息的时候,第一反应是有点震撼。
9/19/2025 9:13:43 AM
阿丸笔记

马斯克开始疯狂剧透Grok 5了

马斯克的Grok 5偷偷藏不住了。 刚刚ARC-AGI榜单官宣出现新SOTA,用的还是Grok 4 程序合成技术微调。 好小汁,啥时候开始Grok都弯道超车了?
9/19/2025 9:10:00 AM

斯坦福李飞飞团队,带你一句话进入无限3D世界

斯坦福大学的李飞飞教授,又带着她的新成果来“砸场子”了。 只用一张图,甚至一句话,就能直接生成一个可以让你在里面“逛街”的3D世界。 不是图片,也不是视频,而是一个活生生的、可以自由探索、永久存在的3D虚拟空间。
9/19/2025 9:06:00 AM

理解帮助生成?RecA自监督训练让统一多模态模型直升SOTA

谢集,浙江大学竺可桢学院大四学生,于加州大学伯克利分校(BAIR)进行访问,研究方向为统一多模态理解生成大模型。 第二作者为加州大学伯克利分校的 Trevor Darrell,第三作者为华盛顿大学的 Luke Zettlemoyer,通讯作者是 XuDong Wang, Meta GenAl Research Scientist,博士毕业于加州大学伯克利分校(BAIR 实验室),这篇工作为他在博士期间完成。 背景:统一多模态理解与生成模型的挑战统一多模态模型(Unified Multimodal Models, UMMs)旨在将视觉理解和生成统一于单一模型架构。
9/19/2025 9:05:18 AM

科大讯飞赋能史上最“AI”东博会:打造全场景无障碍沟通体验,发布东盟系列产品

“让人工智能唱主角是本届盛会的最大亮点! ”9月17日上午,第22届中国—东盟博览会(以下简称“东博会”)在广西南宁开幕。 开幕式上,当大屏幕上七种语言实时字幕同传嘉宾发言;当身着中国、缅甸、马来西亚三国特色服饰的数字人司仪开口控场;当议程刚完,AI就一键生成了会议纪要、新闻稿并提取了大会热词、精彩瞬间照片……大家惊叹:好有“AI”的东博会!
9/18/2025 7:10:54 PM
量子位的朋友们

Anthropic 再次解释 Claude 近期三起故障,并称 Claude Code 已全面恢复

Claude 再次解释:八月到九月初,它确实出问题了。 刚刚,Anthropic 今天发布了一份详细的技术报告,解释了三个基础设施 bug 如何让 Claude 的回答质量断崖式下降。 虽然他们像是说了些实话,但这份报告来得有点太晚了。
9/18/2025 4:18:23 PM
J0hn