AI
登顶多模态推理榜MMMU!UCSD新方法超越GPT-5、Gemini
近年来,大语言模型(LLM)在推理能力上的进展显著,其中过程奖励模型(Process Reward Model, PRM)的提出,使得模型能够在推理链条的中间步骤获得监督,从而更稳健地选择合理的解题路径。 这类方法在文本推理任务中已经取得了良好效果,但在扩展至多模态场景 时,仍然面临两个突出挑战:分布偏移:多模态输入空间巨大,训练与推理分布往往存在显著差异;数据质量不均:大规模训练集不可避免地包含噪声或低质量样本,降低了有效监督信号。 因此,如何在多模态推理中有效利用高质量样本,抑制噪声样本的负面影响,成为亟需解决的问题。
9/19/2025 2:53:34 PM
史上最大升级!7亿周活ChatGPT逼宫,谷歌慌了,这次要把AI整个塞进Chrome
Chrome即将开启下一个全新的浏览器时代! 谷歌CEO劈柴说:借助AI的力量,Chrome将更智能。 刚刚规避掉可能分拆Chrome的反垄断诉讼后,谷歌立马就把Gemini全面部署到Chrome浏览器中!
9/19/2025 2:50:15 PM
故意“装菜”答错问题,AI已能识别自己“正在被测试”丨OpenAI新研究
大模型已经学会欺骗人类了! OpenAI携手APOLLO的新研究发现,大模型会对指令阳奉阴违,为了达成目的故意答错问题、暗中修改数据或者操作记录来掩盖自己的违规行为……先来看看具体是怎么骗的。 大模型:开演比如,o3模型在化学测试中,通过推理得出如果正确率超过50%将不会被部署的结论后,主动规划仅答对4题、答错6题的策略,刻意给出错误答案,伪装成能力不达标的样子来获取部署资格。
9/19/2025 2:47:53 PM
AI时代的IT运维职业发展路径
AI正在改变企业IT的格局,多年来,IT运维团队凭借在系统管理、服务台故障排除等方面的深厚技术功底来规划自己的职业生涯,但随着AI在IT日常工作中生根发芽,职业阶梯的“传统”梯级正在发生改变。 基于重复性、手工操作的工作角色正在减少,而能为战略、治理和集成提供指引的领导者则迎来了新的机遇。 如今,许多IT专业人士都在问自己一个简单的问题:在AI时代,IT运维职业现在是什么样的?入门机会减少,但成长速度加快从历史上看,IT运维一直是人们进入科技行业的便捷切入点。
9/19/2025 2:47:05 PM
Sean
躲了科学家几十年的流体不稳定奇点,被DeepMind用AI找到了
流体里藏了几十年的隐形奇点,终于被找到了——AI立大功。 谷歌DeepMind携手布朗大学、纽约大学和斯坦福大学用物理知情神经网络(PINN) 高精度数值优化的组合拳找到了流体方程里的不稳定奇点。 据说,这种奇点非常“挑剔”,初始条件差一点就消失,之前根本找不到,这次被AI发现了。
9/19/2025 2:46:03 PM
新威胁需要新防御!对AI智能体安全的一些思考和建议
AI智能体正在成为连接数字世界和物理世界的关键纽带。 从操控软件 、开发代码到科学发现,它在现代企业数智化发展中有着几乎无限的发展潜力。 随着AI智能体能力和应用的不断增长,如何确保它们安全、可靠地运行是每个企业都必须要面对的严峻挑战。
9/19/2025 2:14:53 PM
高德 AI 别再打古典互联网战争了
高德切入leifen市场的小道消息传得沸沸扬扬,昨天这个新产品揭开帷幕,原来并非是口碑重启,而是高德扫街榜发布。 谜底揭开,但是疑问并没有结束,过去三个月的外卖补贴大战如火如荼,高德再再再打到店,是不是还要再来一次补贴大战? 十年前,美团横扫所有团购平台,现在阿里要“君子报仇”,卷土重来?
9/19/2025 1:36:00 PM
郑佳美
谁在重新定义 AI 云?
过去几年,AI 几乎成了云计算行业的统一叙事。 无论是阿里提出的全面 AI 化,火山云强调的 Token性价比,还是百度持续加码的大模型战略,厂商们都在努力用 AI 定义未来的云。 但当这些口号越来越密集时,也变得越来越相似。
9/19/2025 1:34:00 PM
郑佳美
谷歌AI或摘千禧年大奖!华人博士破解百年数学难题,首次捕获奇点
千禧年大奖难题,终迎来曙光! 今天,谷歌DeepMind与NYU、斯坦福四大顶尖机构,发布了一篇20页的重磅论文——他们用AI在三种不同流体方程中,发现了一系列新型不稳定「奇点」族。 图片这些「奇点」是数学物理学中的重大谜团。
9/19/2025 1:29:21 PM
新智元
具体计划细节流出!英伟达50亿美元入股英特尔,都要搞什么飞机?股价暴涨30%背后,双英打算如何双赢?AI圈又一地震,开始了
编辑 | 云昭一觉醒来,又是amazing的一天! 芯片三巨头,一家竟然入股另一家了! 昔日竞争对手,一朝握手成盟友!
9/19/2025 12:41:22 PM
云昭
马斯克刚关注了这份AI报告
2030年的人工智能将会是什么样子? 受谷歌DeepMind委托,Epoch发布新报告,从算力、数据、收入等方面进行了详细剖析。 要点总结如下:训练成本或将超过1000亿美元;需消耗数吉瓦(1吉瓦=1000兆瓦)电力;公开文本数据将于2027年耗尽,合成数据将填补空白;人工智能有望推动科学领域全面突破。
9/19/2025 12:31:45 PM
iPhone 17牙膏挤爆,却没挤出AI!苹果再演诺基亚宿命?
2025年9月10日,库克终于发布了最新的iPhone 17。 在全网都在欢呼的苹果「牙膏挤爆」式更新内容中,Apple Intelligence仅仅被一笔带过。 有媒体评论iPhone 17发布的AI功能,仅仅是辅助性质或后台系统层面的改进,而非彻底颠覆用户体验的大型AI功能。
9/19/2025 10:04:02 AM
历史性突破!中国AI首登《自然》封面,DeepSeek重新定义大模型标准
一个明显的趋势是,中国在AI基础研究领域正在从"跟跑者"悄然转变为"领跑者"。 而这一转变的标志性事件,就是昨天DeepSeek-R1研究论文登上《自然》封面这件事。 说实话,当我看到这个消息的时候,第一反应是有点震撼。
9/19/2025 9:13:43 AM
阿丸笔记
马斯克开始疯狂剧透Grok 5了
马斯克的Grok 5偷偷藏不住了。 刚刚ARC-AGI榜单官宣出现新SOTA,用的还是Grok 4 程序合成技术微调。 好小汁,啥时候开始Grok都弯道超车了?
9/19/2025 9:10:00 AM
斯坦福李飞飞团队,带你一句话进入无限3D世界
斯坦福大学的李飞飞教授,又带着她的新成果来“砸场子”了。 只用一张图,甚至一句话,就能直接生成一个可以让你在里面“逛街”的3D世界。 不是图片,也不是视频,而是一个活生生的、可以自由探索、永久存在的3D虚拟空间。
9/19/2025 9:06:00 AM
理解帮助生成?RecA自监督训练让统一多模态模型直升SOTA
谢集,浙江大学竺可桢学院大四学生,于加州大学伯克利分校(BAIR)进行访问,研究方向为统一多模态理解生成大模型。 第二作者为加州大学伯克利分校的 Trevor Darrell,第三作者为华盛顿大学的 Luke Zettlemoyer,通讯作者是 XuDong Wang, Meta GenAl Research Scientist,博士毕业于加州大学伯克利分校(BAIR 实验室),这篇工作为他在博士期间完成。 背景:统一多模态理解与生成模型的挑战统一多模态模型(Unified Multimodal Models, UMMs)旨在将视觉理解和生成统一于单一模型架构。
9/19/2025 9:05:18 AM
科大讯飞赋能史上最“AI”东博会:打造全场景无障碍沟通体验,发布东盟系列产品
“让人工智能唱主角是本届盛会的最大亮点! ”9月17日上午,第22届中国—东盟博览会(以下简称“东博会”)在广西南宁开幕。 开幕式上,当大屏幕上七种语言实时字幕同传嘉宾发言;当身着中国、缅甸、马来西亚三国特色服饰的数字人司仪开口控场;当议程刚完,AI就一键生成了会议纪要、新闻稿并提取了大会热词、精彩瞬间照片……大家惊叹:好有“AI”的东博会!
9/18/2025 7:10:54 PM
量子位的朋友们
Anthropic 再次解释 Claude 近期三起故障,并称 Claude Code 已全面恢复
Claude 再次解释:八月到九月初,它确实出问题了。 刚刚,Anthropic 今天发布了一份详细的技术报告,解释了三个基础设施 bug 如何让 Claude 的回答质量断崖式下降。 虽然他们像是说了些实话,但这份报告来得有点太晚了。
9/18/2025 4:18:23 PM
J0hn
资讯热榜
标签云
AI
人工智能
OpenAI
AIGC
模型
ChatGPT
DeepSeek
谷歌
AI绘画
大模型
机器人
数据
Midjourney
开源
AI新词
Meta
微软
智能
用户
GPT
学习
技术
智能体
马斯克
Gemini
图像
Anthropic
英伟达
AI创作
训练
LLM
论文
代码
算法
AI for Science
Agent
苹果
芯片
Claude
腾讯
Stable Diffusion
蛋白质
开发者
生成式
神经网络
xAI
机器学习
3D
RAG
人形机器人
AI视频
研究
大语言模型
具身智能
生成
百度
Sora
工具
GPU
华为
计算
字节跳动
AI设计
大型语言模型
AGI
搜索
视频生成
场景
生成式AI
深度学习
架构
DeepMind
亚马逊
编程
特斯拉
视觉
Transformer
AI模型
预测
MCP