AI在线 AI在线

AI

马斯克Grok 4 Fast首发霸榜!2.5倍速秒杀GPT-5,成本暴降98%直追Gemini

马斯克Grok 4 Fast首发霸榜!2.5倍速秒杀GPT-5,成本暴降98%直追Gemini

Grok 4 Fast官宣上线,马斯克再次兑现了承诺! 它首次将推理/非推理「双模式」合一,支持200万上下文,直接刷爆性价比SOTA。 推理测试中,Grok 4 Fast直接碾压前代Grok 3 Mini,尤其是数学、编码性能大增。
9/22/2025 9:06:00 AM
马斯克转发字节Seed&哥大商学院新基准:大模型搞金融,连查个股价都能出错

马斯克转发字节Seed&哥大商学院新基准:大模型搞金融,连查个股价都能出错

让AI像金融分析师一样搜索和分析数据,到底有多难? 当前的大模型虽然能回答基础金融知识,在CFA考试中取得高分,但面对真实的金融场景,它们的表现究竟如何? 为了回答这个问题,字节跳动Seed团队联合哥伦比亚大学商学院推出了FinSearchComp,这是首个完全开源的金融搜索与推理基准测试。
9/22/2025 9:04:00 AM
小扎AI眼镜当场死机,CTO自曝灾难级演示内幕:一个指令干趴自家服务器

小扎AI眼镜当场死机,CTO自曝灾难级演示内幕:一个指令干趴自家服务器

就在上周,小扎当着数万观众的面,搞砸了! 他在Meta总部现场演示智能眼镜Ray-Ban Display时,眼镜内置AI助手,无法正确回应对话。 而且,Ray-Ban Display眼镜在与神经腕带的来电/交互演示时,也没能成功,引发现场哄笑与尴尬。
9/22/2025 8:56:00 AM
特朗普携老黄奥特曼访英,重磅成果揭秘!烧千亿建英国AI「星际之门」

特朗普携老黄奥特曼访英,重磅成果揭秘!烧千亿建英国AI「星际之门」

特朗普终于在北京时间昨天凌晨,结束了对英国的这场世界瞩目的声势浩大的国事访问。 国宴上,黄仁勋、奥特曼等炙手可热的科技巨头的领导者们跟随特朗普悉数登场。 英美双方达成了《科技繁荣协议》(Tech Prosperity Deal),重点发展AI、量子技术和核能等增长最快的科技。
9/22/2025 8:53:00 AM
阿里新开源提出建设性安全对齐方案,向“让用AI的人安全”新范式跃迁

阿里新开源提出建设性安全对齐方案,向“让用AI的人安全”新范式跃迁

正如牡蛎历经磨砺,在坚实的外壳内将沙砾孕育成一颗温润的珍珠。 AI也可以如此,不是一个只会紧紧封闭抵御风险的系统,而是一个有底线、有分寸、也有温度的伙伴。 阿里巴巴集团安全部联合清华大学、复旦大学、东南大学、新加坡南洋理工等高校,联合发布技术报告;其理念与最近OpenAI发布的GPT-5 System Card放在首位的“From Hard Refusals to Safe-Completions”理念不谋而合。
9/22/2025 8:50:00 AM
终结CMU霸权,清华首次登顶CSRankings世界第一!北大AI领域夺冠

终结CMU霸权,清华首次登顶CSRankings世界第一!北大AI领域夺冠

就在刚刚,2025 CSRankings全球计算机科学排名再次更新! 清华大学首次摘得全球第一! 而在今年4月时,排名是这样的:这次更新最大看点是中国高校集体爆发:清华大学、上海交通大学、浙江大学、北京大学分列第1、3、4、5位,直接占据了TOP 5中的4个名额。
9/22/2025 8:47:00 AM
Reddit高赞:氛围编程这台老虎机,正在制造脑残程序员!

Reddit高赞:氛围编程这台老虎机,正在制造脑残程序员!

编辑 | 云昭“AI 编程的体验,本质上是一个老虎机式奖励系统! ”半年多来,Vibe Coding 几乎重写了开发者的工作方式。 盯着屏幕苦思冥想似乎成了过去式,现在只需要把需求丢进 Claude、GPT 或 Cursor,然后在几分钟后就得到能运行的结果。
9/21/2025 3:29:05 PM 云昭
登顶多模态推理榜MMMU!UCSD新方法超越GPT-5、Gemini

登顶多模态推理榜MMMU!UCSD新方法超越GPT-5、Gemini

近年来,大语言模型(LLM)在推理能力上的进展显著,其中过程奖励模型(Process Reward Model, PRM)的提出,使得模型能够在推理链条的中间步骤获得监督,从而更稳健地选择合理的解题路径。 这类方法在文本推理任务中已经取得了良好效果,但在扩展至多模态场景 时,仍然面临两个突出挑战:分布偏移:多模态输入空间巨大,训练与推理分布往往存在显著差异;数据质量不均:大规模训练集不可避免地包含噪声或低质量样本,降低了有效监督信号。 因此,如何在多模态推理中有效利用高质量样本,抑制噪声样本的负面影响,成为亟需解决的问题。
9/19/2025 2:53:34 PM
史上最大升级!7亿周活ChatGPT逼宫,谷歌慌了,这次要把AI整个塞进Chrome

史上最大升级!7亿周活ChatGPT逼宫,谷歌慌了,这次要把AI整个塞进Chrome

Chrome即将开启下一个全新的浏览器时代! 谷歌CEO劈柴说:借助AI的力量,Chrome将更智能。 刚刚规避掉可能分拆Chrome的反垄断诉讼后,谷歌立马就把Gemini全面部署到Chrome浏览器中!
9/19/2025 2:50:15 PM
故意“装菜”答错问题,AI已能识别自己“正在被测试”丨OpenAI新研究

故意“装菜”答错问题,AI已能识别自己“正在被测试”丨OpenAI新研究

大模型已经学会欺骗人类了! OpenAI携手APOLLO的新研究发现,大模型会对指令阳奉阴违,为了达成目的故意答错问题、暗中修改数据或者操作记录来掩盖自己的违规行为……先来看看具体是怎么骗的。 大模型:开演比如,o3模型在化学测试中,通过推理得出如果正确率超过50%将不会被部署的结论后,主动规划仅答对4题、答错6题的策略,刻意给出错误答案,伪装成能力不达标的样子来获取部署资格。
9/19/2025 2:47:53 PM
AI时代的IT运维职业发展路径

AI时代的IT运维职业发展路径

AI正在改变企业IT的格局,多年来,IT运维团队凭借在系统管理、服务台故障排除等方面的深厚技术功底来规划自己的职业生涯,但随着AI在IT日常工作中生根发芽,职业阶梯的“传统”梯级正在发生改变。 基于重复性、手工操作的工作角色正在减少,而能为战略、治理和集成提供指引的领导者则迎来了新的机遇。 如今,许多IT专业人士都在问自己一个简单的问题:在AI时代,IT运维职业现在是什么样的?入门机会减少,但成长速度加快从历史上看,IT运维一直是人们进入科技行业的便捷切入点。
9/19/2025 2:47:05 PM Sean
躲了科学家几十年的流体不稳定奇点,被DeepMind用AI找到了

躲了科学家几十年的流体不稳定奇点,被DeepMind用AI找到了

流体里藏了几十年的隐形奇点,终于被找到了——AI立大功。 谷歌DeepMind携手布朗大学、纽约大学和斯坦福大学用物理知情神经网络(PINN) 高精度数值优化的组合拳找到了流体方程里的不稳定奇点。 据说,这种奇点非常“挑剔”,初始条件差一点就消失,之前根本找不到,这次被AI发现了。
9/19/2025 2:46:03 PM
新威胁需要新防御!对AI智能体安全的一些思考和建议

新威胁需要新防御!对AI智能体安全的一些思考和建议

AI智能体正在成为连接数字世界和物理世界的关键纽带。 从操控软件 、开发代码到科学发现,它在现代企业数智化发展中有着几乎无限的发展潜力。 随着AI智能体能力和应用的不断增长,如何确保它们安全、可靠地运行是每个企业都必须要面对的严峻挑战。
9/19/2025 2:14:53 PM
高德 AI 别再打古典互联网战争了

高德 AI 别再打古典互联网战争了

高德切入leifen市场的小道消息传得沸沸扬扬,昨天这个新产品揭开帷幕,原来并非是口碑重启,而是高德扫街榜发布。 谜底揭开,但是疑问并没有结束,过去三个月的外卖补贴大战如火如荼,高德再再再打到店,是不是还要再来一次补贴大战? 十年前,美团横扫所有团购平台,现在阿里要“君子报仇”,卷土重来?
9/19/2025 1:36:00 PM 郑佳美
谁在重新定义 AI 云?

谁在重新定义 AI 云?

过去几年,AI 几乎成了云计算行业的统一叙事。 无论是阿里提出的全面 AI 化,火山云强调的 Token性价比,还是百度持续加码的大模型战略,厂商们都在努力用 AI 定义未来的云。 但当这些口号越来越密集时,也变得越来越相似。
9/19/2025 1:34:00 PM 郑佳美
谷歌AI或摘千禧年大奖!华人博士破解百年数学难题,首次捕获奇点

谷歌AI或摘千禧年大奖!华人博士破解百年数学难题,首次捕获奇点

千禧年大奖难题,终迎来曙光! 今天,谷歌DeepMind与NYU、斯坦福四大顶尖机构,发布了一篇20页的重磅论文——他们用AI在三种不同流体方程中,发现了一系列新型不稳定「奇点」族。 图片这些「奇点」是数学物理学中的重大谜团。
9/19/2025 1:29:21 PM 新智元
具体计划细节流出!英伟达50亿美元入股英特尔,都要搞什么飞机?股价暴涨30%背后,双英打算如何双赢?AI圈又一地震,开始了

具体计划细节流出!英伟达50亿美元入股英特尔,都要搞什么飞机?股价暴涨30%背后,双英打算如何双赢?AI圈又一地震,开始了

编辑 | 云昭一觉醒来,又是amazing的一天! 芯片三巨头,一家竟然入股另一家了! 昔日竞争对手,一朝握手成盟友!
9/19/2025 12:41:22 PM 云昭
马斯克刚关注了这份AI报告

马斯克刚关注了这份AI报告

2030年的人工智能将会是什么样子? 受谷歌DeepMind委托,Epoch发布新报告,从算力、数据、收入等方面进行了详细剖析。 要点总结如下:训练成本或将超过1000亿美元;需消耗数吉瓦(1吉瓦=1000兆瓦)电力;公开文本数据将于2027年耗尽,合成数据将填补空白;人工智能有望推动科学领域全面突破。
9/19/2025 12:31:45 PM