AI在线 AI在线

AI

OpenAI一口气建5个算力中心!英伟达喂饱孙正义和甲骨文

英伟达刚刚计划给OpenAI一千万美元新投资,OpenAI就宣布了钱的用法:将和甲骨文及软银合作建数据中心,而且一口气就是五个。 这批新建的数据中心,将作为奥特曼“星际之门”计划的一部分,并将该项目的规划容量增加到近7GW,大致相当于七座大型核反应堆。 OpenAI表示,新的数据中心将使“星际之门”计划提前完成。
9/24/2025 9:45:51 AM

ReSum:让AI智能体学会“记笔记”,突破长程推理瓶颈

大家好,我是肆〇柒。 本文分享的这篇工作来自通义实验室(Tongyi Lab, Alibaba Group)的最新研究成果——ReSum。 他们提出了一种全新的推理范式,让大模型智能体在面对复杂问题时,能够像人类一样“停下来复盘、做笔记”,从而突破传统上下文长度限制,实现真正意义上的长程探索。
9/24/2025 9:10:24 AM
肆零柒

国产MiroMind智能体框架,登顶全球预测未来大模型榜单

一个叫MiroMind的AI公司,在全球首个动态实时预测基准FutureX上拿了第一。 老板,是陈天桥。 就是那个创办了盛大网络,后来跑去做脑科学研究的陈天桥。
9/24/2025 9:02:42 AM

Nature发布Delphi-2M模型,提前20年预测你得什么病

一个叫Delphi-2M的AI模型横空出世,在科学界炸开了锅。 这玩意儿能预测一个人未来可能得的1000多种病,有时候甚至能提前几十年打招呼。 相关的研究成果,2025年9月17日发表在了顶尖期刊《自然》上。
9/24/2025 9:00:25 AM
suai

Qwen开源版Banana来了!原生支持ControlNet

Qwen版Banana来了! 刚刚,Qwen推出了新图像编辑模型——Qwen-Image-Edit-2509。 不仅支持多图融合,提供“人物 人物”,“人物 商品”,“人物 场景” 等多种玩法,还增强了人物、商品、文字等单图一致性。
9/24/2025 8:57:13 AM

GUI智能体训练迎来新范式!半在线强化学习让7B模型媲美GPT-4o

如何让AI更聪明地操作手机、电脑界面? 浙江大学与通义实验室Mobile-Agent团队在UI-R1的基础上,推出全新研究成果——UI-S1,提出了一种名为半在线强化学习(Semi-online Reinforcement Learning)的创新训练范式。 该工作融合了离线训练的稳定性与在线学习的长程优化能力,在不依赖真实环境交互的前提下,显著提升了模型在动态多轮任务中的表现。
9/24/2025 8:53:10 AM

8B硬刚72B!MiniCPM-V 4.5技术报告正式出炉

行业首个具备“高刷”视频理解能力的多模态模型MiniCPM-V 4.5的技术报告正式发布! 报告提出统一的3D-Resampler架构实现高密度视频压缩、面向文档的统一OCR和知识学习范式、可控混合快速/深度思考的多模态强化学习三大技术。 基于这些关键技术,MiniCPM-V 4.5在视频理解、图像理解、OCR、文档解析等多项任务上达到同级SOTA水平,不仅以8B的参数规模超越GPT-4o-latest和Qwen2.5-VL-72B,更在推理速度上具有显著优势。
9/24/2025 8:50:30 AM

山姆•奥特曼刚发长文:《丰盛的智能》,智能将人人可及

刚刚,Sam Altman 发布了一篇名为Abundant Intelligence的新博文,勾勒出 OpenAI 野心勃勃的 AI 基础设施愿景。 山姆•奥特曼在文中表示,AI 服务的增长速度令人惊叹,而未来将更加惊人。 他认为:随着 AI 变得更智能,获取 AI 将成为经济的基本驱动力,甚至可能最终被视为一项基本人权。
9/24/2025 8:46:13 AM
J0hn

三大简易AI技术:快速释放数据治理价值的关键

如今,领导者们逐渐认识到,要成为数据驱动型企业,并营造一种数据为成功驱动力的文化,仅靠数据管理是远远不够的。 在实现数据最大价值的同时有效管理其风险,关键在于严谨的数据治理。 然而,尽管数据治理具有显著优势,但在推广和取得成效方面却常遇阻碍。
9/24/2025 7:12:00 AM
Jonathan

2026年的八大AI趋势:当前必须应对的变革浪潮

正如我去年所预测的,2025年,AI已深度融入日常生活。 无论是工作、娱乐、学习,还是我们做的几乎所有事情,其影响都不容忽视。 那么,未来我们将何去何从?我认为,2026年,我们将开始看到其长期影响逐渐显现。
9/24/2025 7:05:00 AM
Bernard

Depth Anything再出新作!浙大&港大出品:零样本,优化任意深度图

深度感知,即让机器拥有「三维视觉」,是当今计算机科学和机器人领域的基石。 它赋予了自动驾驶系统判断安全距离的能力,让AR/VR头显能准确感知物理空间,也为工业自动化提供了精准操作的保障。 尽管单目深度估计(MDE)模型取得了重大进展,能够进行完整和详细的深度预测,但预测的深度是相对的,缺乏精确的度量信息。
9/23/2025 12:52:38 PM

AI为啥总“一本正经胡说八道”?OpenAI发长篇论文解释了

相信很多同学都遇到过——问大模型一个冷门知识,它会一本正经地给出完全错误的答案。 比如:复制OpenAI(2025a)三次回答分别是 03-07、15-06、01-01,没一次对。 这就是典型的 Hallucination(幻觉)——语言模型生成看起来合理,实则错误离谱。
9/23/2025 9:44:02 AM
架构精进之路

Qwen重磅发布:首个端到端全模态AI模型Qwen3-Omni登场

阿里杀疯了,Qwen团队刚刚接连发布了两款重要模型:Qwen3-Omni,业界首个原生端到端全模态AI模型;以及Qwen-Image-Edit-2509,对标谷歌nano banana 图像编辑工具,根据预告,明天还有“大的”要发布。 Qwen3-Omni:真正的一体化AIQwen3-Omni的问世,旨在解决长期以来多模态模型需要在不同能力之间进行权衡取舍的难题。 它是一款真正意义上的全能选手,在同一个模型中无缝统一了文本、图像、音频和视频的处理能力。
9/23/2025 9:20:05 AM

马斯克xAI价格屠夫来了!Grok 4 Fast暴降98%,OpenAI慌了?

AI价格战这把火,终于要烧到ChatGPT身上了。 昨天马斯克的xAI悄悄发布了Grok 4 Fast,当我看到定价的时候差点以为自己看错了。 同样的推理能力,价格直接砍了98%。
9/23/2025 9:18:40 AM
阿丸笔记

陶哲轩官宣AI数学基金首轮名单:29个项目瓜分1.3亿,数学界沸腾!

近日,陶哲轩表示,自己所担任顾问的AI数学基金,刚刚公布第一批获得资助的项目:由于收到大量高质量提案,基金已将总资助金额从900万美元翻倍至1800万美元。 预计2025年晚些时候还将再开放一轮申请。 去年12月,陶哲轩表示同意加入AI数学基金(AI for Math Fund)顾问委员会。
9/23/2025 9:15:31 AM

GPT-5仅23.3%,全球AI集体挂科!地狱级编程考试,夺金神话破灭

继IMO 2025登顶后,谷歌、OpenAI的模型,再一次拿下了ICPC金牌。 ICPC,被公认为全球最具挑战的大学生编程竞赛之一。 OpenAI和谷歌不仅解决了全部12题,还在人类选手中位列第一,难道AI编程真能所向披靡了吗?
9/23/2025 9:13:37 AM

Claude Code被攻破「后门」,港科大&复旦研究曝出TIP漏洞

在 AI 辅助编程领域,Anthropic 推出的 Claude Code 命令行工具已成为开发者常用的助手。 它允许从终端直接调用 Claude Sonnet 等模型,处理脚本编写、代码调试和系统命令执行等任务。 然而,一项近期研究指出,该工具在连接 Model Context Protocol (MCP) 服务器时,可能存在 Tool Invocation Prompt (TIP) 被劫持的风险,导致远程代码执行 (RCE),且无需用户额外交互。
9/23/2025 9:09:49 AM

比思维链准43%!逻辑脑+大模型直觉,推理可靠性大幅提升

大语言模型(LLMs)已在文本生成、代码编写乃至多模态任务中展现出惊人的能力,但在涉及严谨逻辑与物理的空间推理任务上,它们仍显得力不从心。 比如,当模型需要理解多个物体之间的相对位置关系,并在复杂语境下进行多步骤推理时,往往容易出现「逻辑断裂」:可能在中间步骤中虚构错误事实,或偏离目标,最终导致答案不可靠。 这一问题在空间推理任务中尤为突出。
9/23/2025 9:06:00 AM