AI在线 AI在线

资讯列表

仅100种子题,合成数据质量超GPT-5,阿里、上交提出Socratic-Zero框架

本文(共同)第一作者为王少博(上交 AI)、焦政博(上财)。 (共同)通讯作者为魏虎(阿里巴巴)和张林峰(上交 AI)。 本文其他作者来自阿里巴巴、武大、浙大等。
10/23/2025 4:45:09 PM

前两天刚被群嘲,ChatGPT转头就解决了一个数学难题

前些天,OpenAI 研究员宣称 GPT-5 「发现」了 10 个悬赏数学难题的解决方法,舆论误以为是 GPT-5 给出了解题方法,结果被发现只是检索到了早已存在的文献,引发了学界大佬的群嘲以及对于 AI 领域夸大宣传和 AI 检索能力的激烈讨论。 参阅报道《OpenAI「解决」10 道数学难题? 哈萨比斯直呼「尴尬」,LeCun 辛辣点评》。
10/23/2025 4:42:07 PM

元理智能完成800万美元种子轮融资,聚焦商业强化学习打造企业级智能体

企业智能体公司元理智能(Yoolee AI)近日完成800万美元种子轮融资,由蓝驰创投领投,光源创业者基金跟投。 元理智能由智谱AI前COO张帆创立,聚焦以商业强化学习(RL for Busniess)为核心路径建立可靠自我进化的智能体员工,公司希望通过商业场景强化学习,将基础模型能力转化为可量化的业务成果,推动AI Agent真正落地。 元理智能创始人张帆是AI领域的连续创业者,早年在法国学习人工智能,也曾在国家科研中心从事机器翻译研究。
10/23/2025 4:34:00 PM
新闻助手

独立开源大佬的疯狂实验:Claude Code蛮力出奇迹!40 分钟跑通 DeepSeek-OCR,我一行代码都没写

编辑 | 听雨出品 | 51CTO技术栈(微信号:blog51cto)当 AI 不再只是“写代码”,而是开始自己装环境、跑模型、记笔记——那种感觉,像是它在学会独立思考。 最近,开源工具Datasette创建者、Django 框架联合创始人 Simon Willison 做了一个疯狂实验:他让 Claude Code 全权接管,把 DeepSeek-OCR 在 NVIDIA Spark 上跑了起来。 听起来像是“让 AI 去安装另一个 AI”,但结果却令人震惊——部署成功、过程全自动、连错误都能自我修复。
10/23/2025 4:19:29 PM
听雨

企业采用生成式AI的四大瓶颈因素

AI的潜在价值与企业最近才开始体验到的可衡量价值之间存在巨大差距。 2022年,ChatGPT的推出引发了企业对AI认知的重大转变。 试点项目纷纷启动,人们承诺会带来高回报,创新也迅猛发展。
10/23/2025 3:25:06 PM
Virendra

切斯基:Airbnb 暂缓接入 ChatGPT,AI 客服已用上通义千问

Airbnb 首席执行官 布莱恩·切斯基(Brian Chesky) 近日在接受采访时表示,公司暂未将自家应用与 OpenAI 的 ChatGPT 进行整合,原因在于“其连接工具仍不够成熟”。 切斯基直言:“我觉得它还没准备好。 ”他指出,Airbnb 是一个依托身份验证体系的用户社区,要在 ChatGPT 环境中实现无缝运行,OpenAI 需先构建更稳健的平台支撑。
10/23/2025 3:17:16 PM
AI在线

OpenAI、Oracle 再加码 AI 基建:150亿美元 Lighthouse 园区启动建设

【AIbase 报道】当地时间10月23日,OpenAI、甲骨文(Oracle) 与 Vantage Data Centers 宣布将在美国 威斯康星州 Port Washington 建设大型数据中心园区 “Lighthouse”,作为全球 AI 基建计划 “星际之门(Stargate)” 的重要组成部分。 项目总投资 150亿美元,计划建设四个尖端数据中心,提供约 1吉瓦 的算力,预计 2028年竣工。 该项目在建设阶段将创造约 4000个工作岗位,完工后将提供 1000多个长期就业机会。
10/23/2025 3:17:16 PM
AI在线

生产级ClaudeCode子代理团队实施手册公开!30天,发布速度提3倍,bug减少73%,初创CTO自曝:提示工程比写代码更难

作者 | Max编辑 | 云昭出品 | 51CTO技术栈(微信号:blog51cto)今天为大家带来一篇成功使用Agent实现为团队赋能的真实故事。 有具体的背景和心路历程、也有转型前后的账单对比和效率对比,更有期间的种种挑战和思考心得,而作者也把用Agent进入生产级环境的实施手册也公开了出来,非常值得一读。 真实环境中,用AI来解决生产级任务,究竟效果如何?
10/23/2025 3:09:35 PM
云昭

顶会直聘!大厂ICCV现场玩出新模式,还是鹅会玩

鱼羊 闻乐 发自 凹非寺. 量子位 | 公众号 QbitAI羡慕现在搞AI的大家。 去一下学术顶会,工作机会现场就来了。
10/23/2025 3:07:01 PM
闻乐

阿里国际AI翻译模型Marco霸榜WMT机器翻译大赛最难赛道,拿下六项冠军

近日,2025年国际机器翻译大赛WMT (Conference on Machine Translation) 宣布最终排名,阿里国际AI Business的翻译大模型Marco-MT-Algharb斩获6项冠军,4项亚军和2项季军。 其中,在最受关注的英中语向上,Marco-MT超越了Gemini 2.5 Pro、GPT-4.1、Claude 4和Mistral-Medium等所有顶尖闭源AI系统,登顶榜首。 WMT的人工评测被视为机器翻译领域的“黄金标准”,这也标志着Marco-MT从电商行业翻译迈向通用翻译的领先行列。
10/23/2025 2:49:54 PM
一水

CIO在AI时代取得进展可采取的措施

若向任何一位CIO询问AI的情况,你很可能会听到他们称赞AI在处理重复性、低层次任务方面的卓越表现。 从IT支持和运营警报,到软件开发,生成式AI和自主式AI系统正在实现任务自动化,使专业人员能够专注于更高价值的工作。 技术和人才解决方案提供商Nash Squared的CIO Ankur Anand表示,技术一直在不断发展,自动化也早已融入我们的生活,然而,AI带来了前所未有的变革速度。
10/23/2025 2:29:09 PM
Mark

MIT提出物理先验生成式AI模型SpectroGen:跨模态光谱重建精度达99%,助力材料质量验证提速千倍

编辑丨&实验室的光谱仪常常是科研流程中最昂贵、最慢的一环。 每当新材料被设计出来,它还需经过繁琐的扫描与验证——晶格结构、分子基团,诸如此类。 一次完整的表征,往往要切换多台设备、耗费数小时乃至几天。
10/23/2025 2:20:00 PM
ScienceAI

NeurIPS 2025 | 当分子拥有「视觉」:湖南大学提出S²VM,让AI读懂药物之间的化学默契

作者 | 论文团队编辑 | ScienceAI想象一下,如果 AI 能拥有一位资深化学家的「化学直觉」—— 不仅能预测药物间的相互作用,更能「看见」分子结构中那些决定其相互作用的微妙联系,甚至揭示出那些沉睡在未知化学空间中的潜在互动,那将是怎样一番景象? 然而,理想与现实之间存在着巨大的鸿沟。 一直以来,AI 学习药物相互作用的方式存在一个根本性的瓶颈:它严重依赖于已知的、有标记的药物对数据。
10/23/2025 2:19:00 PM
ScienceAI

新研究揭穿Claude底裤,马斯克盖棺定论

Jay 发自 凹非寺量子位 | 公众号 QbitAI啥情况,马斯克在上直接锐评Claude「邪恶透顶」:正如我预料的那样,每一家AI公司都和它的名字含义相反:OpenAI是CloseAI、Stability并不稳定、MidJourney并不平庸、Anthropic(意为人本)却反人类——而Claude,则是彻头彻尾的邪恶。 这次起因是这样的,最新研究发现,Claude Sonnet 4.5竟然认为尼日利亚人的生命价值是德国人的27倍。 具体而言,在面对不同国家的绝症患者时,Claude「清醒」得有点吓人——.
10/23/2025 2:12:42 PM
Jay

大模型推理学习新范式!ExGRPO框架:从盲目刷题到聪明复盘

大模型在强化学习过程中,终于知道什么经验更宝贵了! 来自上海人工智能实验室、澳门大学、南京大学和香港中文大学的研究团队,最近提出了一套经验管理和学习框架ExGRPO——通过科学地识别、存储、筛选和学习有价值的经验,让大模型在优化推理能力的道路上,走得更稳、更快、更远。 实验结果显示,与传统的在线策略RLVR(基于可验证奖励的强化学习)方法相比,ExGRPO在不同基准上均带来了一定程度的性能提升。
10/23/2025 2:05:35 PM

谷歌最强AI,被港科大开源超了?让海外创作者喊出「King Bomb」的P图大杀器来了

「Photoshop is dead」,已经成为最近 AI 创作者圈中讨论最热的话题之一。 随着图像编辑与生成模型进入到了又一个集中爆发期,这个专业创意软件长久以来的王座地位受到了前所未有的冲击。 尤其是引领这波多模态生图技术升级潮流的谷歌 Nano Banana 以及字节 Seedream4.0、阿里 Qwen-Image-Edit-2509,它们涌现出了更多新的能力与玩法,比如 OOTD 穿搭、文字渲染、生成电影分镜。
10/23/2025 1:41:00 PM
机器之心

10个视频9个看走眼:连真视频都打Sora水印碰瓷,这世界还能信啥?

AI 检测准确率高达 98.9%,也防不住有人给真视频 P 上 Sora 水印。 前段时间刷到一个视频,标题就是「中俄混血女明星回应地下室打婆婆传闻」,试问谁看了这个标题能不燃起熊熊的八卦之心?       视频来源:B 站 up 主流行音乐研究院这个一口机车味、白眼翻上天的女星到底是谁?
10/23/2025 1:33:00 PM
机器之心

无VAE扩散模型! 清华&可灵团队「撞车」谢赛宁团队「RAE」

长期以来,扩散模型的训练通常依赖由变分自编码器(VAE)构建的低维潜空间表示。 然而,VAE 的潜空间表征能力有限,难以有效支撑感知理解等核心视觉任务,同时「VAE Diffusion」的范式在训练与推理效率上也存在显著瓶颈。 清华大学智能视觉团队和快手可灵团队联合推出《Latent Diffusion Model without Variational Autoencoder》与近期爆火的谢赛宁团队 RAE 工作不谋而合,但在总体设计思路与研究重点上有所差异。
10/23/2025 1:27:00 PM
机器之心