理论

图灵奖得主联手前谷歌CEO，发布全球首份AGI“成绩单”！GPT-5仅获58分，最大缺陷是“金鱼脑”

编辑 | 听雨“什么是 AGI？ ”这是所有科技公司都在喊的口号，却也是一个模糊得几乎无法定义的词。 OpenAI 说它要“追求 AGI”；Anthropic 宣称 Claude 是“朝向 AGI 的安全智能体”；谷歌和 Meta 则都声称自己“正在逼近 AGI”。

10/20/2025 3:43:10 PM

听雨

IDC 2025 新出炉 Infra 报告力荐：GMI Cloud 领跑 AI 原生云赛道

近日，全球权威市场研究机构 IDC 发布《AI 原生云/新型云厂商重构 Agentic 基础设施》报告，深度剖析生成式 AI（GenAI）爆发背景下，AI 基础设施市场的变革趋势与核心玩家价值。报告明确指出，“AI 原生云厂商凭借稳定的供应链、显著的价格优势及专业化能力，已在 AI 基础设施市场站稳脚跟”，并将 GMI Cloud 与 CoreWeave 列为新型 AI 原生云厂商中的重点调研推荐对象，从技术实力、生态资源、产品布局及战略视野四大维度，肯定其在推动企业 GenAI 落地中的核心作用。 IDC 洞察 AI 应用市场焦点：AI 原生云成 GenAI 跨越“PoC 到生产”关键，推理与合规需求凸显IDC 在报告中强调，当前亚太地区企业 GenAI 采用率呈爆发式增长——65%的亚太企业将在 2025 年实现超 50 个 GenAI 场景投产，26%的企业甚至计划部署超 100 个场景。

10/20/2025 3:39:14 PM

云昭

CC成功的秘诀到底是什么？遵循Unix 哲学、核弹级生产力：我用ClaudeCode+Obsidian，造了一个“第二大脑”

编辑 | 听雨出品 | 51CTO技术栈（微信号：blog51cto）AI 工具千千万，但能让人上瘾的，只有 Claude Code。最近，小编关注到一篇拍案叫绝的文章——作者是 Alephic（一家以 AI 为核心的咨询公司）的联合创始人 Noah Brier。他坦言：“Claude Code 不只是一个写代码的工具，而是一种全新的操作系统思维。

10/20/2025 2:35:43 PM

听雨

MaskMol：知识引导的分子图像自监督学习框架，破解活性悬崖识别难题

作者丨论文团队编辑丨ScienceAI在药物发现领域，一个长期存在的挑战是活性悬崖（Activity Cliffs）现象，即两个分子结构高度相似但生物活性却存在显著差异，然而，由于传统方法在识别活性悬崖时，会出现表征坍塌的问题，因此仍然难以准确捕捉悬崖分子的细微差别。近日，湖南大学等团队在《BMC Biology》上发表了一项研究《MaskMol: knowledge-guided molecular image pre-training framework for activity cliffs with pixel masking》，这项研究开发了名为 MaskMol 的知识引导分子图像自监督预训练框架，该框架能通过细粒度知识引导的像素掩码策略进行准确的活性悬崖估计。活性悬崖与传统模型的局限分子性质预测是药物研发的核心环节，其核心假设是结构相似则性质相似（图 1 左）。

10/20/2025 11:56:00 AM

ScienceAI

高盛：人工智能热潮并非泡沫，才刚刚起步

10 月 19 日消息，尽管市场对人工智能（AI）泡沫的担忧日益加剧，但高盛（Goldman Sachs）认为，这场 AI 繁荣才刚刚拉开序幕。这家华尔街巨头的分析师指出，当前的投资规模与 AI 所能带来的潜在经济回报相比仍然较小。高盛分析师在周三发布的一份报告中写道：“生成式 AI 所承诺的巨大经济价值，足以支撑当前对 AI 基础设施的投资。

10/20/2025 9:51:38 AM

远洋

供应链中的代理人工智能应用是物流的未来

联合利华的人工智能系统通过分析天气数据来调整冰淇淋销售预测、优化库存并减少浪费。人工智能冰箱的数据已使某些地区的零售订单和销售额增长高达 30%。这些人工智能工具在瑞典等市场将预测准确率提高了 10%，从而能够更灵活地应对不断变化的天气模式。

10/20/2025 9:48:35 AM

晓晓

LLM的“记忆”与“推理”该分家了吗？一种全新的训练范式，彻底厘清思考流程

在医疗诊断中，模型误将“罕见病症状”与“常见病混淆”；在金融分析里，因记错政策条款给出错误投资建议——大语言模型（LLMs）的这些“失误”，本质上源于一个核心症结：记忆知识与逻辑推理的过程被死死绑定在黑箱中。当模型的思考既需要调用事实性知识，又要进行多步逻辑推导时，两种能力的相互干扰往往导致答案失真或决策失据。罗格斯大学、俄亥俄州立大学等团队发表于2025 ACL的研究《Disentangling Memory and Reasoning Ability in Large Language Models》，为破解这一难题提供了全新思路。

10/20/2025 9:33:49 AM

Goldma

全球第一！百度0.9B参数大模型碾压传统OCR！

最近有个感觉特别强烈：AI正在从"识别文字"悄然进化成"理解文档"。当我看到百度飞桨团队刚刚发布的PaddleOCR-VL在全球权威评测中以92.6分位列第一时，第一反应是——这个0.9B的"小家伙"，怎么就把那些动辄几十亿参数的巨无霸给比下去了？说实话，刚开始我也有点半信半疑。

10/20/2025 9:30:34 AM

阿丸笔记

开源对机器人的价值，远超大模型时代的想象丨唐文斌深度对谈抱抱脸创始人

“很多模型在模拟器里完美运行，但一到现实就彻底失灵。 ”在最新一次线上对谈中，Dexmal联合创始人唐文斌与Hugging Face联合创始人Thomas Wolf指出了当前机器人研究的最大痛点。唐文斌是旷视科技联合创始人兼CTO，原力灵机（Dexmal）CEO、清华大学“姚班”出身、首届“Yao Award”金牌得主。

10/20/2025 9:30:15 AM