AI在线 AI在线

理论

AI爆发不会带来GDP爆涨!AI大神罕见暴论:强化学习糟透了!互联网数据很烂!曝未来新训练范式:反思型监督、预训练是一场劣质进化

编辑 | 云昭出品 | 51CTO技术栈(微信号:blog51cto)“现在的互联网训练数据烂到离谱! ”“强化学习远比人们想象要糟糕得多! ”“AGI 仍然还有十年之遥!
10/18/2025 8:43:14 PM
云昭

推理提速4倍!莫纳什、浙大提出动态拼接,大小模型智能协作

近两年,思维链(Chain-of-Thought, CoT)推理让大语言模型在复杂推理任务上展现出前所未有的能力——从数学解题到逻辑分析,表现令人惊叹。 然而,这种强大的推理能力也带来了一个长期存在的挑战:推理过程过于缓慢。 每生成一个 token,模型都要完整算一遍前向传播。
10/17/2025 5:50:01 PM

GPT-5 Pro惊现「神之一手」,30分钟攻克黑洞难题!

OpenAI真的要放大招了! 今天,黑洞理论物理学家Alex Lupsasca官宣入职,正式成为OpenAI新成立的「科学团队」的一员。 曾经,Alex一直认为AI离科研前沿遥不可及,直到他亲眼见证了GPT-5 Pro的惊人能力——它在短短30分钟内,竟破解了困扰Alex数日的「黑洞微扰」理论难题!
10/17/2025 5:49:11 PM

即将出台的AI法规让企业IT负责人担忧高额合规罚款

Gartner最近的一项调查显示,超过70%的IT领导者将法规合规性列为与GenAI部署相关的三大挑战之一。 调查还指出,不到四分之一的IT领导者对其所在企业在使用GenAI时管理安全和治理问题(包括法规合规性)的能力非常有信心。 Gartner的高级总监分析师莉迪亚·克劳赫蒂·琼斯(Lydia Clougherty Jones)表示,IT领导者似乎担心要遵守越来越多的AI法规,包括一些可能相互冲突的法规。
10/17/2025 5:47:45 PM
Grant Gross

AI生图领域格局生变:谷歌Nano Banana崛起,Adobe Firefly遇冷

《商业内幕》近日援引分析公司 Appfigures 数据指出,谷歌最新 AI 生图模型 “Nano Banana” 已对 Adobe 构成明显威胁,这场来自 AI 领域的竞争,正悄然改写图像编辑软件市场的格局。 今年 8 月前,Adobe 的生成式 AI图像和视频应用 Firefly 还保持着强劲增长势头。 自 6 月上线后,Firefly 用户认可度持续攀升,8 月下载量较 7 月激增 .
10/17/2025 5:47:02 PM
小菲

AI圈正陷入命名地狱!Claude Skills上线,却遭开发者集体吐槽:LLM生态要爆炸了!

编辑 | 听雨出品 | 51CTO技术栈(微信号:blog51cto)还记得当年大家调侃 ChatGPT:“它什么都会,就是不会干正事。 ”现在,Anthropic 把 Claude 往前推了一大步——它不仅能「干活」,还开始「学技能」。 今天,Anthropic 发布全新功能 Claude Skills,让 Claude 能调用特定“技能”完成专业任务。
10/17/2025 4:17:43 PM
听雨

AICoding减慢了软件交付!旧金山创始人警告:AI改变了节奏,压力更大!团队七成时间耗在外环;AI泡沫非坏事;解决问题是关键

编辑 | 云昭出品 | 51CTO技术栈(微信号:blog51cto)“AI是未来的新生产力,但现在还是差点意思。 ”我们看到越来越多的AI Coding产品,但不管是企业高管、还是我们评论区的开发大佬,近期都不约而同的抛出了一个业内真相:“我们确实在用AI写代码,但速度并没有更快。 ”“我们只是写出了更多代码,却没能更快交付!
10/17/2025 3:31:00 PM
云昭

用AI精准操控聚变,Google DeepMind宣布与CFS合作,有望将聚变能源带入现实

编辑丨coisini众所周知,聚变能带来清洁丰沛的能源,且不会产生长效放射性废物。 要在地球上实现聚变,就需要使电离气体(即等离子体)在超过 1 亿摄氏度的极端环境下,稳定存在于聚变装置的约束场中。 这个高度复杂的物理难题,Google DeepMind 尝试用人工智能攻克。
10/17/2025 2:51:00 PM
ScienceAI

0.9B问鼎SOTA 文心4.5衍生模型PaddleOCR-VL发布并开源

10月16日晚,百度正式发布并开源自研多模态文档解析模型PaddleOCR-VL。 在全球权威文档解析评测榜单OmniBenchDoc V1.5中,PaddleOCR-VL以92.6分取得综合性能全球第一成绩,四大核心能力(文本、表格、公式、阅读顺序)全线SOTA,超越. GPT-4o、Gemini-2.5 Pro、Qwen2.5-VL-72B等主流多模态大模型,以及MonkeyOCR-Pro-3B、MinerU2.5、dots.ocr等OCR专业模型,刷新全球OCR VL模型性能天花板。
10/17/2025 10:55:45 AM

Mamba 架构上顶会ICLR 2026,AI大脑核心Transformer的王座还能坐稳吗?

Transformer统治了AI大模型领域。 有人认为,实现AGI,Transformer就够了! 还有人认为,还需要几次底层架构革新。
10/17/2025 10:23:00 AM

打败 Qwen2.5-VL,完全开源可复现 LLaVA-OneVision-1.5 的多模态模型

一个完全开源多模态模型,全面超越 Qwen2.5-VL。 LLaVA(Large Language and Vision Assistant,大型语言与视觉助手)的故事,是开源社区用两年时间,真正复现出一个顶级的多模态模型的拼搏史。 23年4月,一个名为 LLaVA 的开创性工作横空出世。
10/17/2025 10:03:23 AM

谷歌142页报告首发揭秘:90%码农每天用AI超2小时!

十年来,Google Cloud的DORA报告一直被视为观察全球软件团队的风向标。 而2025年这份新报告,把焦点放在了一个前所未有的主题上——AI已经全面渗透开发流程。 近五千名技术从业者的调研结果表明,AI不再是尝鲜,而是主流。
10/17/2025 9:59:28 AM

KV Cache直连:LLM协作的"神经突触"式通信革命

大家好,我是肆〇柒。 今天我们一起阅读一项有趣的创新性研究——由清华大学、上海交通大学、香港中文大学与上海人工智能实验室联合提出的Cache-to-Cache通信技术。 这项研究打破了传统LLM间必须通过文本进行通信的局限,让大语言模型能够像人类大脑神经元通过突触直接传递信号一样,通过KV Cache实现表征层的语义直连。
10/17/2025 9:58:36 AM
肆零柒

RL微调,关键在前10%奖励!基于评分准则,Scale AI等提出新方法

让大模型按照人类意图行事,一直是AI领域的核心挑战。 目前主流的强化学习微调(RFT)方法虽然有效,但存在一个致命弱点:奖励过度优化(reward over-optimization)。 奖励过度优化是大模型对齐的「阿喀琉斯之踵」。
10/17/2025 9:56:05 AM

李飞飞全新「世界模型」问世!单张H100实时生成3D永恒世界

就在刚刚,李飞飞World Labs重磅发布全新实时生成式世界模型——RTFM(Real-Time Frame Model,实时帧模型)! 这是一款效率极高的,在大型视频数据上进行端到端训练的自回归扩散Transformer模型。 仅需一块H100 GPU,RTFM就能在你与之交互时,实时渲染出持久且3D一致的世界,无论是真实场景还是想象空间。
10/17/2025 9:53:23 AM

动作波动率降低70%!清华发布工业控制专用神经网络模型 | TIV'25

深度强化学习在机器人控制 、自动驾驶等复杂决策任务中取得了巨大成功([2])。 然而,传统强化学习算法训练出的策略网络往往对观测噪声和外部扰动十分敏感,导致输出的动作信号缺乏平滑性([3-5])。 现有的平滑方法大多从时域入手,例如设计与任务高度耦合的奖励函数、对网络施加复杂的正则化约束、或构建分层策略等。
10/17/2025 9:36:45 AM
新智元

LangGraph如何提升Agent可靠性的秘密:human-in-the-loop

LangGraph的创始人在最近的一次技术分享中说:"Human-in-the-loop不只是一个功能,它是AI系统从工具变成伙伴的关键转折点。 "这句话让我想了很久。 说实话,刚开始接触LangGraph的时候,我对这个"人机交互"功能还挺困惑的。
10/17/2025 9:17:19 AM
阿丸笔记

如何在UNSW-NB15数据集上使用去噪自编码器进行零日攻击检测

译者 | 李睿审校 | 重楼零日攻击是当前网络安全领域最具破坏性的威胁之一,它们利用此前未发现的漏洞入侵,能够绕过现有的入侵检测系统(IDS)。 传统的基于签名的入侵检测系统(IDS)依赖于已知攻击模式构建防御规则,因此在此类攻击面前往往失效。 为了检测这种零日攻击,人工智能模型需要了解正常的网络行为模式,并自动识别并标记偏离正常模式的异常行为。
10/17/2025 9:00:00 AM
李睿