AI在线 AI在线

理论

通用LLM压缩算法,居然藏视频编码里!2.5bit实现4bit性能,硬件无缝支持

在大模型的发展历程中,提升参数规模已被多次证明是提升模型智能的最有效手段之一。 然而,随着模型参数量的增加,GPU内存容量和互联带宽已成为限制未来更大规模模型训练和部署的主要瓶颈。 在有限的硬件资源下,如何更有效地训练和推理更大规模的模型,已成为一个备受关注且具有显著经济价值的课题。
9/5/2025 9:15:00 AM

「纳米香蕉」LMArena两周500万投票,引爆10倍流量!谷歌、OpenAI扎堆打擂台

今年8月,一款名为「纳米香蕉」的神秘AI图像编辑器轻松登顶Image Edit Arena榜首,直接把LMArena8月份的平台流量拉爆:流量暴增10倍,月活300万 。 该模型自在LMArena启动盲测以来,短短两周便吸引了超过500万次总投票,并单独赢得了250万 直接投票,创下历史最高参与度。 nano‑banana的神秘身份,也在LMArena社区引发广泛猜测。
9/5/2025 9:14:00 AM

字节开源图像生成“六边形战士”,一个模型搞定人物/主体/风格保持

图像生成中的多指标一致性问题,被字节团队解决了! 字节UXO团队设计并开源了统一框架USO,让看上去不关联的任务相互促进,实现风格迁移和主体保持单任务和组合任务的SOTA。 USO通过单一框架能统一之前那些看似孤立的任务包括主体、身份保持和风格化编辑,参考图风格迁移,同时保持主体和风格参考,甚至更抽象复杂的多风格迁移,是实打实的六边形战士。
9/5/2025 9:07:00 AM

Claude Code之父最新访谈揭秘:Claude Code 迭代靠的是直觉「附个人独家使用秘笈」

Claude Code 项目负责人Boris Cherny内部最新访谈,和最顶级的大佬学习Claude Code,比你看多少碎片化的信息都强Boris Cherny 作为Claude Code 创造者 和 Alex Albert (Claude Relations 负责人) 深入详细的讨论智能体编程的实用化、背后模型的演进过程、直觉驱动的Claude Code 迭代,以及 Claude Code 的设计哲学其中Boris首次揭秘的直觉驱动的Claude Code 迭代非常有意思,原来Claude Code这个神器开发并不是依靠什么基准测试而是内部构建的“直觉系统”Boris认为如果你未来要当软件工程师,基本的计算机编程知识和coding技能仍然是必须的,只有懂“手艺 ”的人,才能更好地驾驭和指导 AI 这个强大的工具! 软件工程师的未来将向更高层次的抽象演进,更侧重于目标设定、系统设计和创意实现访谈最后Boris 还给出了如何高效使用 Claude Code独家秘笈和最佳实践整个访谈20分钟,以下是访谈的核心内容仅一年时间Agentic Coding (智能体编程)走向实用在探讨智能体编程的未来之前,我们有必要先回顾一下它在短时间内所经历的剧烈演变。
9/5/2025 9:06:10 AM

OpenAI盯上苹果开发者生态,吞了家AI编程公司

OpenAI又吞下一家初创公司,这次是AI编程方向。 这家公司名为Alex,专注于为iOS开发者打造AI辅助工具——简单来说,他们的产品就是苹果Xcode量身定制版Cursor,将智能助手直接集成到了Xcode开发环境中,填补了苹果自身的空缺。 Alex官网和创始人𝕏都已挂出公告,宣布即将加入OpenAI Codex团队。
9/5/2025 9:05:00 AM

Hinton突然对AGI乐观了!“Ilya让他看到了什么吧…”

Hinton突然对AGI变乐观了。 对于AI,他几周前还觉得是养虎为患,最新采访却改口说是一种母亲和婴儿之间的亲密共生关系。 大多数专家认为5-10年后人工智能会比人类更聪明。
9/5/2025 9:04:00 AM

DeepSeek正开发高级AI Agent模型,硬刚OpenAI

彭博消息,DeepSeek正在开发一款更高级的AI Agent模型,皆在与OpenAI等美国企业竞争。 据知情人士透露,这款AI Agent可在用户指令极少的情况下,帮助用户执行多步骤任务。 他们补充称,该系统还能基于自身过往行动进行学习并持续优化。
9/5/2025 9:03:46 AM

AI也邪修!Qwen3改Bug测试直接搜GitHub,太拟人了

大模型也会玩信息差了。 Qwen3在基准测试中居然学会了钻空子。 FAIR研究员发现Qwen3在SWE-Bench Verified测试中,不按常理修bug,反而玩起了信息检索大法。
9/5/2025 9:02:00 AM

DeepSeek大招曝光?梁文锋督战超级智能体:能自主学习,或年底发布

DeepSeek再次叫板OpenAI? 就在今天,彭博社爆料出重磅内幕消息:DeepSeek憋了一个超级大招——真正的AI智能体(AI Agent)! DeepSeek R1过去的开源之王今年1月,DeepSeek R1模型以仅数百万美元的成本,在多项基准测试中,实现了对标甚至超越OpenAI顶尖产品的表现。
9/5/2025 9:01:40 AM

从"调用工具"到"思考策略":Chain-of-Agents实现智能体技术的临界点突破

大家好,我是肆零柒。 今天,我们一起来了解一篇由OPPO AI Agent Team研究的论文。 这项工作名为Chain-of-Agents(CoA),它不只是一个新的AI框架,更是一次对"智能体"本质的深刻探索。
9/5/2025 9:00:43 AM
肆零柒

AI生成苹果Metal内核,PyTorch推理速度提升87%

AI自动生成的苹果芯片Metal内核,比官方的还要好? Gimlet Labs的最新研究显示,在苹果设备上,AI不仅能自动生成Metal内核,还较基线内核实现了87%的PyTorch推理速度提升。 更惊人的是,AI生成的Metal内核还在测试的215个PyTorch模块上实现了平均1.87倍的加速,其中一些工作负载甚至比基准快了数百倍。
9/5/2025 9:00:00 AM

83岁用DeepSeek抢单,96岁凭AI挣养老钱!这群80+老人比你还会玩AI

存款60美元,欠款15000美元。 82岁的Luis Bautista仍要为养老努力工作。 他创办的科技公司,他对AI的学习热情,在推动他前行。
9/5/2025 8:57:00 AM

三大AI无法取代的人类技能,正成为供应链竞争力的关键​

AI正在深刻改变供应链,它提升了效率,简化了日常操作,但在某些关键时刻,人类的专业经验、创造力与同理心依然不可或缺。 在现代货运战略中,目标已不再只是削减成本,而是构建韧性。 在瞬息万变的贸易环境中,韧性的起点是货物落地后的流转方式。
9/5/2025 7:19:00 AM

谷歌“蕉”傲登场!AI生图告别“走钟”时代

嘿,各位AI圈的朋友们,最近有没有被一个叫做“Nano Banana”的名字刷屏? 别误会,这可不是什么新型水果,而是谷歌在2025年8月底丢下的一枚重磅炸弹——正式名称为Gemini 2.5 Flash Image的AI图像生成与编辑模型。 说它是“炸弹”一点不为过,因为它似乎在悄悄地,或者说,是大张旗鼓地,改写着我们对AI生图的认知。
9/5/2025 2:11:00 AM
墨风如雪

理论到实战,高可用架构踩坑说明书

在构建高可用系统时,开发者常常面临应用、数据库、缓存、消息队列等多维度的挑战。 本文结合京东真实技术场景,系统梳理高可用架构实践中常见的技术陷阱与解决方案,深入剖析每个技术组件的可用性保障要点。 旨在为工程师提供一套踩坑说明书,帮助团队在系统设计阶段规避潜在风险,提升线上系统的稳定性和容错能力。
9/5/2025 1:25:00 AM

K8s中明明配置了HPA,但是没扩容

Kubernetes 的 Horizontal Pod Autoscaler(HPA)是一种根据观察到的 CPU 利用率或其他自定义指标自动扩展 Pod 副本数的控制器。 它在业务繁忙的时候可以有效的对 Pod 进行横线扩展,但是最近发现明明使用率已经超过了定义的目标值,但是为何没有扩容呢? 9906771bea31d64adb2a89a2f2b88207 MD5为了搞清楚原由,我们从源码层面来找找原因。
9/5/2025 1:22:00 AM

再见,数据标注!腾讯发布R-Zero框架,让AI自己训练自己

一个不再依赖人类数据标注的大模型训练框架,它来了! 由腾讯AI Lab与美国圣路易斯华盛顿大学联合开发的新框架“R-Zero”,成功展示出大语言模型(LLM)如何靠自己训练自己,不再需要人类提供任务或答案。 图片论文地址:,是彻底摆脱人类标注数据的依赖,靠模型之间的博弈,自动生成、筛选和吸收新的训练内容。
9/5/2025 12:00:05 AM

系统梳理 Test-Time Compute 的主要实现路径

当前大语言模型(LLM)最有趣的研究趋势之一,是推理模型的兴起 —— 这类模型在给出答案前会花费时间进行思考。 这种技术通常被称为「测试时计算」(test-time compute),即在推理阶段进行深度推理。 其实在模型推理过程中应用搜索或深度推理的思路早已存在(例如 AlphaZero[1],以及 Transformer 诞生之前就尝试用类似方法解决旅行商问题的论文[2]),但 o1 的出现让这一理念重新回到了主流视野。
9/4/2025 5:16:59 PM