AI在线 AI在线

理论

字节突然开源Seed-OSS,512K上下文碾压主流4倍长度!推理能力刷新纪录

字节跳动突发开源大模型,一出手就是360亿参数的Seed-OSS-36B。 图片这个Seed-OSS的命名方式,明显是在呼应OpenAI此前发布的GPT-OSS系列。 与OpenAI的开源策略也是一样,并没有直接开源核心商业模型豆包(Doubao),而是基于内部技术打造了一个专门面向开源社区的版本。
8/21/2025 10:59:42 AM

刚刚,GPT-5 Pro自证全新数学定理!OpenAI总裁直呼颠覆,大佬们集体转发

AI真的能解决人类的前沿问题吗? 比如类似庞加莱猜想、求解麦克斯韦方程、费马大定理、黎曼猜想等问题。 今天这个问题有了答案。
8/21/2025 10:11:44 AM

算力投入超阿波罗登月!Anthropic联创:Claude没有刷榜水军!CC击败Cursor、MCP成功,秘诀在于把模型当用户!

编辑 | 伊风出品 | 51CTO技术栈(微信号:blog51cto)Claude Code 为什么能在市场上战胜 Cursor? 对于创业者来说,如何在 API 之上构建自己的产品,又不担心被大模型干掉? 在最新一期播客里,Anthropic 联合创始人 Tom Brown 分享了 Claude Code 的成长故事。
8/21/2025 9:49:22 AM
伊风

三人团队击败科技巨头:RF-DETR如何成为目标检测新王者

说实话,当我看到一个仅3人团队打造的目标检测模型RF-DETR,居然能在性能上碾压Google、Meta等科技巨头的数百人研发团队时,第一反应是——这怎么可能? 但事实就是这么魔幻。 在刚刚发布的最新评测中,RF-DETR不仅成为首个在COCO数据集上突破60mAP的实时模型,更是在新发布的RF100-VL真实世界数据集上大幅领先YOLO、D-FINE等知名模型。
8/21/2025 9:29:18 AM
阿丸笔记

波士顿动力Atlas人形机器人再现逆天进化:通用AI机器人真的要来了

不是标题党,波士顿动力是真的很强,他们刚刚发布了一个视频,直接硬控我了,这是我目前看到过最震撼的人形机器人,看视频波士顿动力已经证明,可以训练出多任务、语言驱动的策略模型,来控制自家的 Atlas人形机器人完成那些既需要移动又需要灵巧全身操作的长期任务。 这种数据驱动的方法是通用的,几乎可以应用于任何能通过遥控操作演示的任务波士顿动力野心还是很大的,从一开始就想着构建通用人形机器人,波士顿动力认为未来的通用人形机器人,需要掌握一长串复杂的技能。 它们不仅要能灵巧地操作形态各异的物体(比如硬的/软的、重的/轻的、刚性的/铰接的、大的/小的),还需要协调整个身体来调整姿态、改造环境、躲避障碍,并在应对突发状况时保持平衡。
8/21/2025 9:15:00 AM

突破Agent长程推理效率瓶颈!MIT&新加坡国立联合推出强化学习新训练方法

AI Agent正在被要求处理越来越多复杂的任务。 但当它要不停地查资料、跳页面、筛选信息时,显存狂飙、算力吃紧的问题就来了。 针对这一难题,MIT和新加坡国立大学联合提出了MEM1框架。
8/21/2025 9:10:00 AM

OpenAI史上最大失误:放走这位MIT学霸!美国AI「三朝元老」,现实韦小宝

AI算力竞赛,比阿波罗更庞大,比曼哈顿更疯狂! Anthropic联合创始人Tom Brown直言,AI基础设施的规模超越阿波罗与曼哈顿计划。 AGI算力投入正疯狂膨胀,每年增速高达3倍。
8/21/2025 9:07:00 AM

奥特曼首曝GPT-6,亲口承认GPT-5「搞砸了」!接入大脑读心,估值或飙破5000亿

GPT-5还没捂热,奥特曼又来捧GPT-6了。 这几天,奥特曼在旧金山的采访中表示,「人们想要记忆功能,希望未来ChatGPT能让用户自定义语气和个性」。 虽未公布下一代AI模型的具体时间,但从奥特曼口中,可以感受出GPT-6确实不一样。
8/21/2025 9:05:00 AM

AIBrix v0.4.0 发布:P/D 解耦与专家并行支持、KVCache v1 连接器、KV 事件同步与多引擎支持

AIBrix项目作为大模型推理的可扩展且高性价比的技术方案,项目于2025 年 2 月 21 日正式开源,并通过vLLM 官方博客官宣,为 vLLM 推理引擎提供可扩展且高性价比的控制面。 开源 72 小时内,AIBrix 收获的 GitHub Star 数已超 1K,96 小时突破 2K;开源一周左右,AIBrix 保持在 GitHub trending[1]榜第一的位置。 目前 GitHub Star 已超过 4K,贡献者超过 70 人。
8/21/2025 9:02:56 AM
AIBrix团队

多元背景的“星星火种”,引燃鸿蒙开发深度探索热潮

在万物互联浪潮席卷全球的当下,一个全新的操作系统生态正在重塑智能世界的版图。 鸿蒙系统的演进历程,不仅见证了中国科技在操作系统领域的持续突破与创新,更为全球开发者打开了一个充满无限可能的新世界。 从最初的探索到如今的繁荣,鸿蒙生态已经完成了从技术突破到商业落地的华丽转身。
8/21/2025 8:50:00 AM

在无服务器架构中部署实时机器学习模型:平衡延迟、成本与性能

译者 | 晶颜审校 | 重楼机器学习(ML)在诸如欺诈检测和个性化推荐等实时应用中变得越来越重要。 由于其可扩展性以及消除了基础设施管理的工作量,这些应用对于在无服务器计算中部署极具吸引力。 然而,将机器学习模型部署到无服务器环境中面临着延迟、成本和性能方面的独特挑战。
8/21/2025 8:08:04 AM
晶颜

智能体防御 | 一文了解三种系统提示词加固方法

概述智能体的系统提示词加固是指通过优化,补充,约束系统提示词的内容和结构,增强其对模型“约束力”和“指导性”,让智能体在收到用户的请求时通过安全研判后来决定返回的内容,确保模型在复杂场景下行为可控、安全合规、效果稳定。 不同约束的效果可能因“模型类型”、“应用场景”而异,本方案旨在为系统提示词加固提供指导,确保约束在多种情境下的适用性。 系统提示词的加固效果受到多种因素的影响,例如“模型类型”、“系统提示词的长度”,“加固内容在系统提示词中的位置”以及“添加的加固类型数量”等。
8/21/2025 7:35:26 AM
字节跳动技术团队

Pydantic AI与MCP相逢

作为一个AI应用开发者,必须为客户构建健壮且结构良好的AI Agent。 Pydantic AI 作为一个健壮的框架彻底改变了开发人员构建、验证和部署 AI 应用程序的方式。 无论创建复杂的AI Agent,还是与MCP集成,Pydantic AI 提供了一个全面的解决方案,将 Pydantic 的可靠性与强大的AI特性相结合。
8/21/2025 7:07:49 AM
曹洪伟

Kubernetes成本持续攀升,AI能否带来转机?

容器化应用在云端为企业带来诸多优势,但该行业一个鲜为人知的秘密是,管理这些应用的成本却并非优势之一。 根据最近的一项调查,绝大多数使用Kubernetes进行容器编排的企业在过去一年中花费更多,如今许多企业正转向AI来帮助控制成本。 Kubernetes管理供应商Spectro Cloud的调查显示,约88%的受访者表示其总拥有成本在过去一年中有所增长,而92%的受访者表示正在投资基于AI的成本优化工具。
8/21/2025 7:02:00 AM
Grant

AI工具如何成为时间和成本的陷阱

周二下午2点,你本该在专心做重要项目,可实际上,过去三个小时你一直在测试在领英上发现的最新的AI工具。 “只是试试而已。 ”你这样想。
8/21/2025 7:00:00 AM
Mark

Nature子刊 | 上智院统一框架RXNGraphormer,实现化学反应多任务精准预测,自发掌握分类规律

编辑丨ScienceAI人工智能正在重塑精准有机合成的未来,但反应性能预测(数值回归)与合成路线规划(序列生成)之间固有的方法差异,一直是构建统一深度学习架构的挑战。 针对这一难题,上海科学智能研究院(下称上智院)物质科学团队提出了一种名为 RXNGraphormer 的新型深度学习框架。 该框架通过整合图神经网络(GNN)与 Transformer 模型,成功实现了对化学反应活性、选择性以及单步正向与逆向合成的精准预测。
8/20/2025 2:05:00 PM
ScienceAI

首个面向肽分子设计的大模型平台:直接「读序列」出结合子,无需结构输入即可生成

编辑丨%看病就医,医生会先进行诊断,在了解病症的基础上,给出治疗建议。 传统药物设计也遵循类似的逻辑——建立在对病原体或疾病机制的了解之上。 现在,AI 带来了一种出乎意料的突破:就像无需看病直接吃药一样,它能够设计出粘附并分解体内有害蛋白质的小分子,即使科学家完全不清楚这些蛋白质的结构与形态。
8/20/2025 2:04:00 PM
ScienceAI

记忆即推理:ComoRAG的认知循环如何重塑长文本理解

大家好,我是肆〇柒。 在长篇小说和叙事文本的理解领域,一个核心挑战始终存在:如何让AI系统像人类一样,不仅捕捉离散的线索,还能构建和更新对复杂情节线和动态演变的角色关系的连贯理解? 传统检索增强生成(Retrieval-Augmented Generation, RAG)方法虽然在长上下文处理中扮演重要角色,但其"无状态"的单步检索过程往往导致对矛盾证据的整合失败,产生浅层理解。
8/20/2025 1:24:54 PM
肆零柒