AI在线 AI在线

大模型训练

OpenAI 收购 Neptune,实验监控神器入栈,GPT迭代速度或将翻倍

OpenAI 收购 Neptune,实验监控神器入栈,GPT迭代速度或将翻倍

12 月 3 日,OpenAI 宣布与实验管理初创公司 Neptune 签署最终收购协议,交易金额未披露。 Neptune 将分阶段停止对外服务,其监控与调试工具未来几个月内深度集成至 OpenAI 训练技术栈,为模型迭代提供更细粒度的实时可见性 。 OpenAI 首席科学家 Jakub Pachocki 表示,Neptune 构建的“快速、精准系统”可帮助研究人员分析复杂训练流程,双方计划共同迭代,将实验追踪、对比与自动化警报能力嵌入自研基础设施 。
12/4/2025 10:11:30 AM AI在线
月之暗面公开RL训练加速方法:训练速度暴涨97%,长尾延迟狂降93%

月之暗面公开RL训练加速方法:训练速度暴涨97%,长尾延迟狂降93%

鹭羽 发自 凹非寺. 量子位 | 公众号 QbitAIu1s1,现在模型能力是Plus了,但Rollout阶段的速度却越来越慢……. 于是月之暗面出手了:爆改RL训练速度,让LLM“越跑越快”!
11/27/2025 4:07:12 PM 鹭羽
AI训练师必看!5个章节带你快速掌握RAG检索增强项目

AI训练师必看!5个章节带你快速掌握RAG检索增强项目

在 AI 应用日益深入的今天,RAG(Retrieval-Augmented Generation)正成为提升模型实用性的关键技术。 本文将从 AI 训练师的视角出发,系统拆解 RAG 的核心机制、应用场景与训练要点,帮助你在构建高质量智能体时少走弯路、精准发力。 今天我向大家介绍检索增强也就是 RAG,在公司里面也是一个独立的项目,并且有自己的考核指标。
11/18/2025 12:01:32 AM 小五-
新手必看!AI训练师必须掌握的大模型训练流程

新手必看!AI训练师必须掌握的大模型训练流程

你知道 ChatGPT 背后到底经历了哪些训练流程吗? AI 训练师在其中扮演了什么角色? 本篇文章用最接地气的方式,拆解大模型训练的三大阶段,带你看懂那些“看不见的幕后工程”。
11/14/2025 5:38:42 AM 小五-
重磅发布!中文互联网基础语料3.0助力AI发展,数据量高达120GB

重磅发布!中文互联网基础语料3.0助力AI发展,数据量高达120GB

9月18日,在昆明举行的2025年国家网络安全宣传周人工智能安全治理分论坛上,中文互联网基础语料3.0正式发布。 这一新版本的数据量达到了惊人的120GB,旨在为大模型训练和人工智能的进一步发展提供可靠的数据支持。 中文互联网基础语料3.0的发布,是在中央网信办的指导下,由中国网络空间安全协会与国家互联网应急中心等单位协同合作的成果。
9/18/2025 6:26:24 PM AI在线
中国联通发布全球最长距离大模型异构混训成果:超 1500 公里跨域,仅损失不到 5% 算力

中国联通发布全球最长距离大模型异构混训成果:超 1500 公里跨域,仅损失不到 5% 算力

AI在线 7 月 20 日消息,在 2025 中国联通合作伙伴大会期间,中国联通研究院联合上海人工智能实验室等合作伙伴,于 7 月 19 日正式发布了全球最长距离大模型异构混训试验成果。 随着人工智能技术的高速发展和大模型时代的加速来临,模型训练对算力基础设施的高吞吐、低时延、高性能提出了更高要求。 然而,当前算力资源呈现出异构化和多中心化的格局,面临着跨域资源互联互通机制不健全、长距离传输存在带宽与时延瓶颈、异构资源统一调度与高效融合能力有限等挑战。
7/20/2025 9:24:29 AM 汪淼