大模型训练

OpenAI 收购 Neptune,实验监控神器入栈，GPT迭代速度或将翻倍

OpenAI 收购 Neptune,实验监控神器入栈，GPT迭代速度或将翻倍

12 月 3 日，OpenAI 宣布与实验管理初创公司 Neptune 签署最终收购协议，交易金额未披露。 Neptune 将分阶段停止对外服务，其监控与调试工具未来几个月内深度集成至 OpenAI 训练技术栈，为模型迭代提供更细粒度的实时可见性。 OpenAI 首席科学家 Jakub Pachocki 表示，Neptune 构建的“快速、精准系统”可帮助研究人员分析复杂训练流程，双方计划共同迭代，将实验追踪、对比与自动化警报能力嵌入自研基础设施。

12/4/2025 10:11:30 AM AI在线

月之暗面公开RL训练加速方法：训练速度暴涨97%，长尾延迟狂降93%

月之暗面公开RL训练加速方法：训练速度暴涨97%，长尾延迟狂降93%

鹭羽发自凹非寺. 量子位 | 公众号 QbitAIu1s1，现在模型能力是Plus了，但Rollout阶段的速度却越来越慢……. 于是月之暗面出手了：爆改RL训练速度，让LLM“越跑越快”！

11/27/2025 4:07:12 PM 鹭羽

AI训练师必看！5个章节带你快速掌握RAG检索增强项目

AI训练师必看！5个章节带你快速掌握RAG检索增强项目

在 AI 应用日益深入的今天，RAG（Retrieval-Augmented Generation）正成为提升模型实用性的关键技术。本文将从 AI 训练师的视角出发，系统拆解 RAG 的核心机制、应用场景与训练要点，帮助你在构建高质量智能体时少走弯路、精准发力。今天我向大家介绍检索增强也就是 RAG，在公司里面也是一个独立的项目，并且有自己的考核指标。

11/18/2025 12:01:32 AM 小五-

新手必看！AI训练师必须掌握的大模型训练流程

新手必看！AI训练师必须掌握的大模型训练流程

你知道 ChatGPT 背后到底经历了哪些训练流程吗？ AI 训练师在其中扮演了什么角色？本篇文章用最接地气的方式，拆解大模型训练的三大阶段，带你看懂那些“看不见的幕后工程”。

11/14/2025 5:38:42 AM 小五-

重磅发布！中文互联网基础语料3.0助力AI发展，数据量高达120GB

重磅发布！中文互联网基础语料3.0助力AI发展，数据量高达120GB

9月18日，在昆明举行的2025年国家网络安全宣传周人工智能安全治理分论坛上，中文互联网基础语料3.0正式发布。这一新版本的数据量达到了惊人的120GB，旨在为大模型训练和人工智能的进一步发展提供可靠的数据支持。中文互联网基础语料3.0的发布，是在中央网信办的指导下，由中国网络空间安全协会与国家互联网应急中心等单位协同合作的成果。

9/18/2025 6:26:24 PM AI在线

中国联通发布全球最长距离大模型异构混训成果：超 1500 公里跨域，仅损失不到 5% 算力

中国联通发布全球最长距离大模型异构混训成果：超 1500 公里跨域，仅损失不到 5% 算力

AI在线 7 月 20 日消息，在 2025 中国联通合作伙伴大会期间，中国联通研究院联合上海人工智能实验室等合作伙伴，于 7 月 19 日正式发布了全球最长距离大模型异构混训试验成果。随着人工智能技术的高速发展和大模型时代的加速来临，模型训练对算力基础设施的高吞吐、低时延、高性能提出了更高要求。然而，当前算力资源呈现出异构化和多中心化的格局，面临着跨域资源互联互通机制不健全、长距离传输存在带宽与时延瓶颈、异构资源统一调度与高效融合能力有限等挑战。

7/20/2025 9:24:29 AM 汪淼

资讯热榜

免费！让图片放大不失真的位图转矢量图神器 Tmttool AI应用新纪元：2025中国AI应用排行榜榜单揭晓丨2025年1月 6秒视频10秒生成！全新AI视频神器 Grok Imagine 深度体验+元提示词分享最火、最全的Agent记忆综述，NUS、人大、复旦、北大等联合出品后悔没早发现！教你用谷歌Gemini生成精美PPT（附提示词） GGUF 是什么？一文看懂大模型里最火的模型格式 Sora、可灵、即梦哪家强？AI视频软件深度测评！ Mac也能跑Qwen3，一文看懂本地部署qwen 3配置要求

标签云

AI 人工智能 OpenAI AIGC 模型 ChatGPT 谷歌 DeepSeek AI新词 AI绘画大模型机器人数据 Midjourney 开源 Meta 微软智能用户 GPT 学习英伟达 Gemini 智能体技术马斯克 Anthropic 图像 AI创作训练 LLM 论文 AI for Science 代码腾讯苹果算法 Agent Claude 芯片具身智能 Stable Diffusion xAI 蛋白质人形机器人开发者生成式神经网络机器学习 AI视频 3D 字节跳动大语言模型 RAG Sora 百度研究 GPU 生成华为工具 AGI 计算生成式AI AI设计大型语言模型搜索亚马逊 AI模型视频生成特斯拉 DeepMind 场景 Copilot 深度学习 Transformer 架构 MCP 编程视觉