大模型训练
OpenAI 收购 Neptune,实验监控神器入栈,GPT迭代速度或将翻倍
12 月 3 日,OpenAI 宣布与实验管理初创公司 Neptune 签署最终收购协议,交易金额未披露。 Neptune 将分阶段停止对外服务,其监控与调试工具未来几个月内深度集成至 OpenAI 训练技术栈,为模型迭代提供更细粒度的实时可见性 。 OpenAI 首席科学家 Jakub Pachocki 表示,Neptune 构建的“快速、精准系统”可帮助研究人员分析复杂训练流程,双方计划共同迭代,将实验追踪、对比与自动化警报能力嵌入自研基础设施 。
月之暗面公开RL训练加速方法:训练速度暴涨97%,长尾延迟狂降93%
鹭羽 发自 凹非寺. 量子位 | 公众号 QbitAIu1s1,现在模型能力是Plus了,但Rollout阶段的速度却越来越慢……. 于是月之暗面出手了:爆改RL训练速度,让LLM“越跑越快”!
AI训练师必看!5个章节带你快速掌握RAG检索增强项目
在 AI 应用日益深入的今天,RAG(Retrieval-Augmented Generation)正成为提升模型实用性的关键技术。 本文将从 AI 训练师的视角出发,系统拆解 RAG 的核心机制、应用场景与训练要点,帮助你在构建高质量智能体时少走弯路、精准发力。 今天我向大家介绍检索增强也就是 RAG,在公司里面也是一个独立的项目,并且有自己的考核指标。
新手必看!AI训练师必须掌握的大模型训练流程
你知道 ChatGPT 背后到底经历了哪些训练流程吗? AI 训练师在其中扮演了什么角色? 本篇文章用最接地气的方式,拆解大模型训练的三大阶段,带你看懂那些“看不见的幕后工程”。
重磅发布!中文互联网基础语料3.0助力AI发展,数据量高达120GB
9月18日,在昆明举行的2025年国家网络安全宣传周人工智能安全治理分论坛上,中文互联网基础语料3.0正式发布。 这一新版本的数据量达到了惊人的120GB,旨在为大模型训练和人工智能的进一步发展提供可靠的数据支持。 中文互联网基础语料3.0的发布,是在中央网信办的指导下,由中国网络空间安全协会与国家互联网应急中心等单位协同合作的成果。
中国联通发布全球最长距离大模型异构混训成果:超 1500 公里跨域,仅损失不到 5% 算力
AI在线 7 月 20 日消息,在 2025 中国联通合作伙伴大会期间,中国联通研究院联合上海人工智能实验室等合作伙伴,于 7 月 19 日正式发布了全球最长距离大模型异构混训试验成果。 随着人工智能技术的高速发展和大模型时代的加速来临,模型训练对算力基础设施的高吞吐、低时延、高性能提出了更高要求。 然而,当前算力资源呈现出异构化和多中心化的格局,面临着跨域资源互联互通机制不健全、长距离传输存在带宽与时延瓶颈、异构资源统一调度与高效融合能力有限等挑战。
资讯热榜
标签云
AI
人工智能
OpenAI
AIGC
模型
ChatGPT
谷歌
DeepSeek
AI新词
AI绘画
大模型
机器人
数据
Midjourney
开源
Meta
微软
智能
用户
GPT
学习
英伟达
Gemini
智能体
技术
马斯克
Anthropic
图像
AI创作
训练
LLM
论文
AI for Science
代码
腾讯
苹果
算法
Agent
Claude
芯片
具身智能
Stable Diffusion
xAI
蛋白质
人形机器人
开发者
生成式
神经网络
机器学习
AI视频
3D
字节跳动
大语言模型
RAG
Sora
百度
研究
GPU
生成
华为
工具
AGI
计算
生成式AI
AI设计
大型语言模型
搜索
亚马逊
AI模型
视频生成
特斯拉
DeepMind
场景
Copilot
深度学习
Transformer
架构
MCP
编程
视觉