LN
英伟达新开源模型 Llama-Nemotron 震撼发布,推理性能超越 DeepSeek-R1
近日,英伟达正式推出了其最新开源模型系列 ——Llama-Nemotron,该系列模型不仅在推能力上超越了 DeepSeek-R1,更是在内存效率和吞吐量上实现了显著提升。 根据最新发布的技术报告,Llama-Nemotron 的训练过程与众不同,采用了合成数据监督微调与强化学习的方法,以全方位提升模型的推理能力。 Llama-Nemotron 系列模型包括 LN-Nano8B、LN-Super49B 和 LN-Ultra253B。
5/7/2025 10:01:04 AM
AI在线
归一化提高预训练、缓解梯度不匹配,Facebook的模型超越GPT-3
来自 Facebook AI 的研究者提出了 NormFormer,该模型能够更快地达到目标预训练的困惑度,更好地实现预训练困惑度和下游任务性能。
10/27/2021 4:53:00 PM
机器之心
- 1
资讯热榜
标签云
人工智能
OpenAI
AI
AIGC
ChatGPT
DeepSeek
AI绘画
模型
数据
机器人
谷歌
大模型
Midjourney
智能
用户
开源
学习
微软
GPT
Meta
图像
AI创作
技术
Gemini
论文
马斯克
Stable Diffusion
算法
芯片
蛋白质
生成式
代码
英伟达
腾讯
神经网络
研究
Anthropic
计算
3D
Sora
AI设计
开发者
机器学习
AI for Science
GPU
AI视频
场景
苹果
华为
人形机器人
预测
百度
伟达
Transformer
深度学习
Claude
搜索
xAI
大语言模型
模态
字节跳动
驾驶
具身智能
神器推荐
文本
训练
LLaMA
Copilot
视觉
算力
安全
应用
视频生成
干货合集
智能体
大型语言模型
亚马逊
科技
AGI
API