AI在线 AI在线

EM

十步优化超越强化学习,仅需1条未标注数据!后训练强势破局

在具备强大的通用性能之后,当下大模型的研究方向已经转向了「如何解决特定且复杂的推理任务」,比如数学问题、分析物理现象或是构建编程逻辑。 要想达到更高的性能,除了海量文本的预训练之外,往往还需要进一步的后训练。 主流后训练方法是采用强化学习(RL),特别是结合可验证奖励的强化学习(RLVR)。
6/5/2025 2:33:00 AM
新智元

吉利发布雷神EM-i超级电混,率先将AI技术应用到动力领域

10月30日,吉利汽车集团正式发布全球新一代超级电混——雷神EM-i超级电混。 雷神EM-i超级电混是吉利基于高性能电混的技术体系,汇集全球动力和AI科技,面向市场主流用户开发的全新一代极致节能的超级电混。 凭借在混动电驱、高效燃烧、智能AI、冗余安全等多个技术领域的创新,雷神EM-i超级电混在传承雷神电混高性能基础的同时,实现行业领先的超强节能、无损电感、冗余安全、智能AI和可靠品质,是“真电感、真安全、真智能”的全球新一代超级电混。
10/31/2024 2:54:00 PM
新闻助手
  • 1