AI在线 AI在线

源 Yuan 3.0 Flash 多模态基础大模型开源发布:40B 参数规模,单次推理仅激活约 3.7B

AI在线 12 月 31 日消息,浪潮旗下 YuanLab.ai 团队 12 月 30 日开源发布源 Yuan 3.0 Flash 多模态基础大模型。 Yuan 3.0 Flash 是一款 40B 参数规模的多模态基础大模型,采用稀疏混合专家(MoE)架构,单次推理仅激活约 3.7B 参数。 Yuan 3.0 Flash 提出和采用了强化学习训练方法(RAPO),通过反思抑制奖励机制(RIRM),从训练层面引导模型减少无效反思,在提升推理准确性的同时,大幅压缩了推理过程的 token 消耗,降低算力成本。

AI在线 12 月 31 日消息,浪潮旗下 YuanLab.ai 团队 12 月 30 日开源发布源 Yuan 3.0 Flash 多模态基础大模型

Yuan 3.0 Flash 是一款 40B 参数规模的多模态基础大模型,采用稀疏混合专家(MoE)架构,单次推理仅激活约 3.7B 参数。

Yuan 3.0 Flash 提出和采用了强化学习训练方法(RAPO),通过反思抑制奖励机制(RIRM),从训练层面引导模型减少无效反思,在提升推理准确性的同时,大幅压缩了推理过程的 token 消耗,降低算力成本。

Yuan 3.0 Flash 由视觉编码器、语言主干网络以及多模态对齐模块组成

  • 语言主干网络采用局部过滤增强的 Attention 结构(LFA)和混合专家(MoE)结构,在提升注意力精度的同时,降低训练与推理的算力开销;

  • 多模态方面,采用视觉编码器,将视觉信号转化为 token,与语言 token 一起输入到语言主干网络,通过多模态对齐模块实现高效、稳定的跨模态特征对齐;

  • 同时,引入自适应图像分割机制,在支持高分辨率图像理解的同时,降低显存需求及算力开销。

图片

在企业场景的 RAG(ChatRAG)、多模态检索(Docmatix)、多模态表格理解(MMTab)、摘要生成(SummEval)等任务中,Yuan 3.0 Flash 的表现已优于 GPT-5.1

在多模态推理与语言推理评测中,Yuan 3.0 Flash(40B)精度接近 Qwen3-VL235B-A22B(235B)与 DeepSeek-R1-0528(671B),但 token 消耗仅约为其 1/4 ~ 1/2,降低了企业大模型应用成本。

图片

Yuan 3.0 Flash 全面开源,全系列模型参数和代码均可免费下载使用,AI在线附开源地址如下:

https://github.com/Yuan-lab-LLM/Yuan3.0

相关资讯

阿里巴巴推出新款 Qwen 模型,三秒音频即可克隆声音

阿里巴巴推出新款 Qwen 模型,三秒音频即可克隆声音

近日,阿里巴巴云计算的 Qwen 团队发布了两款全新的人工智能模型,旨在通过文本指令生成或克隆声音。 其中,Qwen3-TTS-VD-Flash 模型允许用户根据详细描述生成声音,用户可以精确定义声音的特征,如情感和说话节奏。 例如,用户可以请求生成一个 “中年男性,洪亮的男中音 —— 充满活力的广告解说,快速的语速,夸张的音调变化,充满销售魅力的声音”。
12/24/2025 11:41:18 AM AI在线
Pudong Launches a 2 Billion Yuan Artificial Intelligence Seed Fund, with the First Phase Focusing on Early-Stage Investments

Pudong Launches a 2 Billion Yuan Artificial Intelligence Seed Fund, with the First Phase Focusing on Early-Stage Investments

According to Shanghai Finance and Pudong Release, on the 27th, the Pudong Artificial Intelligence Seed Fund was officially launched at the 2025 Pudong New Area Artificial Intelligence Industry Ecology Global Promotion Conference. The fund has a total scale of 2 billion yuan, with an initial scale of 500 million yuan.
7/28/2025 6:02:40 PM AI在线
Tencent Hunyuan 3D World Model Makes a Stunning Debut! Experience Immersive 360° Scenes for Free and Discover the Future of AI-Driven Virtual Worlds!

Tencent Hunyuan 3D World Model Makes a Stunning Debut! Experience Immersive 360° Scenes for Free and Discover the Future of AI-Driven Virtual Worlds!

Recently, Tencent officially launched the Yuan 3D World Model 1.0 at the 2025 World Artificial Intelligence Conference and announced its full open-source release, becoming the industry's first 3D world generation model that supports immersive roaming, interaction, and simulation. With high-precision 360° scene generation and interactive roaming capabilities, this model has quickly sparked industry discussions, opening up infinite possibilities for game development, virtual reality (VR), and digital content creation.
7/28/2025 6:02:35 PM AI在线