业界首个：腾讯混元-A13B 模型发布并开源，极端条件 1 张中低端 GPU 卡即可部署

作者：汪淼 2025-06-27 04:04

混元-A13B 作为基于专家混合（MoE）架构的大模型，总参数 800 亿、激活参数 130 亿，号称“在效果比肩顶尖开源模型的同时，大幅降低推理延迟与计算开销”。

感谢腾讯混元大模型家族今日宣布迎来新成员 —— 混元-A13B 模型发布并开源，号称是“业界首个 13B 级别的 MoE 开源混合推理模型”。

混元-A13B 作为基于专家混合（MoE）架构的大模型，总参数 800 亿、激活参数 130 亿，号称“在效果比肩顶尖开源模型的同时，大幅降低推理延迟与计算开销”。

腾讯混元表示，这对个人开发者和中小企业来说，无疑是个好消息，极端条件下仅需 1 张中低端 GPU 卡即可部署。用户可以在 Github、HuggingFace 等技术社区下载使用，模型 API 已在腾讯云官网上线。

混元-A13B 模型通过 MoE 架构，为每个输入选择性地激活相关模型组件，号称与同等规模的密集模型相比“又快又省”，而且为个人开发者和中小企业提供了一个“可扩展且高效的替代方案”。

预训练中，模型用了 20 万亿高质量网络词元语料库，提升了模型推理能力的上限；完善了 MoE 架构的 Scaling Law （即规模定律）理论体系，为 MoE 架构设计提供了可量化的工程化指导，提升了模型预训练效果。

用户可以按需选择思考模式，快思考模式提供简洁、高效的输出，适合追求速度和最小计算开销的简单任务；慢思考模式涉及更深、更全面的推理步骤。这优化了计算资源分配，兼顾效率和准确性。

混元还开源了两个新数据集，以填补行业内相关评估标准的空白。其中，ArtifactsBench 主要用于代码评估，构建了一个包含 1825 个任务的新基准；C3-Bench 针对 Agent 场景模型评估，设计了 1024 条测试数据，以发现模型能力的不足。

从具体效果来看，数学推理方面，例如输入“9.11 和 9.9 谁大”，模型可准确完成小数比较，并展现分步解析能力。

对于时下热门的智能体（Agent）应用，模型可调用工具，生成出行攻略、数据文件分析等复杂指令响应。

再看数据和效果。在多个公开数据测试集上，模型在数学、科学和逻辑推理任务上表现出“领先效果”。

AI在线附开源地址：

https://github.com/Tencent-Hunyuan/Hunyuan-A13B

腾讯混元新一代快思考模型 Turbo S 发布，支持“秒回”

腾讯官方表示，区别于 Deepseek R1、混元 T1 等需要“想一下再回答”的慢思考模型，混元 Turbo S 能够实现“秒回”，更快速输出答案，吐字速度提升一倍，首字时延降低 44%。

2/27/2025 5:38:29 PM 汪淼

腾讯混元发布并开源图生视频模型：可生成 5 秒短视频，还能自动配上背景音效

腾讯混元发布图生视频模型并对外开源，同时上线对口型与动作驱动等玩法，并支持生成背景音效及 2K 高质量视频。基于图生视频的能力，用户只需上传一张图片，并简短描述希望画面如何运动、镜头如何调度等，混元即可按要求让图片动起来，变成 5 秒的短视频，还能自动配上背景音效。

3/6/2025 4:28:17 PM 远洋

相关资讯