AI在线 AI在线

腾讯开源 Hunyuan-A13B:小尺寸,大智慧的 AI 模型

Hunyuan-A13B 是一个由腾讯最新开源的大语言模型,它以创新的设计理念,在相对较小的活跃参数规模下,实现了强大的性能表现,特别适用于资源受限的环境。 这款模型采用了细粒度 MoE(Mixture-of-Experts)架构,拥有130亿活跃参数,但总参数量高达800亿。 这种设计让它在保持高效和可扩展性的同时,能够提供前沿的推理能力和通用应用支持。

Hunyuan-A13B 是一个由腾讯最新开源的大语言模型,它以创新的设计理念,在相对较小的活跃参数规模下,实现了强大的性能表现,特别适用于资源受限的环境。

QQ20250630-092741.png

这款模型采用了细粒度 MoE(Mixture-of-Experts)架构,拥有130亿活跃参数,但总参数量高达800亿。这种设计让它在保持高效和可扩展性的同时,能够提供前沿的推理能力和通用应用支持。

QQ20250630-092705.png

Hunyuan-A13B 的核心功能亮点包括:

  • 支持快慢思维的混合推理模式:这种独特的推理机制让模型能够根据任务需求灵活调整思考深度,提升处理复杂问题的效率。

  • 原生256K 超长上下文理解能力:这意味着模型可以处理极长的文本输入,使其在需要大量背景信息的任务中表现出色。

  • 在智能体任务上的卓越表现:Hunyuan-A13B 在执行各类智能体(Agent)相关任务时展现出强大的能力。

为了实现高效推理,Hunyuan-A13B 采用了 Grouped Query Attention (GQA) 技术,并支持多种量化格式。目前,该模型已开源预训练、指令微调、FP8和 INT4量化版本,方便开发者使用。

在多项基准测试中,Hunyuan-A13B 都展现出强大的竞争力,尤其是在数学、科学、编码、推理和智能体领域

腾讯为开发者提供了全面的支持,包括使用 Hugging Face Transformers 进行交互和模型训练的详细指南。同时,对于模型部署,Hunyuan-A13B 也提供了通过 TensorRT-LLM、vLLM 和 SGLang 的支持,并提供了预构建的 Docker 镜像和量化模型部署方案,大大简化了部署流程。

Hunyuan-A13B 的开源,无疑为大模型在资源受限环境下的应用开辟了新的可能性,也为 AI 社区带来了新的创新动力。

开源地址:https://huggingface.co/tencent/Hunyuan-A13B-Instruct

github:https://github.com/Tencent-Hunyuan/Hunyuan-A13B?tab=readme-ov-file

相关资讯

腾讯发布Hunyuan-TurboS:首款超大型混合Transformer-Mamba MoE模型震撼登场

今日,腾讯在X平台上正式宣布推出其最新AI模型Hunyuan-TurboS,这款被誉为“首款超大型Hybrid-Transformer-Mamba MoE模型”的产品迅速引发全球科技圈的热议。 根据X用户披露的信息,Hunyuan-TurboS通过融合Mamba的高效长序列处理能力和Transformer的强大上下文理解能力,成功克服了传统纯Transformer模型在长文本训练和推理上的瓶颈,展现出令人瞩目的性能突破。 据介绍,传统Transformer模型因O(N²)复杂度和KV-Cache问题,在处理长文本时往往面临效率低下和高成本的挑战。
3/11/2025 8:56:00 AM
AI在线

腾讯推出 Hunyuan-Large 大模型:389B 总参数,业界已开源基于 Transformer 的最大 MoE 模型

腾讯今日宣布推出 Hunyuan-Large 大模型,官方表示这是目前业界已经开源的基于 Transformer 的最大 MoE 模型,拥有 3890 亿总参数(389B)和 520 亿激活参数(52B)。 腾讯今日在 Hugging Face 开源了 Hunyuan-A52B-Pretrain 、 Hunyuan-A52B-Instruct 和 Hunyuan-A52B-Instruct-FP8。 并发布了技术报告和训练推理操作手册,详细介绍了模型能力和训练与推理的操作。
11/5/2024 4:13:12 PM
沛霖(实习)

调查:超72% 的企业选择 AI 工具时最看重易用性

根据最近的一项 CIO 报告,企业在人工智能(AI)领域的投资高达2.5亿美元,尽管在证明投资回报率(ROI)方面面临挑战。 商业领袖们正努力提高生产力,但新技术的集成往往需要重构现有应用、更新流程并激励员工学习,以适应现代商业环境。 QuickBlox 首席执行官 Nate MacLeitch 对136位高管进行了调查,以揭示 AI 采用的现实情况,探讨领导者的首要任务、主要担忧以及他们在2025年寻找可信工具的信息来源。
3/18/2025 10:02:00 AM
AI在线
  • 1