AI在线 AI在线

腾讯混元发布1.5版开源翻译模型:端侧部署性能跃升,效果比肩超大型闭源模型

腾讯混元今日宣布正式开源其翻译模型1.5版本。 本次更新共包含两个不同尺寸的模型:Tencent-HY-MT1.5-1.8B 和 Tencent-HY-MT1.5-7B,旨在通过极致的效率与领先的翻译质量,重新定义端云协同的翻译体验。 核心亮点:端侧部署与卓越性能本次发布的 1.8B 模型 表现尤为亮眼。

腾讯混元今日宣布正式开源其翻译模型1.5版本。本次更新共包含两个不同尺寸的模型:Tencent-HY-MT1.5-1.8BTencent-HY-MT1.5-7B,旨在通过极致的效率与领先的翻译质量,重新定义端云协同的翻译体验。

image.png

核心亮点:端侧部署与卓越性能

本次发布的 1.8B 模型 表现尤为亮眼。作为一款面向手机等消费级设备设计的轻量化模型,它在经过量化处理后,仅需 1GB 内存 即可实现离线流畅运行。

  • 极致速度:处理50个 tokens 的平均耗时仅为 0.18秒,远快于主流商用翻译 API 的0.4秒。

  • 跨级表现:在 FLORES-200等权威测试集中,其效果达到了 Gemini-3.0-Pro 等超大尺寸闭源模型的90分位水平,全面超越了中等尺寸开源模型。

image.png

全面覆盖:从主流语种到方言民汉

混元翻译模型1.5支持包括中、英、日、法等 33个全球语种 的互译,并特别加强了对捷克语、爱沙尼亚语、冰岛语等小语种的支持。此外,模型还涵盖了 5种国内民汉语言及方言,极大拓宽了 AI 翻译的应用边界。

功能进化:更具实操性的翻译体验

针对实际应用场景,1.5版本在三个维度进行了重磅升级:

  1. 自定义术语库:用户可针对医学、法律、金融等专业领域上传术语表,确保专业词汇翻译的一致性。

  2. 上下文理解:具备先进的长文本对话理解能力,能基于前文语境优化后续结果,避免语义断裂。

  3. 格式保持能力:通过精准的指令遵循,模型可以在翻译后完美保持原始文本(如网页、代码、Markdown)的格式。

技术突破:大模型引导小模型

HY-MT1.5-1.8B 之所以能以小博大,得益于腾讯采用的 On-Policy Distillation(大尺寸模型蒸馏) 策略。由7B 尺寸的“老师”模型实时引导“学生”模型,帮助其从预测偏移中学习,而非单纯死记硬背答案,从而显著提升了小模型的逻辑与翻译能力。

开发者生态:多平台全面支持

目前,腾讯混元翻译模型1.5均已在腾讯混元官网上线,并在Github及HuggingFace开源社区开放下载。模型已适配 Arm、高通、Intel 及沐曦等主流计算平台。

从腾讯会议到企业微信,腾讯混元翻译技术已在内部多个高并发场景落地。随着1.5版本的开源,腾讯正进一步推动高质量 AI 翻译技术走向普惠,为全球开发者提供更具性价比的翻译方案。

相关资讯

腾讯混元开源翻译模型 1.5:手机 1GB 内存即可运行,效果超越商用 API

腾讯混元开源翻译模型 1.5:手机 1GB 内存即可运行,效果超越商用 API

AI在线 12 月 30 日消息,腾讯混元今日宣布开源翻译模型 1.5 版本,共包含两个模型:Tencent-HY-MT1.5-1.8B 和 Tencent-HY-MT1.5-7B,支持 33 个语种互译以及 5 种民汉 / 方言,除了中文、英语、日语等常见语种,也包含捷克语、马拉地语、爱沙尼亚语、冰岛语等小语种。 目前两个模型均已在腾讯混元官网上线,在 Github 和 Huggingface 等开源社区也可直接下载使用。 HY-MT1.5-1.8B 主要面向手机等消费级设备场景,经过量化,支持端侧直接部署和离线实时翻译,仅需 1GB 内存即可流畅运行,并且宣称在参数量极小的前提下,效果超过了大部分商用翻译 API。
12/30/2025 3:58:21 PM 汪淼
Tencent Hunyuan 3D World Model Makes a Stunning Debut! Experience Immersive 360° Scenes for Free and Discover the Future of AI-Driven Virtual Worlds!

Tencent Hunyuan 3D World Model Makes a Stunning Debut! Experience Immersive 360° Scenes for Free and Discover the Future of AI-Driven Virtual Worlds!

Recently, Tencent officially launched the Yuan 3D World Model 1.0 at the 2025 World Artificial Intelligence Conference and announced its full open-source release, becoming the industry's first 3D world generation model that supports immersive roaming, interaction, and simulation. With high-precision 360° scene generation and interactive roaming capabilities, this model has quickly sparked industry discussions, opening up infinite possibilities for game development, virtual reality (VR), and digital content creation.
7/28/2025 6:02:35 PM AI在线
NLLB 与 ChatGPT 双向优化:探索翻译模型与语言模型在小语种应用的融合策略

NLLB 与 ChatGPT 双向优化:探索翻译模型与语言模型在小语种应用的融合策略

本文探讨了 NLLB 翻译模型与 ChatGPT 在小语种应用中的双向优化策略。 首先介绍了 NLLB-200 的背景、数据、分词器和模型,以及其与 LLM(Large Language Model)的异同和协同关系。 接着列举了实战与应用的案例,包括使用 ChatGPT 生成的样本微调 NLLB-200 和使用 NLLB-200 的翻译结果作为 LLM 的 prompt 等。
2/13/2025 8:44:56 AM Huang Minghui