腾讯混元
腾讯混元发布 HY-Motion1.0开源3D 角色动画生成模型
近日,腾讯混元正式发布并开源其全新文生3D 动作大模型 ——HY-Motion1.0。 这一模型以其十亿参数量级和基于 Diffusion Transformer (DiT) 的架构,标志着3D 角色动画生成领域的重大突破。 HY-Motion1.0旨在提供高质量、标准化的骨骼动画,助力游戏开发者、动画师以及科研人员提升创作效率,并降低3D 动画制作的门槛,让更多个人创作者能够实现其创意。
微信推出 AI 小程序成长计划:免费资源与巨额支持助力开发者
微信官方宣布推出全新的「AI 应用及线上工具小程序成长计划」,旨在为开发者提供全面支持,帮助他们在2026年实现小程序的快速发展。 该计划在 AI 大模型技术日益成熟、开发门槛不断降低的背景下应运而生。 成长计划涵盖多个方面,包括免费云开发资源、AI 算力、数据分析、商业变现以及流量激励等,旨在陪伴开发者从 “0到1”,再从 “1到100”。
腾讯炸场!10亿参数文生3D动作神器开源,游戏NPC一键“活”了!
2025年12月30日,腾讯混元团队重磅开源HY-Motion1.0(Hunyuan-Motion-1.0),一款十亿参数级文本到3D动作生成大模型。 该模型基于Diffusion Transformer(DiT)架构与流匹配机制,仅需一句自然语言描述,即可生成高保真、流畅多样的3D角色骨骼动画,直接兼容Blender、Unity、UE等主流3D工具,极大降低了动画制作门槛。 核心技术亮点 HY-Motion1.0采用全阶段训练策略:首先在超3000小时多样化动作数据上预训练,构建通用运动先验;随后在400小时精选高质量数据上微调,提升细节流畅性;最后通过强化学习(RLHF)结合人类反馈和奖励模型,优化物理合理性与语义对齐。
腾讯混元开源翻译模型1.5,端侧可部署,效果超越商用API
12月30日,腾讯混元宣布推出并开源翻译模型1.5,共包含两个模型:Tencent-HY-MT1.5-1.8B 和 Tencent-HY-MT1.5-7B,两个模型均支持 33 个语种互译以及5种民汉/方言,除了中文、英语、日语等常见语种,也包含捷克语、马拉地语、爱沙尼亚语、冰岛语等小语种。 模型已在腾讯混元官网上线,通过开源社区也可以直接下载使用。 HY-MT1.5-1.8B主要面向手机等消费级设备场景,经过量化,可支持端侧直接部署和离线实时翻译,仅需1GB内存即可流畅运行,并且在参数量极小的前提下,效果超过了大部分商用翻译API。
腾讯混元发布1.5版开源翻译模型:端侧部署性能跃升,效果比肩超大型闭源模型
腾讯混元今日宣布正式开源其翻译模型1.5版本。 本次更新共包含两个不同尺寸的模型:Tencent-HY-MT1.5-1.8B 和 Tencent-HY-MT1.5-7B,旨在通过极致的效率与领先的翻译质量,重新定义端云协同的翻译体验。 核心亮点:端侧部署与卓越性能本次发布的 1.8B 模型 表现尤为亮眼。
腾讯混元开源翻译模型 1.5:手机 1GB 内存即可运行,效果超越商用 API
AI在线 12 月 30 日消息,腾讯混元今日宣布开源翻译模型 1.5 版本,共包含两个模型:Tencent-HY-MT1.5-1.8B 和 Tencent-HY-MT1.5-7B,支持 33 个语种互译以及 5 种民汉 / 方言,除了中文、英语、日语等常见语种,也包含捷克语、马拉地语、爱沙尼亚语、冰岛语等小语种。 目前两个模型均已在腾讯混元官网上线,在 Github 和 Huggingface 等开源社区也可直接下载使用。 HY-MT1.5-1.8B 主要面向手机等消费级设备场景,经过量化,支持端侧直接部署和离线实时翻译,仅需 1GB 内存即可流畅运行,并且宣称在参数量极小的前提下,效果超过了大部分商用翻译 API。
腾讯混元推出 ETC 领域首款 AI 智能体,问题解决率达 90%
AI在线 12 月 25 日消息,腾讯混元今日官宣推出 ETC 领域首款 AI 智能体。 据介绍,基于混元大模型,腾讯云和安徽驿路微行科技有限公司联合推出 ETC「助手 Agent」,通过文本或语音发出指令,智能体可精准理解并高效执行。 官方数据显示,自今年 4 月启动内测以来,该智能体已服务超百万用户,问答准确率达 95%、问题解决率达 90%。
腾讯混元世界模型 1.5 发布,首次开源业界最系统、最全面的实时世界模型框架
AI在线 12 月 17 日消息,今日,腾讯混元世界模型 1.5(Tencent HY WorldPlay) 正式发布。 官方称,混元世界模型 1.5(WorldPlay)首次开源了业界最系统、最全面的实时世界模型框架,涵盖数据、训练、流式推理部署等全链路、全环节,并提出了重构记忆力、长上下文蒸馏、基于 3D 的自回归扩散模型强化学习等算法模块。 AI在线附官方介绍如下:世界建模的新突破:实时交互、前后一致混元世界模型 1.5 带来世界建模的全新可能性,用户可以在生成的世界里随意移动探索,离开某个区域后再次返回时,模型能够 " 记住 " 该区域的三维结构,呈现前后一致的场景 —— 这种空间记忆能力标志着模型在三维世界理解上的突破。
告别建模烦恼!腾讯混元3D帮你一键生成手办级建模
嗨大家好! 我是阿真! 今天继续看点新鲜有趣的。
腾讯混元开源AI绘画新框架:24维度对齐人类意图,让AI读懂复杂指令
AI绘画总“画不对”,让创作者一再崩溃。 如今,腾讯混元团队开源的PromptEnhancer框架,为这一难题提供了解决方案。 无需修改任何预训练T2I模型的权重,仅通过 “思维链(CoT)提示重写” 这一简单思路,就能让AI绘画的文本-图像对齐精度大幅提升。
联合理解生成的关键拼图?腾讯发布X-Omini:强化学习让离散自回归生成方法重焕生机,轻松渲染长文本图像
本论文作者团队来自腾讯混元X组,共同一作为耿子钢和王逸冰,项目Lead为张小松,通讯作者为腾讯混元团队杰出科学家胡瀚,Swin Transformer作者。 在图像生成领域,自回归(Autoregressive, AR)模型与扩散(Diffusion)模型之间的技术路线之争始终未曾停歇。 大语言模型(LLM)凭借其基于「预测下一个词元」的优雅范式,已在文本生成领域奠定了不可撼动的地位。
手机也能跑大模型,腾讯混元推出多款小尺寸开源模型
8月 4 日,腾讯混元宣布开源四款小尺寸模型,参数分别为 0.5B、1.8B、4B、7B,消费级显卡即可运行,适用于笔记本电脑、手机、智能座舱、智能家居等低功耗场景,且支持垂直领域低成本微调。 这四款模型的推出,是腾讯混元大模型持续开源的一大举措,也进一步丰富了混元开源模型体系,可为开发者和企业提供更多尺寸的模型选择。 目前,四个模型均在 Github 和 HuggingFace 等开源社区上线,Arm、高通、Intel、联发科技等多个消费级终端芯片平台也都宣布支持部署。
独家丨前阿里通义视觉负责人薄列峰,已加入腾讯混元团队
AI 科技评论独家获悉,原通义实验室应用视觉团队负责人薄列峰已加入腾讯混元大模型团队,直接向腾讯副总裁兼混元项目负责人蒋杰汇报。 据悉,薄列峰在今年 4 月 30 日从阿里离任,彼时曾有传闻称他已加盟某大型互联网企业,在美国任职,并负责多模态模型方向的全面工作,直接向公司高管汇报。 如今,他的动向终于明朗。
业界首个,腾讯混元 3D 世界模型正式发布并开源
AI在线 7 月 27 日消息,今天,在 2025 世界人工智能大会腾讯论坛上,腾讯正式发布混元 3D 世界模型 1.0,并全面开源。 据介绍,这是业界首个开源可沉浸漫游、可交互、可仿真的世界生成模型,为游戏开发、VR、数字内容创作等领域带来了全新的可能性。 除 3D 世界模型外,腾讯混元还披露了包括端侧混合推理语言模型、多模态理解模型、游戏视觉模型等在内的一系列开源计划。
7B模型“情商”比肩GPT-4o,腾讯突破开放域RL难题,得分直翻5倍
在没有标准答案的开放式对话中,RL该怎么做? 多轮对话是大模型最典型的开放任务:高频、多轮、强情境依赖,且“好回复”因人而异。 然而,当用RL去优化大模型在真实交互中的“情商”时,RLVR一度陷入“三大困境”:环境困境.
腾讯混元推出业界首个美术级 3D 生成大模型 Hunyuan3D-PolyGen,建模效率提升超七成
AI在线 7 月 7 日消息,AI在线从腾讯混元公众号获悉,业界首个美术级 3D 生成大模型 Hunyuan3D-PolyGen 今日正式发布。 该模型结合自研高压缩率表征 BPT 技术,可生成面数达上万面的复杂几何模型,布线精度更高,细节更丰富,同时支持三边面和四边面,满足不同专业管线需求。 基于此,混元 3D 资产可无缝应用于 UGC 游戏资产生成,显著提升美术师建模效率。
业界首个:腾讯混元-A13B 模型发布并开源,极端条件 1 张中低端 GPU 卡即可部署
混元-A13B 作为基于专家混合(MoE)架构的大模型,总参数 800 亿、激活参数 130 亿,号称“在效果比肩顶尖开源模型的同时,大幅降低推理延迟与计算开销”。
腾讯开源混元 3D 2.1 大模型:首个全链路开源工业级 3D 生成大模型,PC 也能“跑”
新模型使网格精度更高,具备更好的拓扑一致性,为后续纹理映射提供了基础;还可生成基础颜色、金属度、法线、粗糙度等贴图,支持皮革、木质、金属、陶瓷等的高质量渲染。
资讯热榜
标签云
AI
人工智能
OpenAI
AIGC
模型
ChatGPT
谷歌
DeepSeek
AI新词
AI绘画
大模型
机器人
数据
Midjourney
开源
Meta
微软
智能
用户
GPT
学习
英伟达
Gemini
智能体
技术
马斯克
Anthropic
图像
AI创作
训练
LLM
论文
AI for Science
代码
腾讯
苹果
算法
Agent
Claude
芯片
具身智能
Stable Diffusion
xAI
蛋白质
人形机器人
开发者
生成式
神经网络
机器学习
AI视频
3D
字节跳动
大语言模型
RAG
Sora
百度
研究
GPU
生成
华为
工具
AGI
计算
生成式AI
AI设计
大型语言模型
搜索
亚马逊
AI模型
视频生成
特斯拉
DeepMind
场景
Copilot
深度学习
Transformer
架构
MCP
编程
视觉