腾讯混元
联合理解生成的关键拼图?腾讯发布X-Omini:强化学习让离散自回归生成方法重焕生机,轻松渲染长文本图像
本论文作者团队来自腾讯混元X组,共同一作为耿子钢和王逸冰,项目Lead为张小松,通讯作者为腾讯混元团队杰出科学家胡瀚,Swin Transformer作者。 在图像生成领域,自回归(Autoregressive, AR)模型与扩散(Diffusion)模型之间的技术路线之争始终未曾停歇。 大语言模型(LLM)凭借其基于「预测下一个词元」的优雅范式,已在文本生成领域奠定了不可撼动的地位。
8/10/2025 1:07:00 PM
机器之心
手机也能跑大模型,腾讯混元推出多款小尺寸开源模型
8月 4 日,腾讯混元宣布开源四款小尺寸模型,参数分别为 0.5B、1.8B、4B、7B,消费级显卡即可运行,适用于笔记本电脑、手机、智能座舱、智能家居等低功耗场景,且支持垂直领域低成本微调。 这四款模型的推出,是腾讯混元大模型持续开源的一大举措,也进一步丰富了混元开源模型体系,可为开发者和企业提供更多尺寸的模型选择。 目前,四个模型均在 Github 和 HuggingFace 等开源社区上线,Arm、高通、Intel、联发科技等多个消费级终端芯片平台也都宣布支持部署。
8/4/2025 4:12:39 PM
一水
独家丨前阿里通义视觉负责人薄列峰,已加入腾讯混元团队
AI 科技评论独家获悉,原通义实验室应用视觉团队负责人薄列峰已加入腾讯混元大模型团队,直接向腾讯副总裁兼混元项目负责人蒋杰汇报。 据悉,薄列峰在今年 4 月 30 日从阿里离任,彼时曾有传闻称他已加盟某大型互联网企业,在美国任职,并负责多模态模型方向的全面工作,直接向公司高管汇报。 如今,他的动向终于明朗。
7/27/2025 6:33:00 PM
郑佳美
业界首个,腾讯混元 3D 世界模型正式发布并开源
AI在线 7 月 27 日消息,今天,在 2025 世界人工智能大会腾讯论坛上,腾讯正式发布混元 3D 世界模型 1.0,并全面开源。 据介绍,这是业界首个开源可沉浸漫游、可交互、可仿真的世界生成模型,为游戏开发、VR、数字内容创作等领域带来了全新的可能性。 除 3D 世界模型外,腾讯混元还披露了包括端侧混合推理语言模型、多模态理解模型、游戏视觉模型等在内的一系列开源计划。
7/27/2025 11:15:23 AM
浩渺
7B模型“情商”比肩GPT-4o,腾讯突破开放域RL难题,得分直翻5倍
在没有标准答案的开放式对话中,RL该怎么做? 多轮对话是大模型最典型的开放任务:高频、多轮、强情境依赖,且“好回复”因人而异。 然而,当用RL去优化大模型在真实交互中的“情商”时,RLVR一度陷入“三大困境”:环境困境.
7/18/2025 4:32:19 PM
不圆
腾讯混元推出业界首个美术级 3D 生成大模型 Hunyuan3D-PolyGen,建模效率提升超七成
AI在线 7 月 7 日消息,AI在线从腾讯混元公众号获悉,业界首个美术级 3D 生成大模型 Hunyuan3D-PolyGen 今日正式发布。 该模型结合自研高压缩率表征 BPT 技术,可生成面数达上万面的复杂几何模型,布线精度更高,细节更丰富,同时支持三边面和四边面,满足不同专业管线需求。 基于此,混元 3D 资产可无缝应用于 UGC 游戏资产生成,显著提升美术师建模效率。
7/7/2025 9:18:48 PM
清源
业界首个:腾讯混元-A13B 模型发布并开源,极端条件 1 张中低端 GPU 卡即可部署
混元-A13B 作为基于专家混合(MoE)架构的大模型,总参数 800 亿、激活参数 130 亿,号称“在效果比肩顶尖开源模型的同时,大幅降低推理延迟与计算开销”。
6/27/2025 4:04:32 PM
汪淼
腾讯开源混元 3D 2.1 大模型:首个全链路开源工业级 3D 生成大模型,PC 也能“跑”
新模型使网格精度更高,具备更好的拓扑一致性,为后续纹理映射提供了基础;还可生成基础颜色、金属度、法线、粗糙度等贴图,支持皮革、木质、金属、陶瓷等的高质量渲染。
6/14/2025 7:04:07 AM
清源
腾讯开源混元语音数字人模型:一张图一段音频就能让图中人物说话唱歌
腾讯混元公众号今日发文宣布开源混元语音数字人模型,仅需一张图和一段音频,就能让图中的主角自然地说话、唱歌。
5/28/2025 4:47:54 PM
清源
腾讯混元游戏视觉生成平台发布,首个工业级 AIGC 游戏内容生产引擎
混元游戏现阶段已经上线的能力包括 AI 美术管线、实时画布、AI 2D 美术生成、专业角色多视图生成等核心能力,集中在游戏美术概念设计环节。
5/20/2025 12:42:31 PM
问舟
腾讯混元 T1-Vision 上线元宝:可深度理解图片内容
腾讯混元T1-Vision上线元宝,融合多模态原生长思维链,可深度理解图片内容,反应时间更快,完答速度提升1.5倍。 #腾讯混元# #AI技术#
5/12/2025 8:35:19 PM
远洋
腾讯混元 3D 生成模型升级 2.5 版本:建模精细度提升,免费生成额度翻倍
相比前代,混元 3D v2.5 模型架构全面升级,总参数量从 1B 提升至 10B,有效面片数增加超 10 倍,有效几何分辨率达到 1024。
4/23/2025 5:37:31 PM
汪淼
腾讯云发布座舱端侧大模型,车载 AI 迎来“边开边提醒”时代
在4月22日上海车展开幕前夕的 TIME DAY 腾讯智慧出行技术开放日上,腾讯云重磅推出全新的座舱端侧大模型。 该模型基于腾讯混元2B 小参数模型打造,并结合汽车行业专业知识数据进行精细调整和本地知识检索增强(RAG),旨在实现通用及车载知识领域的精准问答。 借助该座舱端侧大模型,车辆能够为用户提供包括驾驶行为建议、车辆操作指导、故障处理以及潜在驾驶安全风险提醒等实时服务,真正实现“边开边提醒”的智能体验。
4/22/2025 6:00:42 PM
AI在线
一张图 + 一句话实现任意角色场景姿势,腾讯混元宣布开源定制化图像生成插件 InstantCharacter
通过这个插件,在大模型中,只需要一张图加一句话,就可以让任何角色以你想要的姿势出现在任何地方。
4/18/2025 7:26:20 PM
汪淼
腾讯混元开源定制化图像生成插件 InstantCharacter
腾讯混元宣布开源定制化图像生成插件 InstantCharacter,并实现了对开源文生图模型 Flux 的兼容。 这一插件的推出,标志着图像生成技术在角色一致性和图像生成精确度上取得了重大突破,为内容创作者提供了更高效、更灵活的创作工具。 InstantCharacter 的核心优势在于能够确保角色在不同场景中的一致性和真实性,同时具备高画质和精度,以及灵活的文本编辑性。
4/18/2025 12:02:38 PM
AI在线
腾讯混元自研深度思考模型 T1 发布:吐字快、能秒回,擅长超长文处理
腾讯混元今日发布自研深度思考模型T1,该模型不仅吐字快、能秒回,还擅长超长文处理,展现出强大的推理能力。在多项公开基准测试中,T1成绩领先业界,特别是在长文推理领域,有效解决了上下文丢失和长距离信息依赖问题。#腾讯混元# #AI模型#
3/21/2025 11:32:42 PM
远洋
腾讯混元全新推理模型 T1 官宣:3 月 21 日发布
腾讯混元今日通过官方公众号宣布,全新的推理模型T1将于本周五(IT之家注:北京时间3月21日23时)正式发布。
3/19/2025 8:58:04 PM
清源
腾讯混元推出 5 款 3D 生成模型,全部开源
其自研的 3D AI 创作引擎也迎来升级,新增多视图输入、模型智能减面、格式全兼容等能力,面向 C 端用户全面开放使用。
3/18/2025 1:34:58 PM
汪淼
资讯热榜
标签云
AI
人工智能
OpenAI
AIGC
模型
ChatGPT
DeepSeek
AI绘画
谷歌
机器人
数据
大模型
Midjourney
开源
智能
Meta
用户
微软
GPT
学习
技术
图像
Gemini
智能体
马斯克
AI新词
AI创作
Anthropic
英伟达
论文
训练
代码
算法
LLM
Stable Diffusion
芯片
腾讯
蛋白质
苹果
Claude
开发者
AI for Science
Agent
生成式
神经网络
机器学习
3D
xAI
研究
生成
人形机器人
AI视频
百度
计算
工具
Sora
GPU
大语言模型
华为
RAG
AI设计
字节跳动
具身智能
搜索
大型语言模型
场景
深度学习
AGI
视频生成
预测
视觉
伟达
架构
Transformer
神器推荐
DeepMind
亚马逊
特斯拉
编程
MCP