腾讯混元
腾讯混元开源AI绘画新框架:24维度对齐人类意图,让AI读懂复杂指令
                        AI绘画总“画不对”,让创作者一再崩溃。 如今,腾讯混元团队开源的PromptEnhancer框架,为这一难题提供了解决方案。 无需修改任何预训练T2I模型的权重,仅通过 “思维链(CoT)提示重写” 这一简单思路,就能让AI绘画的文本-图像对齐精度大幅提升。
                    
                    9/17/2025 9:43:26 AM
                        
                    联合理解生成的关键拼图?腾讯发布X-Omini:强化学习让离散自回归生成方法重焕生机,轻松渲染长文本图像
                        本论文作者团队来自腾讯混元X组,共同一作为耿子钢和王逸冰,项目Lead为张小松,通讯作者为腾讯混元团队杰出科学家胡瀚,Swin Transformer作者。 在图像生成领域,自回归(Autoregressive, AR)模型与扩散(Diffusion)模型之间的技术路线之争始终未曾停歇。 大语言模型(LLM)凭借其基于「预测下一个词元」的优雅范式,已在文本生成领域奠定了不可撼动的地位。
                    
                    8/10/2025 1:07:00 PM
                        机器之心
                    手机也能跑大模型,腾讯混元推出多款小尺寸开源模型
                        8月 4 日,腾讯混元宣布开源四款小尺寸模型,参数分别为 0.5B、1.8B、4B、7B,消费级显卡即可运行,适用于笔记本电脑、手机、智能座舱、智能家居等低功耗场景,且支持垂直领域低成本微调。 这四款模型的推出,是腾讯混元大模型持续开源的一大举措,也进一步丰富了混元开源模型体系,可为开发者和企业提供更多尺寸的模型选择。 目前,四个模型均在 Github 和 HuggingFace 等开源社区上线,Arm、高通、Intel、联发科技等多个消费级终端芯片平台也都宣布支持部署。
                    
                    8/4/2025 4:12:39 PM
                        一水
                    独家丨前阿里通义视觉负责人薄列峰,已加入腾讯混元团队
                        AI 科技评论独家获悉,原通义实验室应用视觉团队负责人薄列峰已加入腾讯混元大模型团队,直接向腾讯副总裁兼混元项目负责人蒋杰汇报。 据悉,薄列峰在今年 4 月 30 日从阿里离任,彼时曾有传闻称他已加盟某大型互联网企业,在美国任职,并负责多模态模型方向的全面工作,直接向公司高管汇报。 如今,他的动向终于明朗。
                    
                    7/27/2025 6:33:00 PM
                        郑佳美
                    业界首个,腾讯混元 3D 世界模型正式发布并开源
                        AI在线 7 月 27 日消息,今天,在 2025 世界人工智能大会腾讯论坛上,腾讯正式发布混元 3D 世界模型 1.0,并全面开源。 据介绍,这是业界首个开源可沉浸漫游、可交互、可仿真的世界生成模型,为游戏开发、VR、数字内容创作等领域带来了全新的可能性。 除 3D 世界模型外,腾讯混元还披露了包括端侧混合推理语言模型、多模态理解模型、游戏视觉模型等在内的一系列开源计划。
                    
                    7/27/2025 11:15:23 AM
                        浩渺
                    7B模型“情商”比肩GPT-4o,腾讯突破开放域RL难题,得分直翻5倍
                        在没有标准答案的开放式对话中,RL该怎么做? 多轮对话是大模型最典型的开放任务:高频、多轮、强情境依赖,且“好回复”因人而异。 然而,当用RL去优化大模型在真实交互中的“情商”时,RLVR一度陷入“三大困境”:环境困境.
                    
                    7/18/2025 4:32:19 PM
                        不圆
                    腾讯混元推出业界首个美术级 3D 生成大模型 Hunyuan3D-PolyGen,建模效率提升超七成
                        AI在线 7 月 7 日消息,AI在线从腾讯混元公众号获悉,业界首个美术级 3D 生成大模型 Hunyuan3D-PolyGen 今日正式发布。 该模型结合自研高压缩率表征 BPT 技术,可生成面数达上万面的复杂几何模型,布线精度更高,细节更丰富,同时支持三边面和四边面,满足不同专业管线需求。 基于此,混元 3D 资产可无缝应用于 UGC 游戏资产生成,显著提升美术师建模效率。
                    
                    7/7/2025 9:18:48 PM
                        清源
                    业界首个:腾讯混元-A13B 模型发布并开源,极端条件 1 张中低端 GPU 卡即可部署
                        混元-A13B 作为基于专家混合(MoE)架构的大模型,总参数 800 亿、激活参数 130 亿,号称“在效果比肩顶尖开源模型的同时,大幅降低推理延迟与计算开销”。
                    
                    6/27/2025 4:04:32 PM
                        汪淼
                    腾讯开源混元 3D 2.1 大模型:首个全链路开源工业级 3D 生成大模型,PC 也能“跑”
                        新模型使网格精度更高,具备更好的拓扑一致性,为后续纹理映射提供了基础;还可生成基础颜色、金属度、法线、粗糙度等贴图,支持皮革、木质、金属、陶瓷等的高质量渲染。
                    
                    6/14/2025 7:04:07 AM
                        清源
                    腾讯开源混元语音数字人模型:一张图一段音频就能让图中人物说话唱歌
                        腾讯混元公众号今日发文宣布开源混元语音数字人模型,仅需一张图和一段音频,就能让图中的主角自然地说话、唱歌。
                    
                    5/28/2025 4:47:54 PM
                        清源
                    腾讯混元游戏视觉生成平台发布,首个工业级 AIGC 游戏内容生产引擎
                        混元游戏现阶段已经上线的能力包括 AI 美术管线、实时画布、AI 2D 美术生成、专业角色多视图生成等核心能力,集中在游戏美术概念设计环节。
                    
                    5/20/2025 12:42:31 PM
                        问舟
                    腾讯混元 T1-Vision 上线元宝:可深度理解图片内容
                        腾讯混元T1-Vision上线元宝,融合多模态原生长思维链,可深度理解图片内容,反应时间更快,完答速度提升1.5倍。 #腾讯混元# #AI技术#
                    
                    5/12/2025 8:35:19 PM
                        远洋
                    腾讯混元 3D 生成模型升级 2.5 版本:建模精细度提升,免费生成额度翻倍
                        相比前代,混元 3D v2.5 模型架构全面升级,总参数量从 1B 提升至 10B,有效面片数增加超 10 倍,有效几何分辨率达到 1024。
                    
                    4/23/2025 5:37:31 PM
                        汪淼
                    腾讯云发布座舱端侧大模型,车载 AI 迎来“边开边提醒”时代
                        在4月22日上海车展开幕前夕的 TIME DAY 腾讯智慧出行技术开放日上,腾讯云重磅推出全新的座舱端侧大模型。 该模型基于腾讯混元2B 小参数模型打造,并结合汽车行业专业知识数据进行精细调整和本地知识检索增强(RAG),旨在实现通用及车载知识领域的精准问答。 借助该座舱端侧大模型,车辆能够为用户提供包括驾驶行为建议、车辆操作指导、故障处理以及潜在驾驶安全风险提醒等实时服务,真正实现“边开边提醒”的智能体验。
                    
                    4/22/2025 6:00:42 PM
                        AI在线
                    一张图 + 一句话实现任意角色场景姿势,腾讯混元宣布开源定制化图像生成插件 InstantCharacter
                        通过这个插件,在大模型中,只需要一张图加一句话,就可以让任何角色以你想要的姿势出现在任何地方。
                    
                    4/18/2025 7:26:20 PM
                        汪淼
                    腾讯混元开源定制化图像生成插件 InstantCharacter
                        腾讯混元宣布开源定制化图像生成插件 InstantCharacter,并实现了对开源文生图模型 Flux 的兼容。 这一插件的推出,标志着图像生成技术在角色一致性和图像生成精确度上取得了重大突破,为内容创作者提供了更高效、更灵活的创作工具。 InstantCharacter 的核心优势在于能够确保角色在不同场景中的一致性和真实性,同时具备高画质和精度,以及灵活的文本编辑性。
                    
                    4/18/2025 12:02:38 PM
                        AI在线
                    腾讯混元自研深度思考模型 T1 发布:吐字快、能秒回,擅长超长文处理
                        腾讯混元今日发布自研深度思考模型T1,该模型不仅吐字快、能秒回,还擅长超长文处理,展现出强大的推理能力。在多项公开基准测试中,T1成绩领先业界,特别是在长文推理领域,有效解决了上下文丢失和长距离信息依赖问题。#腾讯混元# #AI模型#
                    
                    3/21/2025 11:32:42 PM
                        远洋
                    
        资讯热榜
    
    
                LangChain V1.0 深度解析:手把手带你跑通全新智能体架构
        全网刷屏的「电影感」三宫格图片,教你用AI快速生成!
        消息称软银批准对 OpenAI 追加 225 亿美元投资,助力未来上市
        OpenAI 宣布印度用户可享受一年免费 ChatGPT Go 服务
        软银豪掷225亿美元加码OpenAI,AI音乐与超级融资计划全面提速
        OpenAI进军音乐创作领域,携手茱莉亚学院学生打造全新AI音乐模型
        Transformer 之父“叛逃”:我已经受够了 Transformer!警告:AI研究变得越来越窄,我们需要找到新的架构
        LLM 应用评估综合指南(多轮对话系统、RAG、AI Agent)
    
        标签云
    
    
                    
                    AI
                    
                    
                    人工智能
                    
                    
                    OpenAI
                    
                    
                    AIGC
                    
                    
                    模型
                    
                    
                    ChatGPT
                    
                    
                    DeepSeek
                    
                    
                    谷歌
                    
                    
                    AI绘画
                    
                    
                    机器人
                    
                    
                    大模型
                    
                    
                    数据
                    
                    
                    Midjourney
                    
                    
                    开源
                    
                    
                    Meta
                    
                    
                    智能
                    
                    
                    微软
                    
                    
                    用户
                    
                    
                    AI新词
                    
                    
                    GPT
                    
                    
                    学习
                    
                    
                    技术
                    
                    
                    智能体
                    
                    
                    马斯克
                    
                    
                    Gemini
                    
                    
                    图像
                    
                    
                    Anthropic
                    
                    
                    英伟达
                    
                    
                    AI创作
                    
                    
                    训练
                    
                    
                    LLM
                    
                    
                    论文
                    
                    
                    代码
                    
                    
                    算法
                    
                    
                    Agent
                    
                    
                    AI for Science
                    
                    
                    芯片
                    
                    
                    苹果
                    
                    
                    腾讯
                    
                    
                    Stable Diffusion
                    
                    
                    Claude
                    
                    
                    蛋白质
                    
                    
                    开发者
                    
                    
                    生成式
                    
                    
                    神经网络
                    
                    
                    xAI
                    
                    
                    机器学习
                    
                    
                    3D
                    
                    
                    RAG
                    
                    
                    人形机器人
                    
                    
                    研究
                    
                    
                    AI视频
                    
                    
                    生成
                    
                    
                    大语言模型
                    
                    
                    具身智能
                    
                    
                    Sora
                    
                    
                    工具
                    
                    
                    GPU
                    
                    
                    百度
                    
                    
                    华为
                    
                    
                    计算
                    
                    
                    字节跳动
                    
                    
                    AI设计
                    
                    
                    AGI
                    
                    
                    大型语言模型
                    
                    
                    搜索
                    
                    
                    视频生成
                    
                    
                    场景
                    
                    
                    深度学习
                    
                    
                    DeepMind
                    
                    
                    架构
                    
                    
                    生成式AI
                    
                    
                    编程
                    
                    
                    视觉
                    
                    
                    Transformer
                    
                    
                    预测
                    
                    
                    AI模型
                    
                    
                    伟达
                    
                    
                    亚马逊
                    
                    
                    MCP
                    
        
     
                     
                 
                 
                 
                 
                 
                 
                 
                 
                 
                 
                 
                 
                 
                 
                 
                 
                