腾讯混元文生图开源大模型加速库发布：生图时间缩短 75%

腾讯今日发布针对腾讯混元文生图开源大模型（混元 DiT）的加速库，号称大幅提升推理效率，生图时间缩短 75%。官方表示，混元 DiT 模型的使用门槛也大幅降低，用户可以基于 ComfyUI 的图形化界面使用腾讯混元文生图模型能力。同时，混元 DiT 模型已经部署至 HuggingFaceDiffusers 通用模型库中，用户仅用三行代码即可调用混元 DiT 模型，无需下载原始代码库。在此之前，腾讯曾宣布混元文生图大模型全面升级并对外开源，供企业、个人开发者免费商用。腾讯方面称其为“业内首个”中文原生的 DiT 架构

腾讯今日发布针对腾讯混元文生图开源大模型（混元 DiT）的加速库，号称大幅提升推理效率，生图时间缩短 75%。

官方表示，混元 DiT 模型的使用门槛也大幅降低，用户可以基于 ComfyUI 的图形化界面使用腾讯混元文生图模型能力。同时，混元 DiT 模型已经部署至 HuggingFaceDiffusers 通用模型库中，用户仅用三行代码即可调用混元 DiT 模型，无需下载原始代码库。

在此之前，腾讯曾宣布混元文生图大模型全面升级并对外开源，供企业、个人开发者免费商用。腾讯方面称其为“业内首个”中文原生的 DiT 架构文生图开源模型，支撑中英文双语输入及理解。其采用与 sora 一致的 DiT 架构，不仅可支撑文生图，也可作为视频等多模态视觉生成的基础。

运转该模型需要支撑 CUDA 的英伟达 GPU，单独运转混元 DiT 所需的最低显存为 11GB，同时运转 DialogGen（腾讯推出的文本转图像多模态交互式对话系统）和混元 DiT 则至少需要 32GB 的显存，腾讯表示他们已经在 Linux 上测试了英伟达的 V100 和 A100 GPU。

IT之家附链接：代码（GitHub）点此返回模型（Hugging Face）点此返回

{{userData.name}}已认证

腾讯混元文生图开源大模型加速库发布：生图时间缩短 75%

雪上加霜：因存起火隐患，Humane 通知 AI Pin 用户立即停止应用充电盒

Stable Audio Open 开源 AI 模型发布：48.6 万个样本训练，可创建 47 秒短音频 / 音效等

微软开源 bitnet.cpp 1-bit LLM 推理框架：不靠 GPU 可本地运行千亿参数 AI 模型，能耗最多降低 82.2%

秒变Midjourney高手！精选 52 条高级感的 sref 风格代码

Meta 用 AI 生成北极光图片，遭网友怒喷

中国电信自研 AI 节能系统：年均节电 8 亿度，节约电费 5.2 亿元

英伟达 CEO 黄仁勋展望公司未来：坐拥 5 万名员工、部署 1 亿个 AI 助手

成功率提升15%，浙大、碳硅智慧用LLM进行多属性分子优化，登Nature子刊

特斯拉人形机器人 Optimus 现场做饮料，员工证实有人在远程控制

研究：AI 医疗建议存巨大安全隐患，22% 的回答可能致死