字节发布创新图像合成技术XVerse：对多个个体进行独立且精确的控制

作者：AI在线 2025-07-01 11:00

近日，字节正式发布其最新图像合成技术 ——XVerse，旨在提供高精度的多主体图像生成解决方案。这项创新的技术使得用户能够对多个个体进行独立且精确的控制，极大地提升了个性化和复杂场景生成的能力。 XVerse 的核心在于其独特的 DiT 调制方法，能够在不影响整体图像潜在特征的情况下，对每个主体的身份和语义属性进行调控。

近日，字节正式发布其最新图像合成技术 ——XVerse，旨在提供高精度的多主体图像生成解决方案。这项创新的技术使得用户能够对多个个体进行独立且精确的控制，极大地提升了个性化和复杂场景生成的能力。

XVerse 的核心在于其独特的 DiT 调制方法，能够在不影响整体图像潜在特征的情况下，对每个主体的身份和语义属性进行调控。通过将参考图像转化为特定于令牌的文本流偏移量，XVerse 使得图像合成更加灵活和直观，用户只需简单的文字描述，即可生成符合预期的高保真图像。

在技术实现上，XVerse 要求用户首先创建一个包含 Python3.10.16的 conda 环境，并安装相应的依赖项。随后，用户需要下载相关的检查点和人脸识别模型，以保证技术的顺利运行。值得注意的是，XVerse 提供了一个互动的 Gradio 演示，用户可以通过上传图像和输入描述，实时生成图像，并调节多个参数来优化生成效果。

XVerse 的用户界面友好，提供了丰富的输入设置选项，包括图像描述、生成图像的高度和宽度等，用户可以灵活调整生成图像的特征。此外，用户可以使用 “检测与分割” 功能对上传的图像进行分析，自动裁剪人脸并生成相应的描述，从而提升生成的准确性和个性化。

总之，XVerse 作为一项革命性的技术，展现了图像合成的广阔前景，预计将对数字内容创作、广告以及艺术等多个领域产生深远影响。随着未来版本的发布，XVerse 有望成为业界标准，助力更多创意的实现。

地址:https://github.com/bytedance/XVerse

元象XVERSE-65B：国内最大开源模型来了，高性能无条件免费商用

国内此前开源了多个 70 到 130 亿参数大模型，落地成果涌现，开源生态系统初步建立。随着智能体等任务复杂性与数据量的提升，业界与社区对更「大」模型的需求愈发迫切。研究表明，参数量越高，高质量训练数据越多，大模型性能才能不断提升。而业界普遍共识是达到 500 到 600 亿参数门槛，大模型才能「智能涌现」，在多任务中展现强大性能。但训练此量级模型成本高昂，技术要求较高，目前主要为闭源付费提供。在国外开源生态中，Llama2-70B 和 Falcon-180B 等标杆模型为有条件开源，设置了月活跃用户数或收入等商

11/6/2023 2:53:00 PM 机器之心

国内最大MoE开源大模型来了，还基于此搞出个火遍港台的AI聊天应用

元象 XVERSE 发布中国最大 MoE 开源模型：XVERSE-MoE-A36B，加速 AI 应用低成本部署，将国产开源提升至国际领先水平。该模型总参数 255B，激活参数 36B，达到 100B 模型性能的「跨级」跃升，同时训练时间减少 30%，推理性能提升 100%，使每 token 成本大幅下降。元象「高性能全家桶」系列全部开源，无条件免费商用，让海量中小企业、研究者和开发者能按需选择。MoE（Mixture of Experts）是业界最前沿的混合专家模型架构，将多个细分领域的专家模型组合成一个超级模型

9/13/2024 11:34:00 AM 机器之心

字节发布创新图像合成技术XVerse：对多个个体进行独立且精确的控制

相关资讯

元象XVERSE-65B：国内最大开源模型来了，高性能无条件免费商用

国内最大MoE开源大模型来了，还基于此搞出个火遍港台的AI聊天应用

消息称字节整合 AI 研发团队，AI Lab 即将全部并入 Seed