随意组合
多模态生成框架新SOTA:文本+空间+图像随意组合,20W+数据开源,复旦腾讯优图出品
能处理任意条件组合的新生成框架来了! 复旦大学、腾讯优图实验室等机构的研究人员提出UniCombine,一种基于DiT的多条件可控生成框架,能够处理包括但不限于文本提示、空间映射和主体图像在内的任意控制条件的任意组合,并保持高度的一致性和出色的和谐性。 具体效果be like:图片据了解,现有的多条件可控生成框架或是只能处理单一种类的多个条件,或是只适用于某种特定的多类别组合,从而普遍缺乏通用性的多类别 多条件的组合式生成能力。
4/17/2025 2:55:00 AM
- 1
资讯热榜
全球首个设计Agent Lovart席卷全球,颠覆性功能与幕后团队揭秘
OpenMemory MCP发布!AI记忆本地共享,Claude、Cursor一键同步效率翻倍!
超多案例!让 Lovart 作图更好看更高效的提示词在这里了!
“逆天”研究!Cursor 与 Windsurf 背后的核心算法机制曝光!网友惊呼:Cursor代码总出Bug的原因找到了
谷歌Android Auto迎来Gemini AI,打造更智能车载体验
Unsloth 微调 Qwen3 实战教程来了!
免费开放!通义千问Qwen上线「深入研究」Deep Research功能
TikTok 推出新 AI 工具 “AI Alive”,轻松将照片变成视频
标签云
人工智能
AI
OpenAI
AIGC
ChatGPT
DeepSeek
模型
AI绘画
数据
机器人
谷歌
大模型
Midjourney
用户
智能
开源
微软
学习
GPT
Meta
图像
AI创作
技术
Gemini
论文
马斯克
Stable Diffusion
算法
代码
芯片
生成式
蛋白质
英伟达
腾讯
开发者
神经网络
研究
Anthropic
3D
计算
Sora
机器学习
AI设计
AI for Science
GPU
苹果
AI视频
场景
华为
百度
生成
人形机器人
搜索
预测
训练
Claude
伟达
xAI
深度学习
Transformer
大语言模型
字节跳动
模态
智能体
具身智能
文本
驾驶
神器推荐
Copilot
LLaMA
视觉
算力
应用
安全
API
视频生成
干货合集
大型语言模型
Agent
工具