扩散变换器
新开源 AI 系统 OmniGen 2:像GPT-4o 一样融合了图像和文本生成
近日,北京人工智能研究院推出了全新的开源系统 ——OmniGen2。 这一系统专注于文本到图像的生成、图像编辑和上下文图像创作。 与2024年发布的第一代 OmniGen 相比,OmniGen2采用了两条独立的解码路径:一条用于文本生成,另一条用于图像生成,且各自拥有独立的参数和解耦的图像标记器。
6/30/2025 3:00:50 PM
AI在线
Direct3D-S2 横空出世!千兆级3D生成提速近10倍,AI建模进入新纪元!
近日,一款名为 Direct3D-S2的全新3D 生成框架引发了业界热议。 该框架通过创新的 空间稀疏注意力(SSA)机制,显著提升了高分辨率3D 图像生成的质量与效率,为千兆级3D 生成提供了更具可扩展性的解决方案。 AIbase 综合整理最新信息,带您深入了解 Direct3D-S2的技术突破与应用前景。
5/27/2025 4:01:00 PM
AI在线
资讯热榜
标签云
AI
人工智能
OpenAI
AIGC
模型
ChatGPT
谷歌
DeepSeek
AI绘画
大模型
机器人
数据
AI新词
Midjourney
开源
Meta
微软
智能
用户
GPT
学习
智能体
技术
Gemini
马斯克
英伟达
Anthropic
图像
AI创作
训练
LLM
论文
代码
算法
苹果
AI for Science
腾讯
Agent
Claude
芯片
Stable Diffusion
具身智能
蛋白质
xAI
开发者
生成式
人形机器人
神经网络
机器学习
3D
AI视频
RAG
大语言模型
Sora
研究
百度
生成
GPU
字节跳动
工具
华为
AGI
计算
大型语言模型
AI设计
搜索
生成式AI
视频生成
亚马逊
DeepMind
AI模型
特斯拉
场景
深度学习
Transformer
架构
MCP
Copilot
编程
视觉