AI图像生成
字节跳动开源项目UNO:图片生成可以保持角色、物体一致性
人工智能(AI)在图像生成领域取得了显著的进展,但如何让AI在生成不同场景或进行多次创作时,保持图像中特定角色或物体的一致性,一直是行业内的重要挑战。 近日,字节跳动旗下的智能创作团队发布了其最新的开源项目 UNO,旨在通过创新技术,解锁更强的生成可控性,尤其是在保持图像主体一致性方面,为AI图像生成领域带来了新的突破。 AI作图“脸盲症”?UNO帮你记住“主角”在以往的AI图像生成过程中,即使输入相同的描述,每次生成的人物、物品也可能在外观上存在显著差异,这使得在需要保持角色或物体在不同图像中形象统一的应用场景中面临诸多不便。
4/14/2025 10:01:22 AM
AI在线
ChatGPT图像生成功能上线,免费用户迎来创作新机遇
在科技快速发展的时代,人工智能(AI)正以惊人的速度渗透到我们生活的方方面面。 近期,ChatGPT 迎来了一项备受期待的新功能 ——AI 图像生成。 这一功能不仅满足了广大用户的创意需求,还以其独特的 “吉卜力风格” 受到热烈欢迎。
3/31/2025 4:21:00 PM
AI在线
Midjourney新研究发力创意文本生成,让LLM写作更具创意
以AI图像生成技术闻名遐迩的Midjourney,正悄然展现其在人工智能领域的更广阔野心。 这家拥有庞大用户群体的科技公司,在自研计算和AI硬件的消息之后,近期携手纽约大学(NYU)的机器学习专家,发布了一项关于训练文本生成大语言模型(LLMs)的最新研究成果。 该研究聚焦于提升LLM在创意写作方面的能力,旨在使AI模型能够像Meta的Llama和Mistral等开源模型一样,写出更具创造性的文本。
3/25/2025 10:21:00 AM
AI在线
字节推文生图框架InfiniteYou :可保持人脸特征,场景随便换
字节跳动悄悄咪咪推出了一款名为 InfiniteYou (InfU), 的图像生成神器。 简单的说,这是一款文本到图像的生成模型,它的厉害之处在于,能够根据你输入的文字描述,生成带有你个人身份特征的高质量图像。 这可不是简单的换脸App能比的,它更注重的是在灵活变换场景和内容的同时,精准保留你的身份特征。
3/21/2025 3:13:00 PM
AI在线
谷歌Gemini 2.0 Flash引发争议:AI轻松去除图片水印引发版权担忧
一场关于AI边界的新争议正在科技圈掀起波澜。 谷歌最新推出的人工智能模型Gemini2.0Flash被发现具有令人担忧的能力——它可以轻松去除图片水印,包括来自盖蒂图片社等知名图库的专业水印,这一功能引发了创作者和版权持有者的广泛关注。 上周,谷歌扩大了Gemini2.0Flash模型图像生成功能的访问范围,使更多用户能够体验其强大的图像生成和编辑能力。
3/17/2025 9:27:00 AM
AI在线
谷歌Gemini 2.0 Flash放出原生图像生成功能:支持多轮对话式实时编辑编辑
继Gemma3之后,谷歌又给我们带来了一位“闪电侠”——Gemini2.0Flash,而且人家这次是带着独门绝技来的:原生图像生成! 要知道,以前的AI图像生成,很多时候都是大型语言模型(LLM)先理解你的文字,然后再把意思“翻译”给专门生成图像的扩散模型。 这中间难免会有些“失真”,就像隔着好几个人传话,最后意思都变味儿了。
3/13/2025 9:50:00 AM
AI在线
Luma AI 开源的图像预训练技术IMM实现图像生成十倍提速
你们有没有觉得,辛辛苦苦用海量数据喂养出来的图像模型,在生成高质量图片时,总像蜗牛爬树般慢吞吞?别急,Luma AI 最近开源了一项名为 Inductive Moment Matching (IMM) 的图像模型预训练技术,据说能让模型以前所未有的“闪电”速度生成高质量图像,简直是炼丹炉里的涡轮增压!算法停滞?Luma AI 怒砸“天花板”近年来,AI 社区普遍感受到,生成式预训练似乎遇到了瓶颈。 尽管数据量持续攀升,但算法创新却相对停滞。 Luma AI 认为,这并非数据不够,而是算法没能充分挖掘数据的潜力,这如同手握金矿却只会用锄头挖土,效率实在堪忧。
3/12/2025 3:16:00 PM
AI在线
资讯热榜
标签云
AI
人工智能
OpenAI
AIGC
模型
ChatGPT
DeepSeek
谷歌
AI绘画
机器人
大模型
数据
Midjourney
开源
Meta
智能
微软
用户
AI新词
GPT
学习
技术
智能体
马斯克
Gemini
图像
Anthropic
英伟达
AI创作
训练
LLM
论文
代码
算法
Agent
AI for Science
芯片
苹果
腾讯
Stable Diffusion
Claude
蛋白质
开发者
生成式
神经网络
xAI
机器学习
3D
RAG
人形机器人
研究
AI视频
生成
大语言模型
具身智能
Sora
工具
GPU
百度
华为
计算
字节跳动
AI设计
AGI
大型语言模型
搜索
视频生成
场景
深度学习
DeepMind
架构
生成式AI
编程
视觉
Transformer
预测
AI模型
伟达
亚马逊
MCP