AI图像生成

字节跳动开源项目UNO：图片生成可以保持角色、物体一致性

字节跳动开源项目UNO：图片生成可以保持角色、物体一致性

人工智能（AI）在图像生成领域取得了显著的进展，但如何让AI在生成不同场景或进行多次创作时，保持图像中特定角色或物体的一致性，一直是行业内的重要挑战。近日，字节跳动旗下的智能创作团队发布了其最新的开源项目 UNO，旨在通过创新技术，解锁更强的生成可控性，尤其是在保持图像主体一致性方面，为AI图像生成领域带来了新的突破。 AI作图“脸盲症”?UNO帮你记住“主角”在以往的AI图像生成过程中，即使输入相同的描述，每次生成的人物、物品也可能在外观上存在显著差异，这使得在需要保持角色或物体在不同图像中形象统一的应用场景中面临诸多不便。

4/14/2025 10:01:22 AM AI在线

ChatGPT图像生成功能上线，免费用户迎来创作新机遇

ChatGPT图像生成功能上线，免费用户迎来创作新机遇

在科技快速发展的时代，人工智能（AI）正以惊人的速度渗透到我们生活的方方面面。近期，ChatGPT 迎来了一项备受期待的新功能 ——AI 图像生成。这一功能不仅满足了广大用户的创意需求，还以其独特的 “吉卜力风格” 受到热烈欢迎。

3/31/2025 4:21:00 PM AI在线

Midjourney新研究发力创意文本生成，让LLM写作更具创意

Midjourney新研究发力创意文本生成，让LLM写作更具创意

以AI图像生成技术闻名遐迩的Midjourney，正悄然展现其在人工智能领域的更广阔野心。这家拥有庞大用户群体的科技公司，在自研计算和AI硬件的消息之后，近期携手纽约大学（NYU）的机器学习专家，发布了一项关于训练文本生成大语言模型(LLMs)的最新研究成果。该研究聚焦于提升LLM在创意写作方面的能力，旨在使AI模型能够像Meta的Llama和Mistral等开源模型一样，写出更具创造性的文本。

3/25/2025 10:21:00 AM AI在线

字节推文生图框架InfiniteYou ：可保持人脸特征，场景随便换

字节推文生图框架InfiniteYou ：可保持人脸特征，场景随便换

字节跳动悄悄咪咪推出了一款名为 InfiniteYou （InfU），的图像生成神器。简单的说，这是一款文本到图像的生成模型，它的厉害之处在于，能够根据你输入的文字描述，生成带有你个人身份特征的高质量图像。这可不是简单的换脸App能比的，它更注重的是在灵活变换场景和内容的同时，精准保留你的身份特征。

3/21/2025 3:13:00 PM AI在线

谷歌Gemini 2.0 Flash引发争议：AI轻松去除图片水印引发版权担忧

谷歌Gemini 2.0 Flash引发争议：AI轻松去除图片水印引发版权担忧

一场关于AI边界的新争议正在科技圈掀起波澜。谷歌最新推出的人工智能模型Gemini2.0Flash被发现具有令人担忧的能力——它可以轻松去除图片水印，包括来自盖蒂图片社等知名图库的专业水印，这一功能引发了创作者和版权持有者的广泛关注。上周，谷歌扩大了Gemini2.0Flash模型图像生成功能的访问范围，使更多用户能够体验其强大的图像生成和编辑能力。

3/17/2025 9:27:00 AM AI在线

谷歌Gemini 2.0 Flash放出原生图像生成功能：支持多轮对话式实时编辑编辑

谷歌Gemini 2.0 Flash放出原生图像生成功能：支持多轮对话式实时编辑编辑

继Gemma3之后，谷歌又给我们带来了一位“闪电侠”——Gemini2.0Flash，而且人家这次是带着独门绝技来的:原生图像生成! 要知道，以前的AI图像生成，很多时候都是大型语言模型（LLM）先理解你的文字，然后再把意思“翻译”给专门生成图像的扩散模型。这中间难免会有些“失真”，就像隔着好几个人传话，最后意思都变味儿了。

3/13/2025 9:50:00 AM AI在线

Luma AI 开源的图像预训练技术IMM实现图像生成十倍提速

Luma AI 开源的图像预训练技术IMM实现图像生成十倍提速

你们有没有觉得，辛辛苦苦用海量数据喂养出来的图像模型，在生成高质量图片时，总像蜗牛爬树般慢吞吞?别急，Luma AI 最近开源了一项名为 Inductive Moment Matching （IMM）的图像模型预训练技术，据说能让模型以前所未有的“闪电”速度生成高质量图像，简直是炼丹炉里的涡轮增压!算法停滞?Luma AI 怒砸“天花板”近年来，AI 社区普遍感受到，生成式预训练似乎遇到了瓶颈。尽管数据量持续攀升，但算法创新却相对停滞。 Luma AI 认为，这并非数据不够，而是算法没能充分挖掘数据的潜力，这如同手握金矿却只会用锄头挖土，效率实在堪忧。

3/12/2025 3:16:00 PM AI在线

资讯热榜

免费！让图片放大不失真的位图转矢量图神器 Tmttool AI应用新纪元：2025中国AI应用排行榜榜单揭晓丨2025年1月 6秒视频10秒生成！全新AI视频神器 Grok Imagine 深度体验+元提示词分享最火、最全的Agent记忆综述，NUS、人大、复旦、北大等联合出品后悔没早发现！教你用谷歌Gemini生成精美PPT（附提示词） GGUF 是什么？一文看懂大模型里最火的模型格式 Sora、可灵、即梦哪家强？AI视频软件深度测评！ Mac也能跑Qwen3，一文看懂本地部署qwen 3配置要求

标签云

AI 人工智能 OpenAI AIGC 模型 ChatGPT 谷歌 DeepSeek AI新词 AI绘画大模型机器人数据 Midjourney 开源 Meta 微软智能用户 GPT 学习英伟达 Gemini 智能体技术马斯克 Anthropic 图像 AI创作训练 LLM 论文 AI for Science 代码腾讯苹果算法 Agent Claude 芯片具身智能 Stable Diffusion xAI 蛋白质人形机器人开发者生成式神经网络机器学习 AI视频 3D 字节跳动大语言模型 RAG Sora 百度研究 GPU 生成华为工具 AGI 计算生成式AI AI设计大型语言模型搜索亚马逊 AI模型视频生成特斯拉 DeepMind 场景 Copilot 深度学习 Transformer 架构 MCP 编程视觉