图像
不止吉卜力!GPT-4o新玩法全网疯传,网友:AI成精了
万万没想到,GPT-4o图像生成功如此火爆,奥特曼在线直呼太疯狂! 前有「吉卜力风」一夜爆火,今有「文艺复兴」席卷全网。 GPT-4o直接让外国网友Cosplay「文艺复兴名场面」!
3/31/2025 9:27:03 AM
新智元
刷屏网络后,ChatGPT 开始屏蔽模仿吉卜力风格的图像生成请求
日前,随着 OpenAI 推出其新款 GPT-4o 图像生成能力,网络上涌现出大量模仿日本著名动画公司吉卜力风格的 AI 生成卡通和表情包,引起了广泛关注。 用户们在社交平台上分享了许多恶搞作品,其中有一幅描绘肯尼迪遇刺事件的作品尤为引人注目。 此外,许多人将自己的照片转化为吉卜力电影风格的图像,进一步推动了这一潮流。
3/28/2025 9:20:00 AM
AI在线
OpenAI在图片领域站起来了!
出品 | 51CTO技术栈(微信号:blog51cto)26日凌晨,OpenAI推出了GPT4o图像生成,可以说解决了此前Midjourney等扩散模型很难解决的问题,业内为之大为赞叹。 这是用手机拍摄的玻璃白板的广角图像,拍摄地点是一间俯瞰海湾大桥的房间。 视野中可以看到一位女士正在写字,她身穿一件印有大型 OpenAI 标志的 T 恤。
3/26/2025 9:29:12 AM
ChatGPT拒绝生成玫瑰图像引发网络热议,AI禁忌词再添新例
近日,一位网友在社交平台 X 上发现,ChatGPT 的最新版本 GPT-4o 在尝试生成一朵玫瑰花的图像时,竟然一口回绝,声称 “我无法生成这朵玫瑰的图像,因为它未能符合我们的内容政策”。 这一意外的拒绝迅速引起了众多网友的关注和讨论,许多人开始探究其中的原因,甚至试图找到绕过这一限制的方法。 为了验证这个现象,网友们纷纷进行了一系列实验。
3/6/2025 11:22:00 AM
AI在线
Gemini或将新增功能Image to Code 应用亮相AI Studio
2025 年 3 月 6 日消息,根据X平台用户最新爆料,一款名为“Image to Code”的隐藏初创应用悄然出现在AI Studio中。 这款应用由Gemini技术驱动,能够以图像作为输入,通过分析和推理,最终生成相应的程序代码,绘制出程序化的图像。 这一消息迅速引发了科技爱好者和开发者的广泛关注。
3/6/2025 10:12:00 AM
AI在线
微软开源图片模型ART,可生成多图层透明图片
在图像生成领域,多层图像生成技术正逐渐改变用户与生成模型的互动方式,允许用户隔离、选择并编辑特定的图像层。 近日,微软研究人员推出了一种名为 “Anonymous Region Transformer”(ART)的新型技术,它能够根据全球文本提示和匿名区域布局,直接生成可变多层透明图像。 ART 的设计灵感来源于 “图式理论”,通过采用匿名区域布局,使生成模型可以自主决定哪些视觉信息与哪些文本信息对齐。
3/5/2025 9:56:00 AM
AI在线
官宣!可灵 AI 安卓应用正式上线
日前,可灵 AI 官方宣布,备受期待的安卓应用终于上线。 这款应用将用户所喜爱的 Kling AI 功能集中于一处,用户只需轻轻点击,即可体验丰富多样的功能,包括 Frames、Elements 等。 根据官方页面介绍,KLING AI 的核心功能包括 AI 视频生成和 AI 图像生成。
3/4/2025 3:58:00 PM
AI在线
智谱发布首个能生成汉字的开源文生图模型CogView4
2025年3月4日,北京智谱华章科技有限公司宣布推出首个支持生成汉字的开源文生图模型——CogView4。 该模型在DPG-Bench基准测试中综合评分排名第一,成为开源文生图模型中的SOTA(State of the Art),并遵循Apache2.0协议,是首个支持该协议的图像生成模型。 CogView4具备强大的复杂语义对齐和指令跟随能力,支持任意长度的中英双语输入,并能生成任意分辨率的图像。
3/4/2025 1:39:00 PM
AI在线
重磅!MiniMax推全新图像生成模型 Image-01,使用成本仅为 1/10
日前,AI科技公司MiniMax 宣布推出其首款文本到图像生成模型 ——Image-01,用户现在可以通过 MiniMax 的 API 平台访问这一服务。 Image-01的几个主要特点令人瞩目。 该模型具有精确的提示控制能力,基于 MiniMax 在开发 Hailuo AI Video-01系列中的行业领先经验,Image-01能够提供优越的提示与图像之间的保真度。
3/4/2025 9:39:00 AM
AI在线
谷歌发布 SpeciesNet AI 模型 助力野生动物识别
近日,谷歌宣布开源一款名为 SpeciesNet 的人工智能模型,该模型旨在通过分析相机捕捉到的照片来识别动物种类。 随着科研工作者在全球范围内使用相机陷阱(连接红外传感器的数字相机)进行野生动物研究,这些设备虽然提供了宝贵的数据,但同时也会产生大量数据,处理这些数据往往需要耗费数天到数周的时间。 为了解决这一问题,谷歌在六年前启动了 “野生动物洞察” 项目,属于其谷歌地球外展慈善计划的一部分。
3/4/2025 9:29:00 AM
AI在线
PhotoDoodle AI 只需几个提示即可将您的照片变成异想天开的艺术作品
字节跳动携手中国和新加坡大学研究团队推出的新型AI图像编辑系统PhotoDoodle,正在重新定义我们对图像创作的理解。 这款基于Flux.1模型的创新技术,能够从少量样本中学习艺术风格,并精准执行特定编辑指令,为创意表达开辟了全新可能。 以 Flux.1为基础PhotoDoodle的核心是研究团队首先开发的OmniEditor系统,它巧妙地利用LoRA(低秩自适应)技术对德国初创公司Black Forest Labs的Flux.1图像生成模型进行了改良。
2/26/2025 9:27:00 AM
AI在线
ImageNet-D 详解:严格评估神经网络的鲁棒性
神经网络在零样本图像分类中取得了惊人的成就,但它们真的能“看”得有多好呢? 现有的用于评估这些模型鲁棒性的数据集仅限于网络上的图像或通过耗时且资源密集的手动收集创建的图像。 这使得系统评估这些模型在面对未见数据和真实世界条件(包括背景、纹理和材质的变化)时的泛化能力变得困难。
2/20/2025 2:44:06 PM
二旺
耶鲁大学和Adobe提出SynthLight:智能重塑人像照明,打造完美光影
耶鲁大学和Adobe提出一种用于人像重新照明的扩散模型SynthLight,该方法将图像重新照明视为重新渲染问题,其中像素会根据环境照明条件的变化而变化。 在真实肖像照片上可以产生逼真的照明效果,包括颈部的明显投射阴影和皮肤上的自然镜面高光。 相关链接论文:: 是一种用于人像重新照明的扩散模型。
2/11/2025 10:01:19 AM
AIGC Studio
小红书提出新面部视频交换方法DynamicFace,可生成高质量且一致的视频面部图像
DynamicFace是一种新颖的面部视频交换方法,旨在生成高质量且一致的视频面部图像。 该方法结合了扩散模型的强大能力和可插拔的时间层,以解决传统面部交换技术面临的两个主要挑战:在保持源面部身份的同时,准确传递目标面部的运动信息。 通过引入四种细粒度的面部条件,DynamicFace能够对面部特征进行更精确的控制,从而实现高保真度的面部交换。
2/6/2025 10:45:00 AM
AIGC Studio
图像编辑大一统?多功能图像编辑框架Dedit:可基于图像、文本和掩码进行图像编辑
本文经AIGC Studio公众号授权转载,转载请联系出处。 今天给大家介绍一个基于图像和文本的编辑的框架D-Edit,它是第一个可以通过掩码编辑实现图像编辑的项目,近期已经在HuggingFace开放使用,并一度冲到了热门项目Top5。 使用 D-Edit 的编辑流程。
1/17/2025 10:30:00 AM
AIGC Studio
UIUC提出InstructG2I:从多模态属性图合成图像,结合文本和图信息生成内容更丰富有趣!
今天给大家介绍的这项工作是伊利诺伊大学厄巴纳-香槟分校的研究者们提出的一个新任务 Graph2Image,其特点是通过调节图信息来合成图像,并引入了一种名为InstructG2I的新型图调节扩散模型来解决这个问题。 在INSTRUCTG2I的工作中,研究者们开发了一种新方法来生成图像,这种方法不仅依赖于文本描述,还考虑到图中其他相关信息。 想象一下,如果你要画一幅画,除了有一个简单的描述,比如“雪中的房子”,你还可以参考与这个房子相关的其他房子或景物的信息。
1/16/2025 11:00:00 AM
AIGC Studio
Retinex-Diffusion:让图像照明更加自然、细腻、富有层次感。
本文经AIGC Studio公众号授权转载,转载请联系出处。 这项研究主要是针对如何智能控制图像中的光照,采用了一种不需要重新训练模型的新方法。 简而言之,研究人员利用一种叫作Retinex理论的方法,先识别出图像中的光照元素,然后用这些元素来指导图像生成模型。
1/15/2025 10:00:00 AM
AIGC Studio
Adobe发布TurboEdit:可以通过文本来编辑图像,编辑时间<0.5秒!
今天给大家介绍Adobe研究院新的研究TurboEdit,可以通过文本来编辑图像,通过一句话就能改变图像中的头发颜色、衣服、帽子、围巾等等。 而且编辑飞快,0.5秒。 简直是图像编辑的利器。
1/6/2025 10:30:00 AM
Zongze Wu等
资讯热榜
智谱AI全新企业级超级助手Agent CoCo正式上线
苹果发布全新Xcode 26开发者工具:内置ChatGPT先进AI功能
豆包App“一句话P图”功能全新升级 基于SeedEdit 3.0实现全面优化
DeepSeek前高管秘密创业,新AI Agent项目已获顶级VC押注
那个男人回来了!Ilya现身多伦多大学毕业典礼:AI 像是用数字方式复制出来的大脑!不管你愿不愿意,AI都将深刻影响你的一生!
ChatGPT 语音功能升级,实时翻译对话更自然流畅
支持MCP!开源智能体开发框架 Rowboat:打造你的智能助手只需几分钟
苹果向开发者开放本地AI能力,推出全新Foundation Models框架
标签云
人工智能
AI
OpenAI
AIGC
模型
ChatGPT
DeepSeek
AI绘画
数据
谷歌
机器人
大模型
Midjourney
用户
智能
开源
微软
GPT
学习
Meta
图像
技术
AI创作
Gemini
论文
马斯克
Stable Diffusion
算法
代码
英伟达
Anthropic
芯片
生成式
开发者
蛋白质
腾讯
神经网络
研究
3D
生成
训练
苹果
计算
智能体
Sora
机器学习
AI设计
AI for Science
Claude
GPU
AI视频
人形机器人
华为
搜索
场景
百度
大语言模型
xAI
预测
伟达
深度学习
Transformer
字节跳动
Agent
模态
具身智能
神器推荐
LLaMA
文本
视觉
Copilot
算力
工具
LLM
驾驶
API
大型语言模型
应用
RAG
亚马逊