AI在线 AI在线

谷歌推出 Imagen 4 / Ultra 系列 AI 文生图模型,每张图片 0.04 美元起

谷歌发布最新文本生成图像模型Imagen 4系列,包含标准版和高端Ultra版,定价分别为0.04美元和0.06美元每张。谷歌称其效果优于Dall-E和Midjourney,但实际表现仍显机械化。目前已在Gemini API付费预览版上线。#AI绘画##谷歌AI#

谷歌推出了其最新版本的文本生成图像模型 Imagen 4,并推出了高端版本 Imagen 4 Ultra。与前代产品 Imagen 3 相比,此次更新旨在显著提升文本渲染效果。目前,这两个版本已上线 Gemini API 的付费预览版,并在 Google AI Studio 提供有限的免费测试。

谷歌推出 Imagen 4 / Ultra 系列 AI 文生图模型,每张图片 0.04 美元起

谷歌将 Imagen 4 定位为“适用于大多数任务”的通用模型,每张图像为定价 0.04 美元(AI在线注:现汇率约合 0.29 元人民币)。而 Imagen 4 Ultra 则被设计为能够更精准地遵循文本提示词的高端版本,其价格较普通版高出 50%,每张图像收费 0.06 美元(现汇率约合 0.43 元人民币)。谷歌声称,与 Dall-E 和 Midjourney 等其他图像生成器相比,Imagen 4 Ultra 的输出结果更为“出色(strong)”。

在展示环节中,谷歌展示了 Imagen 4 Ultra 生成的一系列图像,包括一幅三格漫画,内容是一艘小型宇宙飞船被一只巨大的蓝色太空蜥蜴攻击,漫画中还配有“嘎吱”等音效,甚至出现了令人费解的“哈迪”字样。该图像完全按照文本提示词生成,效果尚可,类似于 3D 应用程序中的卡通渲染效果。

谷歌推出 Imagen 4 / Ultra 系列 AI 文生图模型,每张图片 0.04 美元起

谷歌推出 Imagen 4 / Ultra 系列 AI 文生图模型,每张图片 0.04 美元起

谷歌推出 Imagen 4 / Ultra 系列 AI 文生图模型,每张图片 0.04 美元起

谷歌推出 Imagen 4 / Ultra 系列 AI 文生图模型,每张图片 0.04 美元起

Imagen 4 Ultra

另一个文本提示词是“京都复古旅行明信片的正面:樱花树下的标志性宝塔,远处的雪山,晴朗的蓝天,鲜艳的色彩”。Imagen 4  Ultra 按照提示生成了图像,虽然风格较为普通,但细节上基本符合要求。此外,还有展示登山情侣在岩石上挥手的图像,以及一幅“前卫”风格的时尚摄影图像。这些图像质量确实不错,也精准地符合了文本提示词,但整体仍然显得高度机械化。

尽管 Imagen 4 在性能上较前代有所提升,但其表现并未让人眼前一亮,尤其是在与市场领导者 Dall-E 3 和 Midjourney 7 相比时。此外,在最初的热情过后,公众对 AI 艺术的兴趣似乎正在消退,其主要应用场景似乎变成了社交媒体上的垃圾广告。

相关资讯

谷歌 Veo 2 升级可生成更具电影感视频,文本、音频 AI 同步升级

谷歌为视频AI模型Veo 2推出修复、外扩等新功能,可自动移除干扰元素或扩展画面,支持电影技巧预设,提升视频编辑效率。同步更新的还有Imagen 3图像模型及音频AI工具。#谷歌AI# #视频生成技术#
4/10/2025 2:54:59 PM
远洋

Midjourney 迎来最强对手,种子轮融资大佬云集,测试版让马斯克一「键」穿越

机器之能报道编辑:SIA一直以来,Midjourney  稳坐 AIGC 文生图的王座,少有威胁,直到这家公司的出现。8 月 23 日,生成式人工智能创业公司 Ideogram AI 正式官宣:「我们正在开发最先进的人工智能工具,使创意表达变得更容易、更有趣、更高效。」官网写道。团队核心成员也是谷歌大脑 Imagen 团队主要成员, Ideogram AI 也被认为试图将 Imagen 发扬光大:Mohammad Norouzi(CEO )、Jonathan Ho (联合创始人)、 William Chan 和 C
8/24/2023 5:35:00 PM
机器之能

文生图技能再进化,谷歌推出 Imagen 3:更准确、更具创造性

谷歌公司在今天召开的 I / O 2024 开发者大会上,宣布推出了 Imagen 3,进一步增强了文本生成图片的技术能力。谷歌人工智能研究部门 DeepMind 负责人德米斯-哈萨比斯(Demis Hassabis)说,与前代产品 Imagen 2 相比,Imagen 3 能更准确地理解文字提示,并将其转化为图像,而且其生成的图像更具“创造性和细节”,且模型产生的干扰元素和错误也更少。为了打消人们对 Deepfake 可能性的担忧,谷歌表示,Imagen 3 将使用 DeepMind 开发的 SynthID 方法
5/15/2024 2:36:36 AM
故渊
  • 1