AI在线 AI在线

谷歌Gemini重磅更新:直接选用Imagen生成图像

近日,谷歌对其 AI 服务 Gemini 进行了重要升级,用户现在可以直接在 Gemini 界面中选择 Imagen 模型来生成高质量的图像。 这一更新不仅提升了用户体验,还为开发者提供了更多的灵活性和便捷性。 在此次更新中,谷歌还启用了 llms.txt 文件,旨在为 AI Agent 提供最新的 API 和 SDK 使用方法。

近日,谷歌对其 AI 服务 Gemini 进行了重要升级,用户现在可以直接在 Gemini 界面中选择 Imagen 模型来生成高质量的图像。这一更新不仅提升了用户体验,还为开发者提供了更多的灵活性和便捷性。

在此次更新中,谷歌还启用了 llms.txt 文件,旨在为 AI Agent 提供最新的 API 和 SDK 使用方法。这一机器可读文档遵循 MCP(Model-Consumable Patois)规范,使开发者能够轻松获取最佳实践,进而更高效地构建应用。

谷歌大模型Gemini

具体而言,用户在 Gemini 的界面中,可以轻松找到并选择 Imagen 模型,这一模型以其强大的图像生成能力而闻名。此外,开发者们可以通过访问 Google 的 API 文档网站(ai.google.dev)获取到 llms.txt 文件,确保他们的 AI Agent 总是使用最新的技术规范。

这种便捷的访问方式,不仅有助于加速开发流程,还能提升 AI 应用的整体性能。通过结合 Gemini CLI 的扩展功能,开发者能够更全面地利用这一新特性,快速实现自己的创意和项目。

这次 Gemini 的更新,不仅让图像生成变得更为简单直接,也为开发者们提供了强有力的工具,帮助他们在快速变化的 AI 领域中保持竞争力。随着 AI 技术的不断发展,我们期待看到更多创新和可能性。

相关资讯

「AI 数据荒」雪上加霜,MIT 发现网页数据的公开共享正走向衰落

人工智能系统依靠充足、高质量的训练数据来获得高性能,但 MIT 等机构最近的一项研究发现,曾经免费提供的数据在多个方面变得越来越难获取。随着 GenAI 产品开发和研究变得越来越广泛,训练数据的抓取许可也越来越成为受关注的话题。最近,吴恩达在网站 The Batch 上提及了一篇有关数据许可的研究,其结果似乎让本就迫近的「AI 数据荒」雪上加霜。研究人员发现,C4、RefineWeb、Dolma 等开源数据集所爬取的各种网站正在快速在收紧他们的许可协议,曾经触手可及的开放数据越来越难以获取。这不仅会影响商用 AI
8/13/2024 1:07:59 PM
汪淼

文生图技能再进化,谷歌推出 Imagen 3:更准确、更具创造性

谷歌公司在今天召开的 I / O 2024 开发者大会上,宣布推出了 Imagen 3,进一步增强了文本生成图片的技术能力。谷歌人工智能研究部门 DeepMind 负责人德米斯-哈萨比斯(Demis Hassabis)说,与前代产品 Imagen 2 相比,Imagen 3 能更准确地理解文字提示,并将其转化为图像,而且其生成的图像更具“创造性和细节”,且模型产生的干扰元素和错误也更少。为了打消人们对 Deepfake 可能性的担忧,谷歌表示,Imagen 3 将使用 DeepMind 开发的 SynthID 方法
5/15/2024 2:36:36 AM
故渊

OpenAI Responses API新增MCP支持与多项功能升级,助力智能体开发

OpenAI宣布其核心API——Responses API现已支持**Model Context Protocol(MCP)**,并对图像生成、Code Interpreter以及文件搜索工具进行了重大更新。 这些升级极大简化了智能体开发流程,使开发者能够通过几行代码将AI智能体连接到外部工具和服务,进一步提升了API的灵活性和功能性。  MCP支持:简化智能体开发OpenAI通过Responses API新增对MCP的支持,标志着其在AI智能体开发领域的又一重大突破。
5/22/2025 11:00:55 AM
AI在线
  • 1