AI在线 AI在线

Google Gen AI Python SDK:完全使用指南

译者 | 火凤凰生成式 AI 模型正在改变我们创作内容的方式,无论是文本、图像、视频还是代码。 通过 Google 的 Gen AI Python SDK,你现在可以更轻松地在 Python 应用程序中访问和交互 Google 的生成式 AI 模型,此外还可以使用 Gemini Developer API 和 Vertex AI API。 这意味着开发者可以更便捷地创建应用程序,包括聊天机器人、内容生成器或创意工具。

译者 | 火凤凰

生成式 AI 模型正在改变我们创作内容的方式,无论是文本、图像、视频还是代码。通过 Google 的 Gen AI Python SDK,你现在可以更轻松地在 Python 应用程序中访问和交互 Google 的生成式 AI 模型,此外还可以使用 Gemini Developer API 和 Vertex AI API。这意味着开发者可以更便捷地创建应用程序,包括聊天机器人、内容生成器或创意工具。在本文中,我们将介绍开始使用 Google Gen AI Python SDK 所需了解的一切。

目录

1.什么是 Google Gen AI Python SDK?

  • 安装
  • 导入和客户端设置
  • 可选:使用 Google Cloud Vertex AI
  • API 版本和配置
  • 使用环境变量(可选)

2.Google Gen AI Python SDK 用例

  • 内容生成
  • 文件上传和使用
  • 函数调用
  • 高级配置
  • 多媒体支持:图像和视频
  • 聊天和对话
  • 异步支持
  • 令牌计数
  • 嵌入

3.结论

什么是Google Gen AI Python SDK?

Google Gen AI Python SDK是一个客户端库,让开发者能够使用Python轻松利用Google的生成式AI能力。它提供:

  • 支持Gemini Developer API(Google的高级文本和多模态生成模型)
  • 与Vertex AI API集成,支持企业级AI工作负载
  • 支持生成文本、图像、视频、嵌入、聊天对话等
  • 提供文件管理、缓存和异步支持工具
  • 高级函数调用和模式执行功能

该 SDK 还抽象了 API 调用的大部分复杂性,让你专注于构建AI驱动的应用程序。

安装

安装 SDK 很简单。运行:

复制

上述命令将使用 pip 安装 Google Gen AI Python SDK 包。此命令会下载 Python 环境启动 Google 生成式 AI 服务所需的一切,包括资源和所有依赖项。

导入和客户端设置

安装 SDK 后,创建一个 Python 文件并导入 SDK:

复制

该SDK包含两个模块:genai和types。genai模块创建用于API交互的客户端,而types模块则包含用作构建请求和配置请求参数的数据结构和类。

每次与Google生成式AI模型进行交互时,你都需要创建一个客户端实例。根据所使用的API不同,你将使用不同的方法来实例化客户端。

对于Gemini Developer API,你可以通过传递API密钥来实例化客户端:

复制

实例化客户端后,你可以通过传入 API 密钥与Gemini Developer API进行交互。该客户端将负责访问令牌和请求管理。

可选:使用 Google Cloud Vertex AI

复制

如果你要使用谷歌云 Vertex AI,你需要通过指定项目 ID 和位置来不同地初始化客户端。

注意:Vertex AI 的使用是可选的。你可以在此处创建你的项目 ID。

如果你不使用 Vertex AI,你可以简单地使用上面的 API 密钥方法。

API 版本和配置

默认情况下,SDK 使用 beta 端点来访问 beta 功能。但是,如果你想使用稳定版本的 API,你可以通过 http_options 参数来指定 API 版本:

复制

如何在使用前沿功能的同时保持稳定性,这取决于你想如何操作。

使用环境变量(可选)

我们应该首先设置环境变量,而不是直接传递密钥:

复制

然后,初始化客户端:

复制

Google Gen AI Python SDK 用例

设置完成后,你可以通过以下各种方式使用Google Gen AI Python SDK 的功能。

内容生成

SDK 的主要功能是生成 AI 内容。你可以通过各种形式提供提示,例如简单字符串、结构化内容或复杂的多模态输入。

基本文本生成

复制

输出:

Google Gen AI Python SDK:完全使用指南

这会向模型发送提示并返回生成的答案。

结构化内容输入

你可以在各种角色中插入结构化内容,例如用于聊天机器人、对话式或多轮对话场景的用户或模型角色。

复制

输出:

Google Gen AI Python SDK:完全使用指南

SDK 在内部将许多不同的输入类型转换为模型所需的结构化数据格式。

文件上传和使用

Gemini Developer API允许你上传文件供模型处理。这对于摘要或内容提取非常有用:

复制

输出:

Google Gen AI Python SDK:完全使用指南

这是向基于文档的任务添加 AI 功能的理想方法。

函数调用

一个独特的功能是能够将 Python 函数作为“工具”传递给模型,以便模型在生成完成时自动调用。

复制

输出:

Google Gen AI Python SDK:完全使用指南

这使得AI响应能够实现动态、实时的数据整合。

高级配置

你可以通过调节温度、最大输出标记数和安全设置等参数来定制生成内容,从而管理随机性、长度并过滤有害内容。

复制

输出:

Google Gen AI Python SDK:完全使用指南

这可以提供内容质量和安全性的精细控制。

多媒体支持:图片和视频

SDK 允许你生成和编辑图片以及生成视频(预览中)。

  • 使用文本提示生成图片
  • 放大或调整生成的图片
  • 从文本或图片生成视频

图片生成示例:

复制

输出:

Google Gen AI Python SDK:完全使用指南

视频生成示例:

复制

输出:

Google Gen AI Python SDK:完全使用指南

这使得创建创新的多模式人工智能应用程序成为可能。

聊天和对话

你可以启动聊天会话,并在聊天过程中保持上下文连贯:

复制

Google Gen AI Python SDK:完全使用指南

复制

Google Gen AI Python SDK:完全使用指南

这对于创建能够记住先前对话的会话式 AI 很有用。

异步支持

所有主要 API 方法都包含异步函数,以便更好地集成到异步 Python 应用程序中:

复制

Google Gen AI Python SDK:完全使用指南

令牌计数

令牌计数用于追踪输入文本中包含多少令牌(文本片段)。这有助于你在模型限制范围内进行成本控制并做出经济高效的决策。

复制

Google Gen AI Python SDK:完全使用指南

嵌入

嵌入将文本转换为代表其含义的数字向量,可用于搜索、聚类和 AI 评估。

复制

Google Gen AI Python SDK:完全使用指南

使用 SDK,你可以轻松计算令牌并生成嵌入,从而改进和增强你的 AI 应用程序。

结论

Google Gen AI Python SDK 是一个强大且多功能的工具,允许开发者在他们的 Python 项目中访问 Google 顶级的生成式 AI 模型。从文本生成、聊天和聊天机器人,到图片/视频生成、函数调用等等,它通过简单的接口提供了丰富的功能集。通过简单的包安装、便捷的客户配置过程,以及支持异步编程和多媒体,该 SDK 显著简化了构建 AI 应用程序的流程。无论你是初学者还是经验丰富的开发者,使用该 SDK 在将生成式 AI 集成到工作流程中都相对轻松且功能强大。

原文标题:Google Gen AI Python SDK: A Complete Guide,作者:Janvi Kumari

相关资讯

腾讯位置服务导航SDK鸿蒙版再升级!​

腾讯位置服务近期发布了鸿蒙版本导航SDK,是基于腾讯全新的导航引擎构建的地图导航应用程序,深度适配HarmonyOS 5及以上系统版本。 开发者可以基于鸿蒙操作系统推荐的ASKTS开发语言调用导航SDK能力,构建鸿蒙版地图导航应用。 以下为本次发布重点能力介绍:1.鸿蒙版地图引擎地图能力全面升级了3D化引擎,深度适配了鸿蒙系统技术栈:升级后展示更加真实的3D地图效果,使地图场景呈现更加有深度和立体感升级后的渲染技术能够更高效地处理大量POI,并以更加清晰、美观的方式呈现在地图上图片2.驾车导航能力适配基于多源传感数据融合与AI算法迭代,鸿蒙版导航SDK全面升级重构了SDK定位与导航引擎能力。
6/17/2025 6:05:12 PM
鸿蒙开发者社区

一日一技:牛指挥马,Cursor驾驶Claude Code起飞

我日常使用的开发工具是Cursor。 虽然用得非常顺手,但天天有人在我耳边说,Claude Code代码能力吊打Cursor,Claude Code可以完全替代Cursor之类的言论,于是我安装上Claude Code试了一试。 整体来说Claude Code写代码的能力确实还行,但这个东西毕竟是命令行工具,用起来非常不方便。
8/1/2025 4:11:00 AM
kingname

OpenAI开源客户服务代理框架 加速企业级AI应用落地

人工智能研究机构OpenAI于6月18日正式开源其客户服务代理框架,标志着该公司在企业级AI解决方案布局上迈出重要一步。 该框架通过提供透明工具链和清晰实施案例,旨在推动智能代理系统从实验室走向实际商业应用。 技术细节与核心优势.
6/19/2025 2:01:33 PM
AI在线
  • 1