Google Gen AI Python SDK：完全使用指南

译者 | 火凤凰生成式 AI 模型正在改变我们创作内容的方式，无论是文本、图像、视频还是代码。通过 Google 的 Gen AI Python SDK，你现在可以更轻松地在 Python 应用程序中访问和交互 Google 的生成式 AI 模型，此外还可以使用 Gemini Developer API 和 Vertex AI API。这意味着开发者可以更便捷地创建应用程序，包括聊天机器人、内容生成器或创意工具。

译者 | 火凤凰

生成式 AI 模型正在改变我们创作内容的方式，无论是文本、图像、视频还是代码。通过 Google 的 Gen AI Python SDK，你现在可以更轻松地在 Python 应用程序中访问和交互 Google 的生成式 AI 模型，此外还可以使用 Gemini Developer API 和 Vertex AI API。这意味着开发者可以更便捷地创建应用程序，包括聊天机器人、内容生成器或创意工具。在本文中，我们将介绍开始使用 Google Gen AI Python SDK 所需了解的一切。

什么是Google Gen AI Python SDK？

Google Gen AI Python SDK是一个客户端库，让开发者能够使用Python轻松利用Google的生成式AI能力。它提供：

支持Gemini Developer API（Google的高级文本和多模态生成模型）
与Vertex AI API集成，支持企业级AI工作负载
支持生成文本、图像、视频、嵌入、聊天对话等
提供文件管理、缓存和异步支持工具
高级函数调用和模式执行功能

该 SDK 还抽象了 API 调用的大部分复杂性，让你专注于构建AI驱动的应用程序。

安装

安装 SDK 很简单。运行：

复制

上述命令将使用 pip 安装 Google Gen AI Python SDK 包。此命令会下载 Python 环境启动 Google 生成式 AI 服务所需的一切，包括资源和所有依赖项。

导入和客户端设置

安装 SDK 后，创建一个 Python 文件并导入 SDK：

复制

该SDK包含两个模块：genai和types。genai模块创建用于API交互的客户端，而types模块则包含用作构建请求和配置请求参数的数据结构和类。

每次与Google生成式AI模型进行交互时，你都需要创建一个客户端实例。根据所使用的API不同，你将使用不同的方法来实例化客户端。

对于Gemini Developer API，你可以通过传递API密钥来实例化客户端：

复制

实例化客户端后，你可以通过传入 API 密钥与Gemini Developer API进行交互。该客户端将负责访问令牌和请求管理。

可选：使用 Google Cloud Vertex AI

复制

如果你要使用谷歌云 Vertex AI，你需要通过指定项目 ID 和位置来不同地初始化客户端。

注意：Vertex AI 的使用是可选的。你可以在此处创建你的项目 ID。

如果你不使用 Vertex AI，你可以简单地使用上面的 API 密钥方法。

API 版本和配置

默认情况下，SDK 使用 beta 端点来访问 beta 功能。但是，如果你想使用稳定版本的 API，你可以通过 http_options 参数来指定 API 版本：

复制

如何在使用前沿功能的同时保持稳定性，这取决于你想如何操作。

使用环境变量（可选）

我们应该首先设置环境变量，而不是直接传递密钥：

复制

然后，初始化客户端：

复制

Google Gen AI Python SDK 用例

设置完成后，你可以通过以下各种方式使用Google Gen AI Python SDK 的功能。

内容生成

SDK 的主要功能是生成 AI 内容。你可以通过各种形式提供提示，例如简单字符串、结构化内容或复杂的多模态输入。

基本文本生成

复制

输出：

Google Gen AI Python SDK：完全使用指南

这会向模型发送提示并返回生成的答案。

结构化内容输入

你可以在各种角色中插入结构化内容，例如用于聊天机器人、对话式或多轮对话场景的用户或模型角色。

复制

输出：

Google Gen AI Python SDK：完全使用指南

SDK 在内部将许多不同的输入类型转换为模型所需的结构化数据格式。

文件上传和使用

Gemini Developer API允许你上传文件供模型处理。这对于摘要或内容提取非常有用：

复制

输出：

Google Gen AI Python SDK：完全使用指南

这是向基于文档的任务添加 AI 功能的理想方法。

函数调用

一个独特的功能是能够将 Python 函数作为“工具”传递给模型，以便模型在生成完成时自动调用。

复制

输出：

Google Gen AI Python SDK：完全使用指南

这使得AI响应能够实现动态、实时的数据整合。

高级配置

你可以通过调节温度、最大输出标记数和安全设置等参数来定制生成内容，从而管理随机性、长度并过滤有害内容。

复制

输出：

Google Gen AI Python SDK：完全使用指南

这可以提供内容质量和安全性的精细控制。

多媒体支持：图片和视频

SDK 允许你生成和编辑图片以及生成视频（预览中）。

使用文本提示生成图片
放大或调整生成的图片
从文本或图片生成视频

图片生成示例：

复制

输出：

Google Gen AI Python SDK：完全使用指南

视频生成示例：

复制

输出：

Google Gen AI Python SDK：完全使用指南

这使得创建创新的多模式人工智能应用程序成为可能。

聊天和对话

你可以启动聊天会话，并在聊天过程中保持上下文连贯：

复制

Google Gen AI Python SDK：完全使用指南

复制

Google Gen AI Python SDK：完全使用指南

这对于创建能够记住先前对话的会话式 AI 很有用。

异步支持

所有主要 API 方法都包含异步函数，以便更好地集成到异步 Python 应用程序中：

复制

Google Gen AI Python SDK：完全使用指南

令牌计数

令牌计数用于追踪输入文本中包含多少令牌（文本片段）。这有助于你在模型限制范围内进行成本控制并做出经济高效的决策。

复制

Google Gen AI Python SDK：完全使用指南

嵌入

嵌入将文本转换为代表其含义的数字向量，可用于搜索、聚类和 AI 评估。

复制

Google Gen AI Python SDK：完全使用指南

使用 SDK，你可以轻松计算令牌并生成嵌入，从而改进和增强你的 AI 应用程序。

结论

Google Gen AI Python SDK 是一个强大且多功能的工具，允许开发者在他们的 Python 项目中访问 Google 顶级的生成式 AI 模型。从文本生成、聊天和聊天机器人，到图片/视频生成、函数调用等等，它通过简单的接口提供了丰富的功能集。通过简单的包安装、便捷的客户配置过程，以及支持异步编程和多媒体，该 SDK 显著简化了构建 AI 应用程序的流程。无论你是初学者还是经验丰富的开发者，使用该 SDK 在将生成式 AI 集成到工作流程中都相对轻松且功能强大。

原文标题：Google Gen AI Python SDK: A Complete Guide，作者：Janvi Kumari

Google Gen AI Python SDK：完全使用指南

目录

什么是Google Gen AI Python SDK？

安装

导入和客户端设置

可选：使用 Google Cloud Vertex AI

API 版本和配置

使用环境变量（可选）

Google Gen AI Python SDK 用例

内容生成

文件上传和使用

函数调用

高级配置

多媒体支持：图片和视频

聊天和对话

异步支持

令牌计数

嵌入

结论

相关资讯

腾讯位置服务导航SDK鸿蒙版再升级！

一日一技：牛指挥马，Cursor驾驶Claude Code起飞

当IM遇上OpenAI，简历到底该怎么写？

Google Gen AI Python SDK：完全使用指南

目录

什么是Google Gen AI Python SDK？

安装

导入和客户端设置

可选：使用 Google Cloud Vertex AI

API 版本和配置

使用环境变量（可选）

Google Gen AI Python SDK 用例

内容生成

文件上传和使用

函数调用

高级配置

多媒体支持：图片和视频

聊天和对话

异步支持

令牌计数

嵌入

结论

相关资讯

腾讯位置服务导航SDK鸿蒙版再升级！​

一日一技：牛指挥马，Cursor驾驶Claude Code起飞

当IM遇上OpenAI，简历到底该怎么写？

腾讯位置服务导航SDK鸿蒙版再升级！