译者 | 火凤凰
生成式 AI 模型正在改变我们创作内容的方式,无论是文本、图像、视频还是代码。通过 Google 的 Gen AI Python SDK,你现在可以更轻松地在 Python 应用程序中访问和交互 Google 的生成式 AI 模型,此外还可以使用 Gemini Developer API 和 Vertex AI API。这意味着开发者可以更便捷地创建应用程序,包括聊天机器人、内容生成器或创意工具。在本文中,我们将介绍开始使用 Google Gen AI Python SDK 所需了解的一切。
目录
1.什么是 Google Gen AI Python SDK?
- 安装
- 导入和客户端设置
- 可选:使用 Google Cloud Vertex AI
- API 版本和配置
- 使用环境变量(可选)
2.Google Gen AI Python SDK 用例
- 内容生成
- 文件上传和使用
- 函数调用
- 高级配置
- 多媒体支持:图像和视频
- 聊天和对话
- 异步支持
- 令牌计数
- 嵌入
3.结论
什么是Google Gen AI Python SDK?
Google Gen AI Python SDK是一个客户端库,让开发者能够使用Python轻松利用Google的生成式AI能力。它提供:
- 支持Gemini Developer API(Google的高级文本和多模态生成模型)
- 与Vertex AI API集成,支持企业级AI工作负载
- 支持生成文本、图像、视频、嵌入、聊天对话等
- 提供文件管理、缓存和异步支持工具
- 高级函数调用和模式执行功能
该 SDK 还抽象了 API 调用的大部分复杂性,让你专注于构建AI驱动的应用程序。
安装
安装 SDK 很简单。运行:
复制上述命令将使用 pip 安装 Google Gen AI Python SDK 包。此命令会下载 Python 环境启动 Google 生成式 AI 服务所需的一切,包括资源和所有依赖项。
导入和客户端设置
安装 SDK 后,创建一个 Python 文件并导入 SDK:
复制该SDK包含两个模块:genai和types。genai模块创建用于API交互的客户端,而types模块则包含用作构建请求和配置请求参数的数据结构和类。
每次与Google生成式AI模型进行交互时,你都需要创建一个客户端实例。根据所使用的API不同,你将使用不同的方法来实例化客户端。
对于Gemini Developer API,你可以通过传递API密钥来实例化客户端:
复制实例化客户端后,你可以通过传入 API 密钥与Gemini Developer API进行交互。该客户端将负责访问令牌和请求管理。
可选:使用 Google Cloud Vertex AI
复制如果你要使用谷歌云 Vertex AI,你需要通过指定项目 ID 和位置来不同地初始化客户端。
注意:Vertex AI 的使用是可选的。你可以在此处创建你的项目 ID。
如果你不使用 Vertex AI,你可以简单地使用上面的 API 密钥方法。
API 版本和配置
默认情况下,SDK 使用 beta 端点来访问 beta 功能。但是,如果你想使用稳定版本的 API,你可以通过 http_options 参数来指定 API 版本:
复制如何在使用前沿功能的同时保持稳定性,这取决于你想如何操作。
使用环境变量(可选)
我们应该首先设置环境变量,而不是直接传递密钥:
复制然后,初始化客户端:
复制Google Gen AI Python SDK 用例
设置完成后,你可以通过以下各种方式使用Google Gen AI Python SDK 的功能。
内容生成
SDK 的主要功能是生成 AI 内容。你可以通过各种形式提供提示,例如简单字符串、结构化内容或复杂的多模态输入。
基本文本生成
复制输出:
这会向模型发送提示并返回生成的答案。
结构化内容输入
你可以在各种角色中插入结构化内容,例如用于聊天机器人、对话式或多轮对话场景的用户或模型角色。
复制输出:
SDK 在内部将许多不同的输入类型转换为模型所需的结构化数据格式。
文件上传和使用
Gemini Developer API允许你上传文件供模型处理。这对于摘要或内容提取非常有用:
复制输出:
这是向基于文档的任务添加 AI 功能的理想方法。
函数调用
一个独特的功能是能够将 Python 函数作为“工具”传递给模型,以便模型在生成完成时自动调用。
复制输出:
这使得AI响应能够实现动态、实时的数据整合。
高级配置
你可以通过调节温度、最大输出标记数和安全设置等参数来定制生成内容,从而管理随机性、长度并过滤有害内容。
复制输出:
这可以提供内容质量和安全性的精细控制。
多媒体支持:图片和视频
SDK 允许你生成和编辑图片以及生成视频(预览中)。
- 使用文本提示生成图片
- 放大或调整生成的图片
- 从文本或图片生成视频
图片生成示例:
复制输出:
视频生成示例:
复制输出:
这使得创建创新的多模式人工智能应用程序成为可能。
聊天和对话
你可以启动聊天会话,并在聊天过程中保持上下文连贯:
复制这对于创建能够记住先前对话的会话式 AI 很有用。
异步支持
所有主要 API 方法都包含异步函数,以便更好地集成到异步 Python 应用程序中:
复制令牌计数
令牌计数用于追踪输入文本中包含多少令牌(文本片段)。这有助于你在模型限制范围内进行成本控制并做出经济高效的决策。
复制嵌入
嵌入将文本转换为代表其含义的数字向量,可用于搜索、聚类和 AI 评估。
复制使用 SDK,你可以轻松计算令牌并生成嵌入,从而改进和增强你的 AI 应用程序。
结论
Google Gen AI Python SDK 是一个强大且多功能的工具,允许开发者在他们的 Python 项目中访问 Google 顶级的生成式 AI 模型。从文本生成、聊天和聊天机器人,到图片/视频生成、函数调用等等,它通过简单的接口提供了丰富的功能集。通过简单的包安装、便捷的客户配置过程,以及支持异步编程和多媒体,该 SDK 显著简化了构建 AI 应用程序的流程。无论你是初学者还是经验丰富的开发者,使用该 SDK 在将生成式 AI 集成到工作流程中都相对轻松且功能强大。
原文标题:Google Gen AI Python SDK: A Complete Guide,作者:Janvi Kumari