使用Vertex AI进行批量预测
目录
🌟 第一部分: 创建输入数据集
🌟 第二部分: 创建批量预测任务
-
导入必要库
-
获取模型ID
-
定义变量
-
创建批量预测任务
🌟 第三部分: 转换预测结果
-
准备工作
-
获取批量预测任务ID
-
定义云存储客户端
-
处理预测结果
创建输入数据集
在本部分,我们将学习如何准备用于批量预测任务的输入数据集。
准备工作
首先,我们需要了解输入文件的格式要求。Google 文档中指出,图像分类模型可以使用 Json lines 文件指定要进行预测的图像列表。示例显示了文件的基本结构,其中包括每个图像的地址和可选的 Mime 类型。
创建输入数据集
我们使用 Google Cloud Storage 存储了要进行批量预测的图像文件。通过 Python 代码,我们可以轻松地从存储桶中获取每个文件的地址,并将其整理为符合要求的 Json lines 格式。
上传至云存储
最后,我们将生成的输入文件上传至云存储,以备后续的批量预测任务使用。
创建批量预测任务
在本部分,我们将学习如何创建批量预测任务,以便对输入数据集进行批量预测。
导入必要库
首先,我们需要导入所需的库,以便在笔记本中进行操作。这些库包括 Vertex AI 库,用于与 Google Cloud 平台进行交互。
获取模型ID
我们需要从 Vertex AI 中获取将执行批量预测的模型的ID。这可以通过访问“部署和使用模型注册表”来获取。
定义变量
在创建批量预测任务之前,我们需要定义一些变量,包括输入文件的位置和预测结果的存储位置。
创建批量预测任务
最后,我们使用所定义的变量创建批量预测任务,并监视任务的执行情况。
转换预测结果
在本部分,我们将学习如何将批量预测任务的结果从 Json lines 格式转换为表格格式。
准备工作
首先,我们需要准备工作,包括导入所需的库和获取批量预测任务的ID。
获取批量预测任务ID
我们需要从 Vertex AI 中获取批量预测任务的ID,以便访问任务的结果。
定义云存储客户端
使用云存储客户端,我们可以访问存储在 Google Cloud Storage 中的预测结果。
处理预测结果
最后,我们将处理预测结果,将其转换为易于理解的表格格式,并进行进一步的分析和应用。
高亮
- 本教程介绍了如何使用 AutoML 图像分类模型进行批量预测。
- 通过准备输入数据集、创建批量预测任务和转换预测结果,实现了完整的预测流程。
FAQ
如何获取模型ID?
您可以从 Vertex AI 中的模型注册表中获取您所需模型的ID。
批量预测任务的执行时间是多久?
执行时间取决于输入数据集的大小和模型的复杂性,通常会在几分钟到几小时之间。
预测结果如何呈现?
预测结果以 Json lines 格式存储,每行代表一个图像的预测结果,包括预测标签和置信度。
资源