首页 > 解决方案 > GCP Vertex AI 中的批量预测

问题描述

在 GCP Vertex AI 中尝试对 AutoML 模型进行批量预测时,批量预测结果跨越多个文件(从用户角度来看,这并不方便)。如果它是一个单一的批量预测结果文件,即覆盖单个文件中的所有记录,它将使过程更加简单。

例如,我的输入数据集文件中有 5585 条记录。批量预测结果由 21 个文件组成,每个文件的记录范围在 200-300 之间,因此总共覆盖了 5585 条记录。

标签: google-cloud-platformgoogle-cloud-vertex-ai

解决方案


对图像、文本、视频、表格 AutoML 模型进行批量预测,使用分布式处理运行作业,这意味着数据分布在任意虚拟机集群中,并以不可预测的顺序进行处理,因此您将获得存储的预测结果跨云存储中的各种文件。由于批量预测输出文件的生成顺序与输入文件不同,因此已提出功能请求,您可以从此链接跟踪此请求的更新。

我们目前无法提供 ETA,但您可以关注问题跟踪器中的进度,您可以通过参考此链接“星标”该问题以接收自动更新并给予其牵引力。

但是,如果您正在为表格 AutoML 模型进行批量预测,您可以选择 BigQuery 作为存储,其中所有预测输出都将存储在单个表中,然后您可以将表数据导出到单个 CSV 文件.


推荐阅读