首页 > 解决方案 > 在 jupyter notebook 中读取顶点 ai 数据集

问题描述

我正在尝试创建一个 python 实用程序,它将从顶点 ai 数据集中获取数据集,并为该数据集生成统计信息。但我无法使用 jupyter notebook 检查数据集。有没有办法解决这个问题?

标签: pythongoogle-cloud-platformgoogle-cloud-vertex-ai

解决方案


如果我理解正确,您想在Jupyter Notebook. 我不认为这是目前可能的。您可以将Vertex AI数据集导出为Google Cloud StorageJSONL 格式:

您的数据集将导出为 JSONL 格式的文本项列表。每行包含一个 Cloud Storage 路径、分配给该项目的任何标签,以及一个指示该项目是否在训练、验证或测试集中的标志。

此时,您可以像在 Jupyter 笔记本中可视化 BigQuery 数据中提到的那样使用BigQuery内部数据。或从机器目录中使用,或者像如何在 Google Cloud Platform jupyter notebook线程中读取 csv 文件中显示的那样使用。Notebook%%bigquerycsv_read()GCS

Feature Request但是,您可以在Google 问题跟踪器中填写一个以添加VertexAI直接使用数据集的可能性,Jupyter Notebook其中Google Vertex AI Team.


推荐阅读