python - 在 jupyter notebook 中读取顶点 ai 数据集
问题描述
我正在尝试创建一个 python 实用程序,它将从顶点 ai 数据集中获取数据集,并为该数据集生成统计信息。但我无法使用 jupyter notebook 检查数据集。有没有办法解决这个问题?
解决方案
如果我理解正确,您想在Jupyter Notebook
. 我不认为这是目前可能的。您可以将Vertex AI
数据集导出为Google Cloud Storage
JSONL 格式:
您的数据集将导出为 JSONL 格式的文本项列表。每行包含一个 Cloud Storage 路径、分配给该项目的任何标签,以及一个指示该项目是否在训练、验证或测试集中的标志。
此时,您可以像在 Jupyter 笔记本中可视化 BigQuery 数据中提到的那样使用BigQuery
内部数据。或从机器目录中使用,或者像如何在 Google Cloud Platform jupyter notebook线程中读取 csv 文件中显示的那样使用。Notebook
%%bigquery
csv_read()
GCS
Feature Request
但是,您可以在Google 问题跟踪器中填写一个以添加VertexAI
直接使用数据集的可能性,Jupyter Notebook
其中Google Vertex AI Team
.
推荐阅读
- reactjs - react-testing-library 为什么使用测试ID
- memory-leaks - Apache Ignite Stripped ThreadPool 分配的字节数不断增加,GC 无法回收这些字节
- html - 移动@media 查询不使容器覆盖整个屏幕
- reactjs - 如何将本地 URL 从实时数据库发送到 Firebase 存储?
- php - SQL 查询没有带来预期的结果
- java - 2类UML图之间的关联和依赖
- azure-machine-learning-studio - 如何在 Azure 机器学习工作室中“非规范化”数据
- html - 溢出:自动元素无法在垂直居中的元素中正确滚动
- apache - Apache Reverse Proxy - 基于 HTTP 主体的 ProxyPass
- css - 使用 nth-child 或 nth-of-type 我想选择这种模式 -1,5,9,13,17,19..-