首页 > 解决方案 > 在单个 .npz 文件中组合数据集

问题描述

我有四个目录 x_train、y_train、x_test 和 y_test

每个目录包含图像数量。我想将它们全部转换为单个 .npz 文件,以便我可以加载它们,如下所示。

DATA_URL = 'https://storage.googleapis.com/tensorflow/tf-keras-datasets/mnist.npz'

path = tf.keras.utils.get_file('mnist.npz', DATA_URL)
with np.load(path) as data:
  train_examples = data['x_train']
  train_labels = data['y_train']
  test_examples = data['x_test']
  test_labels = data['y_test']

不用担心我只想创建文件的URL

标签: pythonpython-3.xnumpytensorflow

解决方案


只需使用savez()方法,请参阅文档

import numpy as np
file_name = 'something.npz'
np.savez(file_name, x_train=x_train, y_train=y_train, x_test=x_test, y_test=y_test)

推荐阅读