首页 > 解决方案 > 如何使用 tf.data.Dataset.from_generator 和 tf.data.Dataset.from_tensor_slices 导入具有多个特征的数据集

问题描述

dataset有400个数据,每个数据有3个特征,每个特征都是一个列表,例如:

数据1=[[1,2],[4,5],[7,8]]

所以数据集的形状是(400,3,2)

我想导入这些数据集以使用像(https://www.tensorflow.org/guide/eager)这样的渴望模式来训练模型。

根据(如何在 tf.data.Dataset 中输入不同大小的列表列表)我尝试了以下方式:

dataset=tf.data.Dataset.from_generator(lambda: dataset, tf.int32, output_shapes=[None])
iterator=tf.contrib.eager.Iterator(dataset)
for x in iterator:
    print (x)

它没有用

然后,我尝试了 tf.data.Dataset.from_tensor_slices 并得到了相同的结果。

我喜欢一件有趣的事情,那就是 tf.data.Dataset.from_generator 和 tf.data.Dataset.from_tensor_slices 只消耗 2D 张量,因为我喜欢以下方式是可以的:

dataset=tf.data.Dataset.from_generator(lambda: data1, tf.int32, output_shapes=[None])

如何导入具有多个特征的数据集?

标签: tensorflow

解决方案


推荐阅读