python - 创建一个 Numpy 数据集
问题描述
我对 Tensorflow 比较陌生。我有自己想要创建的数据集。它包含 60000 个用于输入的 numpy 数组 (13x44) 和 60000 个输出向量 (58x1)。可以使用该my_data()
功能加载一个样本。
def build_dataset(file, param, batch_size):
# Create tf data set
ds = tf.data.Dataset.from_tensor_slices((file, param))
ds = ds.shuffle(N_shuffle_buffer)
ds = ds.batch(batch_size).repeat().prefetch(N_prefetch)
return ds
for i in range(len(mfcc_list)):
m,p=my_data(mfcc_list[i],parameter_list[i])
mfccs= #??????#
parameters= #?????#
train_ds = build_dataset(mfccs[0:N_training_examples],
parameters[0:N_training_examples], batch_size)
validation_ds = build_dataset(mfccs[N_training_examples:N_training_examples+N_validation_examples],
parameters[N_training_examples:N_training_examples+N_validation_examples],
batch_size)
test_ds = build_dataset(mfccs[N_training_examples+N_validation_examples:],
parameters[N_training_examples+N_validation_examples:], batch_size)
我的理解是我需要创建 2 个张量,其中包含:
- 我所有的输入数组和
- 所有输出向量。
但我不确定哪个 tensorflow 函数能最有效地做到这一点。
解决方案
只需创建两个列表:
mfccs = []
parameters = []
for i in range(len(mfcc_list)):
m,p=my_data(mfcc_list[i],parameter_list[i])
mfccs.append(m)
parameters.append(p)
推荐阅读
- python - TypeError: float() 参数必须是字符串或数字,而不是带有注释和 iterrows 的“元组”
- powershell - 在 PnP PowerShell 中创建 SPO 网站集时,租户管理员 url 应该是什么
- django - 如何使用 s3 作为存储在 django 中自动显示媒体文件?
- python - 删除 xpath 中的链接文本
- node.js - 如何为以下条件编写mongo的聚合函数
- javascript - 将数组格式化为 Javascript 中 Google Map API 格式的 Lat Lng 数组
- excel - 使用匹配的主题和开始时间从 Office365 活动中将与会者提取到 Excel 中
- php - 我想在日期之间过滤后从数据库中获取数据。我试过但没有找到数据
- ios - 不知何故结合搜索控制器不起作用,知道吗?
- javascript - 如何将嵌套函数导出为模块