python - 一张一张传张量流记录
问题描述
tensorflow 记录大小非常巨大,100 GB 存储 1000 个小批量。但我需要 10000 个小批量。如果在程序运行时创建了 tensorflow 记录来替换旧的 tensorflow 记录,如何将新创建的记录放入队列中?
在运行 tensorflow 代码之前是否需要拥有所有 tensorflow 记录,或者我可以一个一个地传递,在最后一个结束时创建每个记录。
# Writing to a tf.record.
result_tf_file = file_path_prefix + '.tfrecords'
writer = tf.python_io.TFRecordWriter(result_tf_file)
# Create feature
features = tf.train.Features(feature=d_feature)
example = tf.train.Example(features=features)
serialized = example.SerializeToString()
writer.write(serialized)
# For Initializing the tf.record.
dataset = tf.data.TFRecordDataset([file_name_tf])
dataset = dataset.map(m)
dataset = dataset.batch(1)
dataset = dataset.shuffle(buffer_size=50)
dataset = dataset.repeat(1)
iterator = dataset.make_initializable_iterator()
# Initializing iterator
sess.run(iterator.initializer, feed_dict={file_name_tf: result_tf_file})
我可以像 sess.run(iterator.initializer, serialized) 一样初始化吗?
解决方案
推荐阅读
- python - Bron-Kerbosch 算法在无向图中找到最大团
- javascript - 如何在我的 Javascript 代码中捕获来自 Metamask 浏览器扩展的锁定/解锁事件?
- java - 如何知道请求是否通过 oauth2 授权发出?
- javascript - Nodemon - 使用配置文件指定扩展监视列表
- apache-camel - 骆驼升级引入了 SSL 问题
- javascript - 如何删除按钮 onclick 周围的默认橙色突出显示?
- godot - 如何在释放运动键时停止运动体行走?
- sql - 在 FROM 子句中的子查询内重用连接表中的字段
- python - 'datetime.datetime' 对象不可调用 django celery beat
- r - 在ggplot2的每个方面覆盖相同的线图