tensorflow - tfrecord 文件的最佳大小
问题描述
根据您的经验,最适合在各种设备(硬盘、ssd、nvme)和存储位置(本地计算机、具有网络挂载的 hpc 集群)上运行的 .tfrecord 文件的理想大小是多少?
如果我在云中技术更强大的计算机上的性能比在本地 PC 上更慢,那么 tfrecord 数据集的大小是否会成为瓶颈的根本原因?
谢谢
解决方案
Tensorflow 官方网站推荐 ~100MB ( https://docs.w3cub.com/tensorflow~guide/performance/performance_guide/ )
读取大量小文件会显着影响 I/O 性能。获得最大 I/O 吞吐量的一种方法是将输入数据预处理为更大的 (~100MB) TFRecord 文件。对于较小的数据集(200MB-1GB),最好的方法通常是将整个数据集加载到内存中。
推荐阅读
- dynamic-programming - 在有向无环图中寻找回文的动态规划算法
- python - 使用数学库查找所有除数
- laravel - 使用 maatbitwise 导出到带有标题返回的 excel 在 laravel 中包含 1 个抽象方法
- python - 匹配 Python 3 中字符串列表中的重音字符串
- mysql - 记录 MySQL 查询并转发到系统日志/事件日志
- javascript - Reactjs 函数发送数据 i+1 次
- ios - 在 UILabel 中启用小型大写字体
- c# - 是否可以自动从 ValueTuple<> 映射到类属性?
- getorgchart - 为非常大的组织结构图折叠所有加载节点
- html - 纯 CSS 下拉菜单问题