python - 高效访问 mxnet 中的任意 NDArray 批次
问题描述
拟合诸如 Resnet 和 VGG 之类的卷积网络受益于 ImageRecordIter python 类,它允许从存储在 RecordIO .rec 文件中的大量 RGB 图像中有效地加载批次,
有谁知道大型任意输入 2D 或 3D 矩阵的等效设施(对于 2D,行 = 项目和列 = 特征,+ 3D 通道)?
NDArrayIter 需要将整个数据集加载到内存中,这在我的情况下是要避免的(>40Gb 数据文件)。CSVIter 不允许直接改组,并且仅适用于 2D 矩阵。
解决方案
您可以将每个数据样本保存为单独的文件,并DataSet
按照参考代码ImageFolderDataset实现一个非常简单的自定义类
推荐阅读
- c++ - C ++:在重新定义时检查/断言定义的常量
- c++ - 如何使用 unique_ptr 编写用于在容器上搜索的传出引用
- python-3.x - Python 每次调用 write 都会在屏幕上输出一个数字
- python-3.x - 如何修复 AttributeError:模块 'botocore.vendored.requests' 没有属性 'Post' Traceback
- excel - 如何将单元格格式固定为日期(使用 YYYYMMDD 格式)并且不允许使用文本
- python - 如何优化python中的嵌套循环?
- youtube-api - 合法的 YouTube API 合规审核?
- excel - If(And( arguments + Vlookup 没有返回预期值
- c# - 尽管添加了 application/json 标头,但请求仍为“text/plain”
- kubernetes - Kubernetes 会在重启 Pod 之前发送信号吗?