python - 如何在 h5py 中为不同的数据集设置不同的缓存大小?
问题描述
我目前正在研究 ML 问题,并且我有一个包含 2 个数据集的 h5 文件。一个是我的训练数据(一个形状为 (length, h, w) 的数据集),一个是元数据。那是形状(长度,)的json字符串的np.array。
我遇到的问题是 h5py.File 为所有数据集创建了一个缓存大小。因此,尽管我的元数据不需要像我的实际数据那样多的缓存(它大约是 2GB,而我的数据大约是 60GB),但如果我声明一个缓存机制,它将以与缓存更重要的数据。
因此,如果我为每个数据集声明一个 4GB 缓存,我将缓存大约 0.17 个数据集和 100% 的元数据,这将消耗大约 6GB 的内存。有没有办法为我的元数据数据集使用不同的缓存大小?
解决方案
推荐阅读
- flutter - 我无法在颤动中更改倒计时的持续时间:(
- spring-boot - 将 Swagger-ui 用于受 keycloak 保护的应用程序
- flutter - Flutter 中的 SelectableText.rich
- qt - 即使使用垂直滚动条,如何在表格中放置列
- flutter - 结束标签下的红线颤动
- python-3.x - 如何按特定值对字典中获得的列表进行排序
- python - 如何从限制同时下载的 url 批量下载图像 (70k)?
- html - 两个图像之间的中心按钮,垂直百分比
- c# - 在运行时重新绑定服务
- maven - com.sun.proxy.$Proxy16 执行时出错