首页 > 解决方案 > 张量流模型可以在更高分辨率的图像上训练吗?

问题描述

需要帮助了解 Tensorflow 模型是否可以在更大的分辨率(如 4K 分辨率)上进行训练。我试过了,但训练没有开始,我希望是因为一些记忆问题。有没有人做过同样的事情?

标签: tensorflowkerasdeep-learningcomputer-visionobject-detection

解决方案


理论上你可以,TensorFlow 没有任何限制阻止你这样做。

但实际上,限制是 GPU 或系统 RAM。一个 3840x2160 (4K) 的单通道浮点特征图大约需要 32 MB RAM,通常卷积网络在每一层使用多个特征图,从 96 到 512。例如,128 个 4K 特征图需要大约 1 GB RAM,然后使用批处理进行训练并为梯度计算保留中间结果,将需要太多 RAM。

如果您查看常见 ImageNet 训练的神经网络的输入形状,尺寸通常为 224x224、256x256,我见过的最大尺寸是 600x600,用于对象检测网络(如 SSD 和 Faster R-CNN)。这些尺寸与完整的 4K 图像相差甚远。

TLDR。您应该将图像缩小到可管理的大小。


推荐阅读