首页 > 解决方案 > 用于训练 CNN 的 FLOPS

问题描述

我想在进行深度学习时找到我的 GPU 的实际 TFLOP。

有没有办法找到训练像 ResNet50 这样的模型所需的浮点运算?

我在网上找到了一些方法来确定推理的失败(一张图片),但我不确定这将如何转移到训练中。

我认为这将是模型 * 图像数量 * 时期的失败,但这种方式我没有考虑反向传播。

我发现了一些输出每秒处理的图像数量的基准,这会有帮助吗?

标签: tensorflowdeep-learninggpubenchmarkingconv-neural-network

解决方案


推荐阅读