tensorflow - 用于训练 CNN 的 FLOPS
问题描述
我想在进行深度学习时找到我的 GPU 的实际 TFLOP。
有没有办法找到训练像 ResNet50 这样的模型所需的浮点运算?
我在网上找到了一些方法来确定推理的失败(一张图片),但我不确定这将如何转移到训练中。
我认为这将是模型 * 图像数量 * 时期的失败,但这种方式我没有考虑反向传播。
我发现了一些输出每秒处理的图像数量的基准,这会有帮助吗?
解决方案
推荐阅读
- selenium - endWhile 不工作,如果不编辑索引就无法启动 while
- javascript - Nativescript - 具有嵌套数据的中继器
- javascript - 如何根据百分比值更改图标列表的颜色?
- c++ - FFMPEG解码使用GPU渲染?
- c++ - C++ rw/rwdate.h 库没有这样的文件或目录
- cakephp - 为什么我无法登录用户?
- centos - 如果已安装,如何在 Cent OS 7 中检查和运行 tesseract
- ionic3 - 如何在我的 ionic 应用程序(v3)中集成 Google plus 登录
- .net-core - dotnet 工具默认存储在哪里?
- c# - 将报表从报表服务器访问到 My Applicatoin 时出现权限问题