python - Tensorflow 如何调度 GPU 操作?使用 TF 时正确的 GPU 调度心智模型是什么?
问题描述
我正在使用 Tensorflow 的 Eager 模式来训练一些神经网络模型。我试图在优化我的模型以提高训练速度的同时快速获胜,我的问题是关于 TF 的 GPU 调度。
Tensorflow 如何决定在 GPU 上安排哪些操作,哪些在 CPU 上保留?这是操作数张量大小和运算符类型的函数吗?还有什么?
有没有办法查看在 CPU 和 GPU 上执行的操作?它如何决定权衡 GPU 的并行化优势与在 GPU 和 CPU 之间来回传输数据所花费的时间?
图形模式是否有任何变化?