首页 > 解决方案 > 为什么 ```on_epoch_end()``` 从 google cloud ml 引擎上的几个工作人员调用?

问题描述

我在 ai 引擎上运行 tensorflow/keras 作业,并将 scale_tier 设置为 STANDARD_1。根据文档,这应该给我四个工人和三个参数服务器。

我的程序有:

我注意到on_epoch_end()每个 epoch 调用了 8 次(可能是一个 master + 四个 worker + 三个参数服务器),除了最后一个 epoch,它只被调用了两次。

这对我来说似乎很奇怪,因为我认为参数服务器会协调训练,并且on_epoch_end()每个 epoch 只会调用一次。如果我在每个时期结束时的回调中做某事,我所做的一切都会做 8 次吗?

任何解释都会非常有用。

标签: tensorflowgoogle-cloud-ml

解决方案


推荐阅读