tensorflow - 为什么 ```on_epoch_end()``` 从 google cloud ml 引擎上的几个工作人员调用?
问题描述
我在 ai 引擎上运行 tensorflow/keras 作业,并将 scale_tier 设置为 STANDARD_1。根据文档,这应该给我四个工人和三个参数服务器。
我的程序有:
- 定义的回调
- 我的
on_epoch_end()
写日志信息的实现。
我注意到on_epoch_end()
每个 epoch 调用了 8 次(可能是一个 master + 四个 worker + 三个参数服务器),除了最后一个 epoch,它只被调用了两次。
这对我来说似乎很奇怪,因为我认为参数服务器会协调训练,并且on_epoch_end()
每个 epoch 只会调用一次。如果我在每个时期结束时的回调中做某事,我所做的一切都会做 8 次吗?
任何解释都会非常有用。
解决方案
推荐阅读
- macos - Windows 10 Bootcamp 导致 Oracle Database 11g XE 出现问题
- python - 创建一个占位符,其形状是另一个形状的函数
- quickbooks - 通过 Web 连接器连接到 Quickbooks Desktop POS 时出错
- python - 将 PNG 转换为 Python
- sql-server - SQL Server:在存储过程中查找和删除索引提示
- python - 使用上下文管理器打开
- ldap - 使用 openldap 配置 hyperledger fabric-ca 服务器
- php - 在codeigniter中更改日期格式
- c++ - 如何在C ++中仅对容器内的类成员进行迭代器
- r - 如何根据 r 中的条件创建从 0 到 3 的变量?