首页 > 解决方案 > Keras 强化学习

问题描述

我正在尝试使用 keras 和强化学习开发一种 AlphaZero 国际象棋引擎。我玩了一定数量的游戏,并从这些游戏中保存数据以供以后学习之用。自我游戏完成后,我想用这些数据训练我的模型。我的问题是:我是否像其他方法一样通过以下方式拟合模型:

model.compile(optimizer=opt, loss=losses)
model.fit(x, y, batch_size=batch_size, epochs=epochs)

还是在强化学习中看起来不同?

标签: kerasreinforcement-learning

解决方案


推荐阅读