keras - Keras 强化学习
问题描述
我正在尝试使用 keras 和强化学习开发一种 AlphaZero 国际象棋引擎。我玩了一定数量的游戏,并从这些游戏中保存数据以供以后学习之用。自我游戏完成后,我想用这些数据训练我的模型。我的问题是:我是否像其他方法一样通过以下方式拟合模型:
model.compile(optimizer=opt, loss=losses)
model.fit(x, y, batch_size=batch_size, epochs=epochs)
还是在强化学习中看起来不同?
解决方案
推荐阅读
- python - pyautogui 不会从 csv 的列表中输入
- c++ - 是否允许在作为静态数据结构成员的 lambda 函数中捕获变量?
- spring - Spring Cloud Function AWS 示例无法在本地运行
- python - 如何有效地搜索旧/旧 TensorFlow 文档?
- python - np.dot 在乘法矩阵中的结果问题
- laravel - 从 ajax 请求中保存 laravel_session cookie - 单点登录
- python-3.x - Python打印对齐的numpy数组
- macos - 具有 AutoLayout 约束的 NSScrollView 使窗口对调整大小和拖动无响应
- python-3.x - 尝试编译 python3 kivy 应用程序时出错
- android-studio - 如何将多个 externalNativeBuild 文件添加到 gradle?