首页 > 解决方案 > keras适合时间/步长差异

问题描述

构建一个 dqn 代理,并试图理解为什么在我的代码中调用 fit 比我发现的另一个示例(1ms)慢几个数量级(超过 1 秒)。神经网络几乎相同,示例有更多的连接,但这是唯一的区别(我的 alpha 设置为与示例 NN 学习率相同)。

不知道是什么导致了性能时间的这种差异。我想这可能是在调用 fit 之前格式化数据的方式,但看起来一切都是一样的。

我的结果:

在此处输入图像描述

示例结果:

在此处输入图像描述

我的神经网络:

q = Sequential()
q.add(Dense(24, input_dim=n_states, activation='relu'))
q.add(Dense(24, activation='relu'))
q.add(Dense(n_actions, activation='linear'))
q.compile(loss='mse', optimizer=Adam(lr=alpha))

示例神经网络:

model = Sequential()
model.add(Dense(32, input_dim=nS, activation='relu'))
model.add(Dense(32, activation='relu'))
model.add(Dense(32, activation='relu'))
model.add(Dense(nA, activation='linear'))
model.compile(loss='mse', optimizer=Adam(lr=0.01))

标签: pythonkerasreinforcement-learning

解决方案


推荐阅读