首页 > 解决方案 > Tensorflow 2.0 DQN action_spec 屏蔽

问题描述

我已经使用 Tensorflow 为 DQN 代理创建了一个自定义环境,但我想根据观察规范的状态修改操作规范。

我的操作规范是 self._action_spec = array_spec.BoundedArraySpec(shape=(), dtype=np.int32, minimum=0, maximum=3, name='action') ,因为我有 4 个可能的操作。(0,1,2,3) 但是,根据观察规范状态/信息,我希望也只允许操作 0 和 3 作为下一个操作。

我希望有一种方法可以在我的环境中添加它而不是使用observation_and_action_constraint_splitter。但我不确定如何重新定义 self._action_spec 也只允许操作 0 和 3

标签: pythontensorflowtensorflow2.0dqn

解决方案


推荐阅读