python - Tensorflow 2.0 DQN action_spec 屏蔽
问题描述
我已经使用 Tensorflow 为 DQN 代理创建了一个自定义环境,但我想根据观察规范的状态修改操作规范。
我的操作规范是 self._action_spec = array_spec.BoundedArraySpec(shape=(), dtype=np.int32, minimum=0, maximum=3, name='action') ,因为我有 4 个可能的操作。(0,1,2,3) 但是,根据观察规范状态/信息,我希望也只允许操作 0 和 3 作为下一个操作。
我希望有一种方法可以在我的环境中添加它而不是使用observation_and_action_constraint_splitter。但我不确定如何重新定义 self._action_spec 也只允许操作 0 和 3
解决方案
推荐阅读
- javascript - what is the name of event?
- javascript - 将图像添加到 html 画布
- java - 当我在我的 android 应用程序中创建图像时拍照时,会在 DCIM / Camera 中生成一个副本
- ios - 如何修复 fastlane-plugin-firebase_app_distribution 未定义
- javascript - xml 不是函数
- python - 为什么当条款合适时输出值不显示
- php - iptcembed() 损坏 JPG 数据
- c# - 大括号和引号的自动完成在 Visual Studio C# 中不起作用
- system-verilog - 系统verilog中[$]运算符在声明类对象时的功能
- javascript - 如果值存在,请执行此操作。未定义与空?