Chapter7 Discussion #80

PaParaZz1 · 2023-05-31T13:09:54Z

本 issue 将会追踪和记录各种有关课程第七讲的问题和延伸思考，欢迎有兴趣的同学在这个 issue 中评论，课程组会定期整理信息

xianglunkai · 2023-07-11T06:38:25Z

@PaParaZz1
您好！非常感谢分享。
最近我遇到一个问题，动作空间是间断连续的时候(例如，动作空间[-1, 1]中规定[-0.3 0.6]不可取)，我尝试了标准的DDPG,SAC,PPO等算法似乎都无能为力。我是通过设置is_done=ture作为一个巨大的惩罚来限制agent动作映射的。
非常期望您的建议。谢谢！

zjowowen · 2023-07-24T06:46:29Z

My suggestion is to clip action into a proper interval before calling step method to env by using an env wrapper.

Here is an example:

example.txt

PaParaZz1 added the discussion Topic discussion label May 31, 2023

PaParaZz1 pinned this issue May 31, 2023

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Chapter7 Discussion #80

Chapter7 Discussion #80

PaParaZz1 commented May 31, 2023

xianglunkai commented Jul 11, 2023

zjowowen commented Jul 24, 2023

Chapter7 Discussion #80

Chapter7 Discussion #80

Comments

PaParaZz1 commented May 31, 2023

xianglunkai commented Jul 11, 2023

zjowowen commented Jul 24, 2023