多卡训练&强化学习相关问题 #11

Iriya99 · 2024-07-04T09:25:31Z

想用ddp训练，似乎要改Dataset类，但以弃牌为例，一个xml文件对应很多条数据，这里要怎么改比较好？
另外代码里现在没有提供self-play强化学习训练的代码是吗？这部分添加的话要加哪些逻辑呢？

windshadow233 · 2024-07-04T09:42:44Z

感谢关注🙏

数据集你只要继承一下PyTorch的Dataset类，把我写的数据类封装到里面应该就行了？
强化学习部分目前没时间做～可以读一下原论文，大概是训练了一个GRU网络来预测评分，然后论文里还提到了一个掌握全局信息的代理，通过逐步弱化这个代理来训练模型。我没有多少强化学习的经验，然后环境部分写的不是很好，现在这个代码感觉增加强化学习的逻辑会比较费劲，如果有更好的适合强化学习的环境实现，也可以提一些建议或者pr～后面我空了可以考虑把游戏环境部分推翻重写。

windshadow233 · 2024-07-04T09:48:45Z

比如可以在数据class定义一个buffer列表，每次__getitem__的时候从buffer取出一条数据，buffer为空就跑一下牌谱往buffer添加牌谱数据？

Iriya99 · 2024-07-05T03:33:09Z

好的，谢谢作者~
论文我看了，但是我也没有接触过强化学习，可能复现起来比较费劲- -

windshadow233 · 2024-07-05T04:17:59Z

可以先试试监督学习的效果～我用了八万个半庄的对局，效果已经比较不错了。你有多卡的话可以试试增加数据量😇

Iriya99 · 2024-07-05T09:03:46Z

好滴，其实之前弃牌模型和立直模型都已经训好了，我历年数据都down了，但是里面xml文件解析好多还是有bug，有些数据情况比较奇怪，我加了一些条件判断过滤掉了这些数据，每个epoch都用了大概10万个随机半庄，训了10个epoch，还没有测试效果
话说强化学习如果只是训练的话是不是都不需要写前后端代码（作者太强了，全栈高手T ^ T）

Iriya99 · 2024-07-05T09:07:23Z

比如可以在数据class定义一个buffer列表，每次__getitem__的时候从buffer取出一条数据，buffer为空就跑一下牌谱往buffer添加牌谱数据？

改好了，回头试一下，如果没问题的话可以pr一下→_→

windshadow233 · 2024-07-05T17:58:51Z

好滴，其实之前弃牌模型和立直模型都已经训好了，我历年数据都down了，但是里面xml文件解析好多还是有bug，有些数据情况比较奇怪，我加了一些条件判断过滤掉了这些数据，每个epoch都用了大概10万个随机半庄，训了10个epoch，还没有测试效果

话说强化学习如果只是训练的话是不是都不需要写前后端代码（作者太强了，全栈高手T ^ T）

强化学习只是训练的话自然不用前端代码后端里面也可以忽略socket通信什么的（我是真不会写游戏，写的是一坨屎山💩。

Iriya99 changed the title ~~怎么使用多卡训练？~~ 多卡训练&强化学习相关问题 Jul 4, 2024

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

多卡训练&强化学习相关问题 #11

多卡训练&强化学习相关问题 #11

Iriya99 commented Jul 4, 2024 •

edited

Loading

windshadow233 commented Jul 4, 2024

windshadow233 commented Jul 4, 2024

Iriya99 commented Jul 5, 2024

windshadow233 commented Jul 5, 2024

Iriya99 commented Jul 5, 2024 •

edited

Loading

Iriya99 commented Jul 5, 2024

windshadow233 commented Jul 5, 2024

多卡训练&强化学习相关问题 #11

多卡训练&强化学习相关问题 #11

Comments

Iriya99 commented Jul 4, 2024 • edited Loading

windshadow233 commented Jul 4, 2024

windshadow233 commented Jul 4, 2024

Iriya99 commented Jul 5, 2024

windshadow233 commented Jul 5, 2024

Iriya99 commented Jul 5, 2024 • edited Loading

Iriya99 commented Jul 5, 2024

windshadow233 commented Jul 5, 2024

Iriya99 commented Jul 4, 2024 •

edited

Loading

Iriya99 commented Jul 5, 2024 •

edited

Loading