- git管理開始
- デバック用にマウス操作できるようにする
摩擦がうまく機能していない問題を直す座標系を活用したい
- DQNを回せるようになった
- 評価関数を考える必要あり
- 入力は4つでいいのか検討 →障害物の数に合わせて変更、速度成分を追加した
PID制御のコードもこれから書きたい
- 速度制御で強化学習を回した結果
https://www.youtube.com/watch?v=sHpcYmoW7FY
- 障害物ありでの強化学習(固定)
https://youtu.be/v1ZVAwwNkpw
- ランダムに置いた1つの障害物をドリブルしながら回避する行動を学習
https://youtu.be/3mZqQjY5px8
- ランダムに置いた4つの障害物をドリブルしながら回避する行動を学習
https://www.youtube.com/watch?v=jSCUWa9ywp4