probrobotics2021

概要

強化学習を用いて, エージェントに自作の迷路を解かせます.
学習によって行動価値がどのように変化するかを可視化しています.

動画

地図の見方

黒・・・・・壁, エージェントはこのますに進むことができない.
緑・・・・・スタート地点, エージェントがepisodeの初めにいる場所
青・・・・・ゴール地点, エージェントがここに達すると迷路を解いたことになる.
赤・・・・・エージェントの現在地
黄・・・・・行動価値を可視化したもの, 色が濃いほど矢印方向の行動価値が高いことを示す.

URL(Youtube)

Q-Learning
SARSA

実行方法 (python)

$ git clone https://github.com/matsumotokoki/probrobotics2021.git
$ cd probrobotics2021
$ python <実行するアルゴリズム>.py

実行方法 (jupyter notebook)

$ git clone https://github.com/matsumotokoki/probrobotics2021.git
$ cd probrobotics2021/jupyter
# 上記2つのコマンド実行後, jupyterディレクトリでjupyter notebookを起動し, 実行したいアルゴリズムを実行

必要となるライブラリ

matplotlib
numpy
gym

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

README.md

README.md

probrobotics2021

概要

動画

地図の見方

URL(Youtube)

実行方法 (python)

実行方法 (jupyter notebook)

必要となるライブラリ

Files

README.md

Latest commit

History

README.md

File metadata and controls

probrobotics2021

概要

動画

地図の見方

URL(Youtube)

実行方法 (python)

実行方法 (jupyter notebook)

必要となるライブラリ