probrobotics2021

概要

強化学習を用いて, エージェントに自作の迷路を解かせます.
学習によって行動価値がどのように変化するかを可視化しています.

動画

地図の見方

黒・・・・・壁, エージェントはこのますに進むことができない.
緑・・・・・スタート地点, エージェントがepisodeの初めにいる場所
青・・・・・ゴール地点, エージェントがここに達すると迷路を解いたことになる.
赤・・・・・エージェントの現在地
黄・・・・・行動価値を可視化したもの, 色が濃いほど矢印方向の行動価値が高いことを示す.

URL(Youtube)

Q-Learning
SARSA

実行方法 (python)

$ git clone https://github.com/matsumotokoki/probrobotics2021.git
$ cd probrobotics2021
$ python <実行するアルゴリズム>.py

実行方法 (jupyter notebook)

$ git clone https://github.com/matsumotokoki/probrobotics2021.git
$ cd probrobotics2021/jupyter
# 上記2つのコマンド実行後, jupyterディレクトリでjupyter notebookを起動し, 実行したいアルゴリズムを実行

必要となるライブラリ

matplotlib
numpy
gym

Name		Name	Last commit message	Last commit date
Latest commit History 12 Commits
jupyter		jupyter
.gitignore		.gitignore
LICENSE		LICENSE
README.md		README.md
agent.py		agent.py
map.py		map.py
q-learning.py		q-learning.py
sarsa.py		sarsa.py

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

probrobotics2021

概要

動画

地図の見方

URL(Youtube)

実行方法 (python)

実行方法 (jupyter notebook)

必要となるライブラリ

About

Releases

Packages

Languages

License

matsumotokoki/RL-Maze

Folders and files

Latest commit

History

Repository files navigation

probrobotics2021

概要

動画

地図の見方

URL(Youtube)

実行方法 (python)

実行方法 (jupyter notebook)

必要となるライブラリ

About

Topics

Resources

License

Stars

Watchers

Forks

Releases

Packages 0

Languages

Packages