Skip to content

Latest commit

 

History

History
42 lines (32 loc) · 1.48 KB

README.md

File metadata and controls

42 lines (32 loc) · 1.48 KB

probrobotics2021

概要

強化学習を用いて, エージェントに自作の迷路を解かせます.
学習によって行動価値がどのように変化するかを可視化しています.

動画

地図の見方

  • 黒・・・・・壁, エージェントはこのますに進むことができない.
  • 緑・・・・・スタート地点, エージェントがepisodeの初めにいる場所
  • 青・・・・・ゴール地点, エージェントがここに達すると迷路を解いたことになる.
  • 赤・・・・・エージェントの現在地
  • 黄・・・・・行動価値を可視化したもの, 色が濃いほど矢印方向の行動価値が高いことを示す.

URL(Youtube)

  • Q-Learning
    IMAGE ALT TEXT HERE

  • SARSA
    IMAGE ALT TEXT HERE

実行方法 (python)

$ git clone https://github.com/matsumotokoki/probrobotics2021.git
$ cd probrobotics2021
$ python <実行するアルゴリズム>.py 

実行方法 (jupyter notebook)

$ git clone https://github.com/matsumotokoki/probrobotics2021.git
$ cd probrobotics2021/jupyter
# 上記2つのコマンド実行後, jupyterディレクトリでjupyter notebookを起動し, 実行したいアルゴリズムを実行

必要となるライブラリ

  • matplotlib
  • numpy
  • gym