Skip to content
New issue

Have a question about this project? Sign up for a free GitHub account to open an issue and contact its maintainers and the community.

By clicking “Sign up for GitHub”, you agree to our terms of service and privacy statement. We’ll occasionally send you account related emails.

Already on GitHub? Sign in to your account

Example: task=Anymal #2

Open
Yusuke-Yamasaki-555 opened this issue Feb 10, 2024 · 2 comments
Open

Example: task=Anymal #2

Yusuke-Yamasaki-555 opened this issue Feb 10, 2024 · 2 comments

Comments

@Yusuke-Yamasaki-555
Copy link
Collaborator

環境はhumanoidと同じ

@Yusuke-Yamasaki-555
Copy link
Collaborator Author

Yusuke-Yamasaki-555 commented Feb 10, 2024

  • 学習時間:real 9m25.754s (timeコマンドにて計測)
    • GPUは1つ使用
  • 学習終了
    • 終了時の出力スクショ↓

image

  • 平均報酬(1回のみ実験):about 64.64
  • 平均step(1回のみ実験):about 2331.22
  • 学習結果の方策をテストしている様子(上記報酬、stepを得たTestとは異なる(実行コマンドは同じ)Testの様子)↓
isaacgym_anymal_result_test_ep-1000-rew_20240210.mp4
  • コマンド↓
    python3 train.py task=Anymal checkpoint=runs/Anymal_10-17-49-21/nn/last_Anymal_ep_1000_rew__62.79_.pth test=True
    • runs/~/nn/内で、Anymal.pthが1つとlast_Anymal_ep_~~~.pthが複数あるけど、違いは何だろうか。last_~~.pthで一番新しいやつをTestすればいいと思っている。
      • ファイル名内の"ep"後の数字が最大epochで、"rew__"後の数字が最終的な報酬の値?でも報酬の値はHumanoidの方だとAveやSumと異なった数値になっているから、信用できないかも。epはあってそう。

@Yusuke-Yamasaki-555
Copy link
Collaborator Author

Test中の標準出力に、reward: 0.00 steps: 1.0reward: 0.01 steps: 1.0が紛れる現象の原因がわからん。Humanoidではこんなことはなかった。

Sign up for free to join this conversation on GitHub. Already have an account? Sign in to comment
Labels
None yet
Projects
None yet
Development

No branches or pull requests

1 participant