SimpleAgent 600K dataset

tambetm released this 20 Jun 18:39

· 32 commits to master since this release

d566375

Samples collected from four SimpleAgents playing against each other. Dataset contains 600 episodes (~600K samples) in training set and 100 episodes (~100K samples) in validation set. There are two versions: rewards calculated with 0.99 discount and no discount (1). Cleaned version means that if three consecutive actions and four consecutive observations did not change, those samples are removed.

Assets 10

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

SimpleAgent 600K dataset