Some notes about reinforce learning. 注:由于初学理解可能不够深刻,有些地方写的有点问题,欢迎大家指出。
RL-1
: Bellman EquationRL-2
: Policy Iteration and Value IterationRL-3
: Linear Quadratic RegulatorMCTS
: Monte Carlo Tree SearchFrenet
: CartesianFrenetConverterbacktrack
: Notes about the backtrack leetcode problems.
2022.3.8 更新Frenet详细推导过程,认真校对了其中的符号,全文由Typora软件编写而成。