Skip to content

Commit

Permalink
Merge branch 'master' of github.com:datawhalechina/easy-rl
Browse files Browse the repository at this point in the history
  • Loading branch information
qiwang committed Jun 24, 2024
2 parents 32516ee + 479fb6d commit 7a0811b
Showing 1 changed file with 1 addition and 1 deletion.
2 changes: 1 addition & 1 deletion docs/chapter1/chapter1_questions&keywords.md
Original file line number Diff line number Diff line change
Expand Up @@ -120,4 +120,4 @@

**1-5** 友善的面试官: 你了解有模型和免模型吗?两者具体有什么区别呢?

我认为两者的区别主要在于是否需要对真实的环境进行建模,免模型方法不需要对环境进行建模,直接与真实环境进行交互即可,所以其通常需要较多的数据或者采样工作来优化策略,这也使其对于真实环境具有更好的泛化性能;而有模型方法需要对环境进行建模,同时在真实环境与虚拟环境中进行学习,如果建模的环境与真实环境的差异较大,那么会限制其泛化性能。现在通常使用有模型方法进行模型的构建工作
我认为两者的区别主要在于是否需要对真实的环境进行建模,免模型方法不需要对环境进行建模,直接与真实环境进行交互即可,所以其通常需要较多的数据或者采样工作来优化策略,这也使其对于真实环境具有更好的泛化性能;而有模型方法需要对环境进行建模,同时在真实环境与虚拟环境中进行学习,如果建模的环境与真实环境的差异较大,那么会限制其泛化性能。随着技术的发展和数据的积累,现在通常使用免模型方法

0 comments on commit 7a0811b

Please sign in to comment.