本 issue 将会追踪和记录各种有关课程第四讲的问题和思考,欢迎有兴趣的同学在这个 issue 中评论,课程组会定期整理信息。 最新的 [第四讲 QA 合集文档](https://github.com/opendilab/PPOxFamily/blob/main/chapter4_reward/chapter4_qa.pdf)(2023.05.24更新)