Skip to content

图10.1中文字错误 #173

@liuup

Description

@liuup

按照原文的说法:“他也可以决定要学习,在下一个时间点,因为他没有玩耍,所以觉得很不爽,所以得到奖励−1”,但是配图中的 $r_{t+1}=1$ ,与文字和上下文的描述不符。

Image

Metadata

Metadata

Assignees

No one assigned

    Labels

    Type

    No type

    Projects

    No projects

    Milestone

    No milestone

    Relationships

    None yet

    Development

    No branches or pull requests

    Issue actions