reference Autograd:PyTorch中的梯度计算 PyTorch 的 backward 为什么有一个 grad_variables 参数? PyTorch - Variables, functionals and Autograd. PyTorch - Neural networks with nn modules