在pytorch中加速训练深度学习模型
Speed up training deep learning model in pytorch
我正在使用 Pytorch 框架训练深度学习模型。并且我添加torch.no_grad来加速训练阶段
model.train()
for epoch in range(epochs):
for data, label in loader:
data, label = data.to(device), label.to(device)
with torch.no_grad():
out = model(data)
out.requires_grad = True
#model.zero_grad(), loss(), loss.backward, optim.step
速度提高了,但是梯度更新有问题,模型没有正确收敛。有人可以向我解释为什么它不起作用吗?
简单地说,当使用 torch.no_grad
上下文管理器时,不会计算梯度,因此模型无法接收任何更新。
torch.no_grad
用于其他情况,例如评估模型时。来自 docs:
Disabling gradient calculation is useful for inference, when you are sure that you will not call Tensor.backward()
我正在使用 Pytorch 框架训练深度学习模型。并且我添加torch.no_grad来加速训练阶段
model.train()
for epoch in range(epochs):
for data, label in loader:
data, label = data.to(device), label.to(device)
with torch.no_grad():
out = model(data)
out.requires_grad = True
#model.zero_grad(), loss(), loss.backward, optim.step
速度提高了,但是梯度更新有问题,模型没有正确收敛。有人可以向我解释为什么它不起作用吗?
简单地说,当使用 torch.no_grad
上下文管理器时,不会计算梯度,因此模型无法接收任何更新。
torch.no_grad
用于其他情况,例如评估模型时。来自 docs:
Disabling gradient calculation is useful for inference, when you are sure that you will not call
Tensor.backward()