Caffe 快照:.solverstate 与 .caffemodel
Caffe snapshots: .solverstate vs .caffemodel
在训练网络时,每 N 次迭代拍摄的快照有两种形式。一个是 .solverstate 文件,我猜它就是它听起来的样子,它存储损失函数和梯度的状态等。另一个是 .caffemodel 文件,我知道它存储训练参数。
如果您想要预训练模型,.caffemodel 是您需要的文件,所以我想如果您要测试您的网络,它也是您需要的文件。
W.solverstate 有什么用?在 this tutorial 中,您似乎可以从中重新开始训练,但这与使用 .caffemodel 有何不同? .solverstate 是否也包含与 .caffemodel 相同的信息?换句话说,.caffemodel 只是 .solverstate 的一个子集吗?
顾名思义,solverstate 文件存储求解器的状态,而不存储与分类结果相关的任何信息。该模型保存为 caffemodel 文件,您可以使用该文件获取数据的分类结果。如果你想微调你的网络,你可以使用预训练的 caffemodel 文件。这将节省时间,因为您的网络不需要从头开始学习。但是,如果由于断电或意外重启而需要停止当前训练,您可以从求解器状态的先前快照恢复训练。使用solverstate和caffemodel文件的区别在于前者允许你以预先确定的方式完成你的训练,而后者可能需要改变某些训练参数,例如最大迭代次数。
在训练网络时,每 N 次迭代拍摄的快照有两种形式。一个是 .solverstate 文件,我猜它就是它听起来的样子,它存储损失函数和梯度的状态等。另一个是 .caffemodel 文件,我知道它存储训练参数。
如果您想要预训练模型,.caffemodel 是您需要的文件,所以我想如果您要测试您的网络,它也是您需要的文件。
W.solverstate 有什么用?在 this tutorial 中,您似乎可以从中重新开始训练,但这与使用 .caffemodel 有何不同? .solverstate 是否也包含与 .caffemodel 相同的信息?换句话说,.caffemodel 只是 .solverstate 的一个子集吗?
顾名思义,solverstate 文件存储求解器的状态,而不存储与分类结果相关的任何信息。该模型保存为 caffemodel 文件,您可以使用该文件获取数据的分类结果。如果你想微调你的网络,你可以使用预训练的 caffemodel 文件。这将节省时间,因为您的网络不需要从头开始学习。但是,如果由于断电或意外重启而需要停止当前训练,您可以从求解器状态的先前快照恢复训练。使用solverstate和caffemodel文件的区别在于前者允许你以预先确定的方式完成你的训练,而后者可能需要改变某些训练参数,例如最大迭代次数。