Caffe 快照：.solverstate 与 .caffemodel

Caffe snapshots: .solverstate vs .caffemodel

在训练网络时，每 N 次迭代拍摄的快照有两种形式。一个是 .solverstate 文件，我猜它就是它听起来的样子，它存储损失函数和梯度的状态等。另一个是 .caffemodel 文件，我知道它存储训练参数。

如果您想要预训练模型，.caffemodel 是您需要的文件，所以我想如果您要测试您的网络，它也是您需要的文件。

W.solverstate 有什么用？在 this tutorial 中，您似乎可以从中重新开始训练，但这与使用 .caffemodel 有何不同？ .solverstate 是否也包含与 .caffemodel 相同的信息？换句话说，.caffemodel 只是 .solverstate 的一个子集吗？

顾名思义，solverstate 文件存储求解器的状态，而不存储与分类结果相关的任何信息。该模型保存为 caffemodel 文件，您可以使用该文件获取数据的分类结果。如果你想微调你的网络，你可以使用预训练的 caffemodel 文件。这将节省时间，因为您的网络不需要从头开始学习。但是，如果由于断电或意外重启而需要停止当前训练，您可以从求解器状态的先前快照恢复训练。使用solverstate和caffemodel文件的区别在于前者允许你以预先确定的方式完成你的训练，而后者可能需要改变某些训练参数，例如最大迭代次数。

Caffe 快照：.solverstate 与 .caffemodel

Caffe snapshots: .solverstate vs .caffemodel

deep-learning

caffe