在 Flair 中解释 training.log(Zalando 研究)
Interpreting training.log in Flair (Zalando Research)
我正在使用 Flair 库来查看微调(单独实现)和嵌入投影之间是否存在很大差异(就结果而言)。我面临的问题涉及读取结果(在本例中,实验是使用 BERT 嵌入完成的)。
在 training.log 我得到这个:
2019-10-10 16:27:02,964 Testing using best model ...
2019-10-10 16:27:02,966 loading file best-model.pt
2019-10-10 16:37:23,793 0.7539 0.7539 0.7539
2019-10-10 16:37:23,795
MICRO_AVG: acc 0.605 - f1-score 0.7539
MACRO_AVG: acc 0.5467 - f1-score 0.6925
0 tp: 1420 - fp: 438 - fn: 144 - tn: 363 - precision: 0.7643 - recall: 0.9079 - accuracy: 0.7093 - f1-score: 0.8299
1 tp: 363 - fp: 144 - fn: 438 - tn: 1420 - precision: 0.7160 - recall: 0.4532 - accuracy: 0.3841 - f1-score: 0.5551
2019-10-10 16:37:23,796
我的测试数据集包含 2365 个用于二进制文本分类任务的实例。最后两行是什么意思? 0 和 1 之后是真阳性、精确率、召回率等等?什么是 0?什么是 1?
我还单独加载了最好的模型并在我的测试数据集上进行了测试,我得到了不同的结果。
如有任何帮助,我们将不胜感激。
因为,你正在为二元微调class化,精度,召回率和 F1 测量是评估模型的一种方式,无论你看到什么都是对模型的评估。
第1个字符0或1,表示class0或class1(2个class,作为其二进制class化)。对于每个 class,它都提到了真阳性 (tp)、假阳性 (fp)、假阴性 (fn) 和真阴性 (tn) 的数量。您可以将它们全部相加,它将等于您的测试集中的示例数。
tp,tn,fp,fn 的简短描述:
对于class 0(正数class):
tp:class0的实际例子数,正确预测为class0
fn:class1的实际例子数,正确预测为class1
fp:class1的实际例子数,错误预测为class0
tn:class0的实际例子数,错误预测为class1
对于 class 1.
的第 2 行反之亦然
我正在使用 Flair 库来查看微调(单独实现)和嵌入投影之间是否存在很大差异(就结果而言)。我面临的问题涉及读取结果(在本例中,实验是使用 BERT 嵌入完成的)。 在 training.log 我得到这个:
2019-10-10 16:27:02,964 Testing using best model ...
2019-10-10 16:27:02,966 loading file best-model.pt
2019-10-10 16:37:23,793 0.7539 0.7539 0.7539
2019-10-10 16:37:23,795
MICRO_AVG: acc 0.605 - f1-score 0.7539
MACRO_AVG: acc 0.5467 - f1-score 0.6925
0 tp: 1420 - fp: 438 - fn: 144 - tn: 363 - precision: 0.7643 - recall: 0.9079 - accuracy: 0.7093 - f1-score: 0.8299
1 tp: 363 - fp: 144 - fn: 438 - tn: 1420 - precision: 0.7160 - recall: 0.4532 - accuracy: 0.3841 - f1-score: 0.5551
2019-10-10 16:37:23,796
我的测试数据集包含 2365 个用于二进制文本分类任务的实例。最后两行是什么意思? 0 和 1 之后是真阳性、精确率、召回率等等?什么是 0?什么是 1? 我还单独加载了最好的模型并在我的测试数据集上进行了测试,我得到了不同的结果。
如有任何帮助,我们将不胜感激。
因为,你正在为二元微调class化,精度,召回率和 F1 测量是评估模型的一种方式,无论你看到什么都是对模型的评估。
第1个字符0或1,表示class0或class1(2个class,作为其二进制class化)。对于每个 class,它都提到了真阳性 (tp)、假阳性 (fp)、假阴性 (fn) 和真阴性 (tn) 的数量。您可以将它们全部相加,它将等于您的测试集中的示例数。
tp,tn,fp,fn 的简短描述:
对于class 0(正数class):
tp:class0的实际例子数,正确预测为class0
fn:class1的实际例子数,正确预测为class1
fp:class1的实际例子数,错误预测为class0
tn:class0的实际例子数,错误预测为class1
对于 class 1.
的第 2 行反之亦然