微观指标与宏观指标
Micro metrics vs macro metrics
为了测试我的多标签 classfication 模型的结果,我测量了 Precision、Recall 和 F1 分数。我想比较两个不同的结果,微观和宏观。我有一个只有几行的数据集,但我的标签数大约是 1700。为什么我在微观上得到了很高的结果,但宏却这么低,当它是多 class?
Accuracy: 0.743999
Micro Precision: 0.743999
Macro Precision: 0.256570
Micro Recall: 0.743999
Macro Recall: 0.264402
Micro F1 score: 0.743999
Macro F1 score: 0.250033
Cohens kappa: 0.739876
微平均
微平均精度和召回分数是根据 classes 的真阳性 (TP)、真阴性 (TN)、假阳性 (FP) 和假阴性 (FN) 计算得出的模型。
宏观平均线
宏观平均查准率和召回率得分计算为个体 classes 查准率和召回率得分的算术平均值。宏观平均 F1 分数计算为个体 classes 的 F1 分数的算术平均值。
When to use micro-averaging and macro-averaging scores?
当需要平均权衡每个实例或预测时,使用微平均分数。
使用macro-averaging score 当所有classes需要被平等对待来评估classifier的整体性能时最常见的 class 个标签。
在 class 不平衡的情况下使用 加权宏平均 分数(不同的实例与不同的 class 标签相关)。 weighted macro-average是在计算平均值的时候,通过对每个class标签的分数按真实实例的数量进行加权计算得到的。
当您想了解系统在数据集上的整体表现如何时,可以使用宏平均法。你不应该根据这个平均值做出任何具体的决定。另一方面,当您的数据集大小不同时,微平均可能是一个有用的衡量标准。
多class分类的微观平均和宏观平均精度得分
对于多class class化问题,微平均精度分数可以定义为所有classes 除以所有正预测。阳性预测是所有真阳性和假阳性的总和。
多class分类的微观平均和宏观平均召回分数
对于多class class化问题,微平均召回分数可以定义为所有classes 除以实际阳性(而不是预测阳性)。
参考文献:
为了测试我的多标签 classfication 模型的结果,我测量了 Precision、Recall 和 F1 分数。我想比较两个不同的结果,微观和宏观。我有一个只有几行的数据集,但我的标签数大约是 1700。为什么我在微观上得到了很高的结果,但宏却这么低,当它是多 class?
Accuracy: 0.743999
Micro Precision: 0.743999
Macro Precision: 0.256570
Micro Recall: 0.743999
Macro Recall: 0.264402
Micro F1 score: 0.743999
Macro F1 score: 0.250033
Cohens kappa: 0.739876
微平均
微平均精度和召回分数是根据 classes 的真阳性 (TP)、真阴性 (TN)、假阳性 (FP) 和假阴性 (FN) 计算得出的模型。
宏观平均线
宏观平均查准率和召回率得分计算为个体 classes 查准率和召回率得分的算术平均值。宏观平均 F1 分数计算为个体 classes 的 F1 分数的算术平均值。
When to use micro-averaging and macro-averaging scores?
当需要平均权衡每个实例或预测时,使用微平均分数。
使用macro-averaging score 当所有classes需要被平等对待来评估classifier的整体性能时最常见的 class 个标签。
在 class 不平衡的情况下使用 加权宏平均 分数(不同的实例与不同的 class 标签相关)。 weighted macro-average是在计算平均值的时候,通过对每个class标签的分数按真实实例的数量进行加权计算得到的。
当您想了解系统在数据集上的整体表现如何时,可以使用宏平均法。你不应该根据这个平均值做出任何具体的决定。另一方面,当您的数据集大小不同时,微平均可能是一个有用的衡量标准。
多class分类的微观平均和宏观平均精度得分
对于多class class化问题,微平均精度分数可以定义为所有classes 除以所有正预测。阳性预测是所有真阳性和假阳性的总和。
多class分类的微观平均和宏观平均召回分数
对于多class class化问题,微平均召回分数可以定义为所有classes 除以实际阳性(而不是预测阳性)。
参考文献: