预测准确度
Accuraccy for prediction
我是机器学习的新手,我正在尝试学习这个过程,并开始使用 Weka。当我在 Weka 中加载数据并开始分类时,软件显示如下值:
Correctly Classified Instances 416 39.6568 %
Incorrectly Classified Instances 633 60.3432 %
Kappa statistic 0.091
Mean absolute error 0.4371
Root mean squared error 0.4663
Relative absolute error 98.4524 %
Root relative squared error 98.9763 %
Coverage of cases (0.95 level) 100 %
Mean rel. region size (0.95 level) 100 %
Total Number of Instances 1049
=== Detailed Accuracy By Class ===
TP Rate FP Rate Precision Recall F-Measure MCC ROC Area PRC Area Class
0.310 0.231 0.377 0.310 0.340 0.084 0.554 0.448 16-18
0.271 0.167 0.460 0.271 0.341 0.123 0.501 0.359 19+
0.599 0.511 0.382 0.599 0.467 0.084 0.570 0.395 All Age
Weighted Avg. 0.397 0.306 0.407 0.397 0.384 0.098 0.541 0.399
通过查看这些值,我可以假设我有错误数据,因为正确分类的实例数为 37.65,并且错误率很高。但 TP Rate 和 Precision 都在可接受的水平附近。
这让我很困惑,我想知道如何根据这些数字判断模型?这是否意味着我的数据预处理不当?
你必须做一个混淆矩阵来获得准确度和精确度。下面是link。希望对你有帮助。
http://www2.cs.uregina.ca/~dbd/cs831/notes/confusion_matrix/confusion_matrix.html
我是机器学习的新手,我正在尝试学习这个过程,并开始使用 Weka。当我在 Weka 中加载数据并开始分类时,软件显示如下值:
Correctly Classified Instances 416 39.6568 %
Incorrectly Classified Instances 633 60.3432 %
Kappa statistic 0.091
Mean absolute error 0.4371
Root mean squared error 0.4663
Relative absolute error 98.4524 %
Root relative squared error 98.9763 %
Coverage of cases (0.95 level) 100 %
Mean rel. region size (0.95 level) 100 %
Total Number of Instances 1049
=== Detailed Accuracy By Class ===
TP Rate FP Rate Precision Recall F-Measure MCC ROC Area PRC Area Class
0.310 0.231 0.377 0.310 0.340 0.084 0.554 0.448 16-18
0.271 0.167 0.460 0.271 0.341 0.123 0.501 0.359 19+
0.599 0.511 0.382 0.599 0.467 0.084 0.570 0.395 All Age
Weighted Avg. 0.397 0.306 0.407 0.397 0.384 0.098 0.541 0.399
通过查看这些值,我可以假设我有错误数据,因为正确分类的实例数为 37.65,并且错误率很高。但 TP Rate 和 Precision 都在可接受的水平附近。
这让我很困惑,我想知道如何根据这些数字判断模型?这是否意味着我的数据预处理不当?
你必须做一个混淆矩阵来获得准确度和精确度。下面是link。希望对你有帮助。
http://www2.cs.uregina.ca/~dbd/cs831/notes/confusion_matrix/confusion_matrix.html