准确率和召回率 1

Precision and recall of 1

我正在使用 DNN 解决一个问题。有 2 个输入变量(均为分类)和 1 个目标变量(二进制)。测试数据的准确率为99.95%。我做了交叉验证(10 倍),准确率是 99.96 (+- 0.05)。

在我的结果中,我看到准确率和召回率均为 1.0。我在这里附上了混淆矩阵和分类报告的图像。

Q1。 这种行为可以吗?

Q2。当我 运行 再次使用相同参数的相同模型时,我每次 得到不同的混淆矩阵 但是准确度总是接近 99.

首先,您 没有 有一个纯 1.00 precision and recall;这只是 报告的 数字,四舍五入到小数点后两位。正如您已经说过的,您的测试准确率和 cross-validation 准确率都远远超过 99.5%,四舍五入到 1.00 的阈值。只要你的实验错误率低于 2000 年的一部分,你就会得到这个。

这引出了一个问题,即经过训练的模型具有如此高的准确性是否合理:是的,是的。潜在的准确性取决于数据集中的信息可分离性:是否甚至 可能 为给定数据提取可分离的 space?只要输出是输入的(确定性)函数,您的模型就可以达到 100% 的准确度。您只需拥有一个(几乎)可能的数据集。

清楚了吗?