关于学习曲线

About learning curves

我正在尝试使用 sklearn.learning_curve 绘制我的 SVC 分类器的学习曲线。从图中,我发现我的训练分数和测试分数同时增加。但是训练曲线和交叉验证曲线之间的差距随着样本数量的增加而变大。据我所知,当提供更多样本时,训练分数应该会降低。你们对这个问题有什么感觉吗?

如果训练精度和交叉验证精度之间的差距越来越大,则表明您的模型对训练数据过度拟合。

随着每次迭代(提供额外的训练数据),您的模型能够更好地捕获训练数据,但是它不再能够更好地泛化(因此交叉验证准确性会收敛)。