sklearn 中 learning_curve 函数中估计器参数的值应该是多少?
what should be the value of the estimator parameter in learning_curve function in sklearn?
我正在尝试制作学习曲线,我想使用的算法是 knn 算法。为此,估计器的值应该是多少。它的可能值或选项不在文档中(我不确定它是否应该存在)。
这是我的代码-
features = ['age','sex','cp','trestbps','chol','fbs','restecg','thalach','exang','oldpeak','slope','ca','thal']
target = 'num'
train_size, train_scores, validation_scores = learning_curve(estimator = KNN(), x=dataset[features], y=dataset[target], train_size=train_sizes, cv=5, scoring='confusion_matrix')
错误是 - KNN() 未定义(原因很明显)。但我的问题是,如果我想使用 knn 算法,它的价值应该是多少。
estimator : object type that implements the “fit” and “predict” methods
因此,如果您处于回归设置中,则应使用
from sklearn.neighbors import KNeighborsRegressor
# define the no. of nearest neighbors k
train_size, train_scores, validation_scores = learning_curve(estimator = KNeighborsRegressor(n_neighbors=k), [...])
而如果您处于分类设置中,则应使用
from sklearn.neighbors import KNeighborsClassifier
# define the no. of nearest neighbors k
train_size, train_scores, validation_scores = learning_curve(estimator = KNeighborsClassifier(n_neighbors=k), [...])
当然,在这两种情况下,您还应该定义最近邻的数量 k
。
总体思路是,在 estimator
参数中,您可以使用任何实现 fit
和 predist
方法的 scikit-learn 可用算法,如文档中明确提到的那样(link 上面提供的)。
我正在尝试制作学习曲线,我想使用的算法是 knn 算法。为此,估计器的值应该是多少。它的可能值或选项不在文档中(我不确定它是否应该存在)。
这是我的代码-
features = ['age','sex','cp','trestbps','chol','fbs','restecg','thalach','exang','oldpeak','slope','ca','thal']
target = 'num'
train_size, train_scores, validation_scores = learning_curve(estimator = KNN(), x=dataset[features], y=dataset[target], train_size=train_sizes, cv=5, scoring='confusion_matrix')
错误是 - KNN() 未定义(原因很明显)。但我的问题是,如果我想使用 knn 算法,它的价值应该是多少。
estimator : object type that implements the “fit” and “predict” methods
因此,如果您处于回归设置中,则应使用
from sklearn.neighbors import KNeighborsRegressor
# define the no. of nearest neighbors k
train_size, train_scores, validation_scores = learning_curve(estimator = KNeighborsRegressor(n_neighbors=k), [...])
而如果您处于分类设置中,则应使用
from sklearn.neighbors import KNeighborsClassifier
# define the no. of nearest neighbors k
train_size, train_scores, validation_scores = learning_curve(estimator = KNeighborsClassifier(n_neighbors=k), [...])
当然,在这两种情况下,您还应该定义最近邻的数量 k
。
总体思路是,在 estimator
参数中,您可以使用任何实现 fit
和 predist
方法的 scikit-learn 可用算法,如文档中明确提到的那样(link 上面提供的)。