通过具有多个分类特征的线性回归模型预测单个数据
single data to predict via linear regression model with more than one categorical feature
我建立了一个线性回归模型来预测产品的销售量,
就我而言,我有 5 个特征,其中 4 个是分类特征。
MONTH REGION INTERVENANT CONFIG WEIGHT SALES_NB
我使用了 OneHotEncoder
from sklearn.preprocessing import OneHotEncoder
onehotencoder = OneHotEncoder(categorical_features = [0,1,2,3])
X = onehotencoder.fit_transform(X).toarray()
X = X [:, 1:]
(如有错误请指正)
我想知道如何格式化我的数据以将其传递给 predict()。
实际上,如果我通过:
Xnew = np.array([[2,2,14895,614,0.1]])
ynew = regressor.predict(Xnew)
我收到这个错误:
ValueError: shapes (1,4) and (428,) not aligned: 4 (dim 1) != 428 (dim 0)
在将新样本传递给预测器之前尝试使用 onehotencoder
对其进行编码:
Xnew = np.array([[2,2,14895,614,0.1]])
Xnew_encoded = onehotencoder.transform(Xnew)
ynew = regressor.predict(Xnew_encoded)
我建立了一个线性回归模型来预测产品的销售量, 就我而言,我有 5 个特征,其中 4 个是分类特征。
MONTH REGION INTERVENANT CONFIG WEIGHT SALES_NB
我使用了 OneHotEncoder
from sklearn.preprocessing import OneHotEncoder
onehotencoder = OneHotEncoder(categorical_features = [0,1,2,3])
X = onehotencoder.fit_transform(X).toarray()
X = X [:, 1:]
(如有错误请指正)
我想知道如何格式化我的数据以将其传递给 predict()。 实际上,如果我通过:
Xnew = np.array([[2,2,14895,614,0.1]])
ynew = regressor.predict(Xnew)
我收到这个错误:
ValueError: shapes (1,4) and (428,) not aligned: 4 (dim 1) != 428 (dim 0)
在将新样本传递给预测器之前尝试使用 onehotencoder
对其进行编码:
Xnew = np.array([[2,2,14895,614,0.1]])
Xnew_encoded = onehotencoder.transform(Xnew)
ynew = regressor.predict(Xnew_encoded)