Scikit 学习线性回归预测标签

Scikit learn linear regression predicting labels

我正在尝试使用 SK learn 对时间序列标记数据执行线性回归。 我的数据格式是 data=(timestamp,value,label)

分配给我的数据的标签是 0 或 1。 我试图从 SKLearn 网站

关注这个 example

我的问题:

1-示例中训练数据的标签在哪里?他们在 diabetes_y_train 吗?

2- 方法 predict() 的 return 值是什么?在我的代码中,它 return 是一个 n_samples 的数组作为 [0,1] 范围内的预测值。但是,我希望有 return 个 0 或 1 的二进制值(没有中间值)

1 - diabetes_y_train 是 train

的标签

2 - 您正在使用回归函数,因此使用连续变量是正确的。如果你想要二进制输出,你不是在解决回归问题,而是解决分类问题,然后你可以设置一个阈值来离散化预测或使用 sklearn 提供的 classifier 之一。

1 - 是

2 - Predict 计算浮点数,因为该示例试图预测浮点值而不是二进制值。所以没有 yes/no 答案,而是一个预测值,为了估计误差,计算差异并在 np.mean((regr.predict(diabetes_X_test) - diabetes_y_test) ** 2)

中取平均值