Scikit 学习线性回归预测标签

Scikit learn linear regression predicting labels

我正在尝试使用 SK learn 对时间序列标记数据执行线性回归。我的数据格式是 data=(timestamp,value,label)

分配给我的数据的标签是 0 或 1。我试图从 SKLearn 网站

关注这个 example

我的问题：

1-示例中训练数据的标签在哪里？他们在 diabetes_y_train 吗？

2- 方法 predict() 的 return 值是什么？在我的代码中，它 return 是一个 n_samples 的数组作为 [0,1] 范围内的预测值。但是，我希望有 return 个 0 或 1 的二进制值（没有中间值）

1 - diabetes_y_train 是 train

的标签

2 - 您正在使用回归函数，因此使用连续变量是正确的。如果你想要二进制输出，你不是在解决回归问题，而是解决分类问题，然后你可以设置一个阈值来离散化预测或使用 sklearn 提供的 classifier 之一。

1 - 是

2 - Predict 计算浮点数，因为该示例试图预测浮点值而不是二进制值。所以没有 yes/no 答案，而是一个预测值，为了估计误差，计算差异并在 np.mean((regr.predict(diabetes_X_test) - diabetes_y_test) ** 2)

中取平均值