Scikit 学习线性回归预测标签
Scikit learn linear regression predicting labels
我正在尝试使用 SK learn 对时间序列标记数据执行线性回归。
我的数据格式是 data=(timestamp,value,label)
分配给我的数据的标签是 0 或 1。
我试图从 SKLearn 网站
关注这个 example
我的问题:
1-示例中训练数据的标签在哪里?他们在 diabetes_y_train 吗?
2- 方法 predict() 的 return 值是什么?在我的代码中,它 return 是一个 n_samples 的数组作为 [0,1] 范围内的预测值。但是,我希望有 return 个 0 或 1 的二进制值(没有中间值)
1 - diabetes_y_train
是 train
的标签
2 - 您正在使用回归函数,因此使用连续变量是正确的。如果你想要二进制输出,你不是在解决回归问题,而是解决分类问题,然后你可以设置一个阈值来离散化预测或使用 sklearn 提供的 classifier 之一。
1 - 是
2 - Predict 计算浮点数,因为该示例试图预测浮点值而不是二进制值。所以没有 yes/no 答案,而是一个预测值,为了估计误差,计算差异并在 np.mean((regr.predict(diabetes_X_test) - diabetes_y_test) ** 2)
中取平均值
我正在尝试使用 SK learn 对时间序列标记数据执行线性回归。
我的数据格式是 data=(timestamp,value,label)
分配给我的数据的标签是 0 或 1。 我试图从 SKLearn 网站
关注这个 example我的问题:
1-示例中训练数据的标签在哪里?他们在 diabetes_y_train 吗?
2- 方法 predict() 的 return 值是什么?在我的代码中,它 return 是一个 n_samples 的数组作为 [0,1] 范围内的预测值。但是,我希望有 return 个 0 或 1 的二进制值(没有中间值)
1 - diabetes_y_train
是 train
2 - 您正在使用回归函数,因此使用连续变量是正确的。如果你想要二进制输出,你不是在解决回归问题,而是解决分类问题,然后你可以设置一个阈值来离散化预测或使用 sklearn 提供的 classifier 之一。
1 - 是
2 - Predict 计算浮点数,因为该示例试图预测浮点值而不是二进制值。所以没有 yes/no 答案,而是一个预测值,为了估计误差,计算差异并在 np.mean((regr.predict(diabetes_X_test) - diabetes_y_test) ** 2)