使用 scikit python 的自变量线性回归

Linear Regression with independent variables using scikit python

我是 Scikit-Learn 的新手,我需要解决使用 Python 预测新数据的问题。
我有一个二维数据table如下:(抱歉我不能在这里创建二维table)
---------------------------------------------- ---
日期 -----|小时
---------------------------------------------- ---
----------| 1 | 2 | 3 | 4 |.......| 23 |
01 - 一月 | 3 | 7 | 22 | 46 | .... | 94 |
...
23 - 九月 | × | × | × | x |...
我的 table 有 1 个维度是日期,另一个维度是小时。每一天都会有24小时。每个小时会得到一个独立的随机2位数字。现在我可以使用线性回归预测未来几天的新数据吗?请帮我!谢谢

首先,如果我正确理解你的问题,对于约会的每个小时,你会得到一个随机的 2 位数字。您有一组具有相应随机 2 位数字的日期,现在对于您没有随机 2 位数字的新日期,您需要线性回归来预测该 2 位数字是什么。

但是,我不知道这是否是最好的解决方案。对于线性回归,您需要一个预测变量 (Date/Hour) 并使用它来预测 parameter/value(2 位数字)。不过,您提到该值是随机的,这意味着没有关系。除非有一个你没有提到,否则我认为你无法预测 2 位数是多少。最多只能通过生成一个新的随机 2 位数来预测新的 2 位数。

如果您仍想做 Linear Regression with Scikit-Learn,您需要将数据拆分为训练集和测试集,以及 X 和 y。 您的训练集是您知道的日期和时间(y)和数字(x),您的测试集是日期和时间(y)。请注意,您想要将日期和小时组合成 1 条记录,因此您得到的实例为:23-Sept-01、23-Sept-02、..、23-Sept-23。 (你的第 24 小时是哪里?) 我还建议在将数据加载到 python 之前拆分数据,或者使用 numpy matrices 拆分数据。您可以使用预测函数以使用线性回归的方式预测您的 2 位数。

希望这对您有所帮助,如果格式混乱请见谅(此处为新内容)