Python SKLearn训练测试数据
Python SKLearn training test data
这是我第一次从事机器学习方面的工作。我在苹果股票 returns 上从 Sklearn 分配了 运行 逻辑和贝叶斯回归,并将其与线性回归 + 张量流进行比较。我不确定我的理解是否正确,在我 运行 逻辑回归之前我必须训练我的数据集。我试图这样做,我的数据看起来像:
Closing_Price Daily_Returns Daily_Returns_1 Daily_Returns_2 Daily_Returns_3 Daily_Returns_4 Daily_Returns_5
Date
1980-12-22 0.53 0.058269 0.040822 0.042560 0.021979 -0.085158 -0.040005
1980-12-23 0.55 0.037041 0.058269 0.040822 0.042560 0.021979 -0.085158
1980-12-24 0.58 0.053110 0.037041 0.058269 0.040822 0.042560 0.021979
1980-12-26 0.63 0.082692 0.053110 0.037041 0.058269 0.040822 0.042560
1980-12-29 0.64 0.015748 0.082692 0.053110 0.037041 0.058269 0.040822
当我运行
from sklearn.model_selection import train_test_split
X_train, X_test, y_train, y_test = train_test_split(X,y,test_size = 0.2)
我得到一个错误 NameError: name 'X' is not defined
非常感谢您的帮助。预先感谢您的宝贵时间。
出于某种原因观看了很多 YouTube 视频,但他们错过了告诉您这一点。必须像这样定义 X 和 y:
X = apple['Closing_Price'].values.reshape(-1,1)
y = apple['Daily_Returns'].values.reshape(-1,1)
这是我第一次从事机器学习方面的工作。我在苹果股票 returns 上从 Sklearn 分配了 运行 逻辑和贝叶斯回归,并将其与线性回归 + 张量流进行比较。我不确定我的理解是否正确,在我 运行 逻辑回归之前我必须训练我的数据集。我试图这样做,我的数据看起来像:
Closing_Price Daily_Returns Daily_Returns_1 Daily_Returns_2 Daily_Returns_3 Daily_Returns_4 Daily_Returns_5
Date
1980-12-22 0.53 0.058269 0.040822 0.042560 0.021979 -0.085158 -0.040005
1980-12-23 0.55 0.037041 0.058269 0.040822 0.042560 0.021979 -0.085158
1980-12-24 0.58 0.053110 0.037041 0.058269 0.040822 0.042560 0.021979
1980-12-26 0.63 0.082692 0.053110 0.037041 0.058269 0.040822 0.042560
1980-12-29 0.64 0.015748 0.082692 0.053110 0.037041 0.058269 0.040822
当我运行
from sklearn.model_selection import train_test_split
X_train, X_test, y_train, y_test = train_test_split(X,y,test_size = 0.2)
我得到一个错误 NameError: name 'X' is not defined
非常感谢您的帮助。预先感谢您的宝贵时间。
出于某种原因观看了很多 YouTube 视频,但他们错过了告诉您这一点。必须像这样定义 X 和 y:
X = apple['Closing_Price'].values.reshape(-1,1)
y = apple['Daily_Returns'].values.reshape(-1,1)