NameError: name 'training_set' is not defined

我试图在数据集上进行预测，但是当我运行程序时，它给了我以下错误：

NameError: name 'training_set' is not defined

我只是试试这个预测代码：

但是在运行ning

之后给我报错

（抱歉英语不好）

可能是因为你没有在代码中定义'training_set'。它应该像上面代码中的 training_set = insert_a_value_here 一样，就像您已经定义的那样 test_image

可能你还没有初始化它

training_set必须取值

例如，training_set可以取加载CIFAR10或MNIST数据集的预定义加载函数的返回值（元组）

在对数据集进行预测之前，需要遵循这些步骤

加载数据集，例如: data = pd.read_csv('mydata.csv') 现在 select 您要预测的数据集中的列。例如，它是名为 score
分离预测列并将其设为 Y，其余为 X。例如。 Y = data['score'] 和 X = data.drop('score')。剩下的数据现在变成了你的 x。
对您的数据进行拆分以进行训练和测试。你可以使用 sklearn.model_selection import train_test_split 然后做 x_train, x_test, y_train, y_test(X,Y, test_size=0.2, random_state = 1)

现在你的训练 X 为 x_train 并且训练 Y 为 y_train，测试 X 为 x_test，测试 Y 为 y_test.

选择线性回归等模型或 SVM、Logisticregression 等其他分类模型。例如 from sklearn.linear_model import LinearRegression.
运行模型并将其拟合到您的训练 X 和训练 Y 例如 model = LinearRegression()
model.fit(x_train, y_train)

在训练数据上拟合我的模型。 6.预测你在测试数据上的分数 pred = model.predict(x_test)

测量精度import accuracy_score from sklearn.metricsprint(accuracy_score(y_test, pred)

python