NameError: name 'training_set' is not defined

NameError: name 'training_set' is not defined

我试图在数据集上进行预测,但是当我 运行 程序时,它给了我以下错误:

NameError: name 'training_set' is not defined

我只是试试这个预测代码:

但是在运行ning

之后给我报错

(抱歉英语不好)

可能是因为你没有在代码中定义'training_set'。它应该像上面代码中的 training_set = insert_a_value_here 一样,就像您已经定义的那样 test_image

可能你还没有初始化它

training_set必须取值

例如,training_set可以取加载CIFAR10或MNIST数据集的预定义加载函数的返回值(元组)

在对数据集进行预测之前,需要遵循这些步骤

  1. 加载数据集,例如: data = pd.read_csv('mydata.csv') 现在 select 您要预测的数据集中的列。例如,它是名为 score
  2. 的列
  3. 分离预测列并将其设为 Y,其余为 X。例如。 Y = data['score']X = data.drop('score')。 剩下的数据现在变成了你的 x。
  4. 对您的数据进行拆分以进行训练和测试。你可以使用 sklearn.model_selection import train_test_split 然后做 x_train, x_test, y_train, y_test(X,Y, test_size=0.2, random_state = 1)

现在你的训练 X 为 x_train 并且 训练 Y 为 y_train,测试 X 为 x_test,测试 Y 为 y_test.

  1. 选择线性回归等模型或 SVM、Logisticregression 等其他分类模型。例如 from sklearn.linear_model import LinearRegression.

  2. 运行 模型并将其拟合到您的训练 X 和训练 Y 例如 model = LinearRegression()
    model.fit(x_train, y_train)

在训练数据上拟合我的模型。 6.预测你在测试数据上的分数 pred = model.predict(x_test)

  1. 测量精度import accuracy_score from sklearn.metricsprint(accuracy_score(y_test, pred)