两个文件之间的分类报告和准确性

Classification report and Accuracy between two files

我正在尝试对两个文件进行分类报告。两者具有相同的数据,但 test.csv 没有 Survived 列。问题是分类报告应该在 y 测试中写什么,因为在测试文件中缺少“Survived”

这是我的代码

import pandas as pd
from sklearn.linear_model import LogisticRegression
from sklearn.metrics import classification_report

train = pd.read_csv('..../titanic/train.csv')
test = pd.read_csv('..../titanic/test.csv')
X = train.drop('Survived' , axis=1)
y = train['Survived']

logmodel = LogisticRegression()
logmodel.fit(X,y)
predictions = logmodel.predict(test)

rr = {'PassengerId':test['PassengerId'] , 'Survived' : predictions}
result = pd.DataFrame(rr)
print(classification_report('what sould i write',predictions))

为了准确性 如果我这样写

logmodel.score(X ,y)

0.797979797979798

这个答案是我预测的模型的准确性? 是对还是错

你没有 kaggle 中测试数据集的答案 - 你应该将你的“train.csv”分成两部分,“训练”和“测试”并检查你自己的测试部分,而不是 kaggle一.

Kaggle test.csv 用于进行预测并将其上传到 kaggle 网站。不上传就不知道正确答案