如何启动机器学习模型?
How to launch a Machine Learning model?
首先感谢您花时间阅读我的问题。我已经用数据集(著名的关于癌症的数据集)完成了机器学习模型,我想知道如何预测新变量的结果。我认为我必须(经常)继续训练数据,以便在我的预测中使用更准确的数据,但对于预测新数据,“就像将测试数据(y 变量)更改为新数据一样简单吗?
非常感谢您抽出宝贵时间,我们将不胜感激。
您可能正在使用 sklearn.svm
中的 SVC
class。
使用 fit
方法拟合模型后,您可以使用 predict
方法预测新数据。参见 here。
顺便说一句:对于支持向量机,您不必多次拟合数据。也许您将其与神经网络混淆了。
如果您所说的是要更改测试数据中的特征数量,那么您不能这样做。
训练集和测试集的特征数量必须相同。
但是,如果您的测试数据有一些 class 的分类变量,而这些变量在训练数据中不存在,那么您最好使用一个额外的类别作为 "NONE" 或 "Others" 来训练您的模型,以获得所有功能.
通过这种方式,当您在测试数据中遇到新的 class 分类变量时,您可以将其更改为 "NONE" 或 "Others" 并对训练模型进行预测。
这样它就不会破坏你的模型。
希望我能正确理解你的问题。
首先感谢您花时间阅读我的问题。我已经用数据集(著名的关于癌症的数据集)完成了机器学习模型,我想知道如何预测新变量的结果。我认为我必须(经常)继续训练数据,以便在我的预测中使用更准确的数据,但对于预测新数据,“就像将测试数据(y 变量)更改为新数据一样简单吗? 非常感谢您抽出宝贵时间,我们将不胜感激。
您可能正在使用 sklearn.svm
中的 SVC
class。
使用 fit
方法拟合模型后,您可以使用 predict
方法预测新数据。参见 here。
顺便说一句:对于支持向量机,您不必多次拟合数据。也许您将其与神经网络混淆了。
如果您所说的是要更改测试数据中的特征数量,那么您不能这样做。
训练集和测试集的特征数量必须相同。 但是,如果您的测试数据有一些 class 的分类变量,而这些变量在训练数据中不存在,那么您最好使用一个额外的类别作为 "NONE" 或 "Others" 来训练您的模型,以获得所有功能.
通过这种方式,当您在测试数据中遇到新的 class 分类变量时,您可以将其更改为 "NONE" 或 "Others" 并对训练模型进行预测。
这样它就不会破坏你的模型。
希望我能正确理解你的问题。