用于数据预处理的 Pickle

Question

我浏览了各种关于在 ml 模型上使用 pickle 的教程和文章，以便以后使用。但是我无法获得泡菜或类似的东西来进行数据预处理。我正在进行预处理：

使用以下代码缩放数据

从 sklearn.preprocessing 导入 StandardScaler

sc = StandardScaler()

X_train = sc.fit_transform(X_train)

X_test = sc.transform(X_test)

现在，我想对我通过预测的每个数据集执行此操作。在我从 pickle 加载 ML 模型之前，有什么方法可以像 pickle 那样加载数据预处理步骤。

请指导

Answer 1

我创建了一个函数并将其保存为一个独立的文件。然后在需要时调用该函数。

下面是调用数据预处理函数的代码

from DataPreparationv3 import Data_Preprocess
Base_Data = pd.read_csv('Validate.csv')

DataReady = Data_Preprocess(Base_Data)

这解决了我的问题。

此致

苏迪尔

Pickle for datapreprocessing