用于数据预处理的 Pickle
Pickle for datapreprocessing
我浏览了各种关于在 ml 模型上使用 pickle 的教程和文章,以便以后使用。
但是我无法获得泡菜或类似的东西来进行数据预处理。我正在进行预处理:
- 正在更改几个 columns/features 的数据类型。
- 特征工程。
- 热门Encoding/Dummy变量
使用以下代码缩放数据
从 sklearn.preprocessing 导入 StandardScaler
sc = StandardScaler()
X_train = sc.fit_transform(X_train)
X_test = sc.transform(X_test)
现在,我想对我通过预测的每个数据集执行此操作。
在我从 pickle 加载 ML 模型之前,有什么方法可以像 pickle 那样加载数据预处理步骤。
请指导
我创建了一个函数并将其保存为一个独立的文件。然后在需要时调用该函数。
下面是调用数据预处理函数的代码
from DataPreparationv3 import Data_Preprocess
Base_Data = pd.read_csv('Validate.csv')
DataReady = Data_Preprocess(Base_Data)
这解决了我的问题。
此致
苏迪尔
我浏览了各种关于在 ml 模型上使用 pickle 的教程和文章,以便以后使用。 但是我无法获得泡菜或类似的东西来进行数据预处理。我正在进行预处理:
- 正在更改几个 columns/features 的数据类型。
- 特征工程。
- 热门Encoding/Dummy变量
使用以下代码缩放数据
从 sklearn.preprocessing 导入 StandardScaler
sc = StandardScaler() X_train = sc.fit_transform(X_train) X_test = sc.transform(X_test)
现在,我想对我通过预测的每个数据集执行此操作。 在我从 pickle 加载 ML 模型之前,有什么方法可以像 pickle 那样加载数据预处理步骤。
请指导
我创建了一个函数并将其保存为一个独立的文件。然后在需要时调用该函数。
下面是调用数据预处理函数的代码
from DataPreparationv3 import Data_Preprocess
Base_Data = pd.read_csv('Validate.csv')
DataReady = Data_Preprocess(Base_Data)
这解决了我的问题。
此致
苏迪尔