将图像数组和标签数据框拆分为训练集、测试集和验证集
Split image array and labels dataframe into train, test and validataion sets
我有一个形状为 (30000, 128,128,3) 的图像数组(从 npy 文件加载)和一个形状为 (30000, 1) 的标签数据框。如何将它们拆分为训练集、测试集和验证集,以便我可以继续构建 CNN 模型?
您可以使用软件包 sklearn。如果您的 imagew 数组是 'X' 并且标签是 'Y',请使用:
>> from sklearn.model_selection import train_test_split
这个包在训练、测试和验证中拆分数据集:
>> X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.20, random_state=33)
参考:https://scikit-learn.org/stable/modules/generated/sklearn.model_selection.train_test_split.html
编码愉快!!
我有一个形状为 (30000, 128,128,3) 的图像数组(从 npy 文件加载)和一个形状为 (30000, 1) 的标签数据框。如何将它们拆分为训练集、测试集和验证集,以便我可以继续构建 CNN 模型?
您可以使用软件包 sklearn。如果您的 imagew 数组是 'X' 并且标签是 'Y',请使用:
>> from sklearn.model_selection import train_test_split
这个包在训练、测试和验证中拆分数据集:
>> X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.20, random_state=33)
参考:https://scikit-learn.org/stable/modules/generated/sklearn.model_selection.train_test_split.html
编码愉快!!