来自数据框的随机样本并保留

Random Sample From Data frame and remains

如何在随机 select 数据离子后 select 保留数据帧?

这将给出 80% 的数据。但我也想要剩下的20%。

df.sample(frac=0.8)

您可以使用:

df_sample = df.sample(frac=0.8)

然后:

df_remains = df[~df.index.isin(df_sample.index)]

因为您还安装了 numpy,一个 Pandas 依赖项,您可以这样做:

import numpy as np

p = .8
msk = np.random.rand(len(df)) < p
sample = df[msk]
remains = df[~msk]