来自数据框的随机样本并保留
Random Sample From Data frame and remains
如何在随机 select 数据离子后 select 保留数据帧?
这将给出 80% 的数据。但我也想要剩下的20%。
df.sample(frac=0.8)
您可以使用:
df_sample = df.sample(frac=0.8)
然后:
df_remains = df[~df.index.isin(df_sample.index)]
因为您还安装了 numpy
,一个 Pandas 依赖项,您可以这样做:
import numpy as np
p = .8
msk = np.random.rand(len(df)) < p
sample = df[msk]
remains = df[~msk]
如何在随机 select 数据离子后 select 保留数据帧?
这将给出 80% 的数据。但我也想要剩下的20%。
df.sample(frac=0.8)
您可以使用:
df_sample = df.sample(frac=0.8)
然后:
df_remains = df[~df.index.isin(df_sample.index)]
因为您还安装了 numpy
,一个 Pandas 依赖项,您可以这样做:
import numpy as np
p = .8
msk = np.random.rand(len(df)) < p
sample = df[msk]
remains = df[~msk]