R 数据集中行的随机样本
Random Sample of rows from an R dataset
假设我有一个 (90,000 x 17)
的数据集,即 (n x p)
,其中 n
是 number of observations
,p
是 number of variables
,我想从我的整个数据集中随机抽取 20%
行样本如何在 R 中完成?
随机抽取样本后,我将相应地进行聚类分析。
我曾尝试使用其他问题来回答我的问题,但它们没有定论,因为它没有给我我需要的东西。
您可以使用 dplyr
中的 sample_frac
来完成,这里是数据库 iris
的示例
library(dplyr)
#data(iris)
sample20 <- iris %>% sample_frac(0.2)
假设我有一个 (90,000 x 17)
的数据集,即 (n x p)
,其中 n
是 number of observations
,p
是 number of variables
,我想从我的整个数据集中随机抽取 20%
行样本如何在 R 中完成?
随机抽取样本后,我将相应地进行聚类分析。
我曾尝试使用其他问题来回答我的问题,但它们没有定论,因为它没有给我我需要的东西。
您可以使用 dplyr
中的 sample_frac
来完成,这里是数据库 iris
library(dplyr)
#data(iris)
sample20 <- iris %>% sample_frac(0.2)