如何将数据分成 R 中每行的训练集(和测试集)?

How to split data into train set (and test set) every nrows in R?

我遇到了一个分类问题,我有一个包含 308.500 条数据的巨大数据集。我想将这些数据拆分成训练集和测试集以创建模型。

但是我希望训练数据每隔 nrows 对 DATASET 进行采样,例如每 1.000 行,所以我知道训练集将由所有 DATASET 的行构建。有办法吗?

例如我想要这样的东西:

train = DATASET[take sample every 1000 rows]

您可以使用 seq 创建要子集化的行索引。

train_inds <- seq(1, nrow(DATASET), 1000)
train <- DATASET[train_inds, ]
test <- DATASET[-train_inds, ]