如何使用 dplyr 等 Tidyverse 工具跳过顶部 header 和底部 header？

Question

我想学习跳过 tidyverse 工具中的顶部 header 和底部 header。

aaaaaaaaaaaaaaaaaaa aaaaaaaaaa aaaaaaa aaaaaaaaaaaa aaaaa aaaaaaaaaaaaaaaaa;;;
aaaaaaaaaaaaaaa;;;
;aaaaa(%);;
;aaaaaaaaaa;aaaaaaaaaaaaa;

 aa/33;3.3;3.3;
 a/33;3.3;3.3;
aa/33;3.3;33.3;
 a/33;3.3;33.3;
 aa/33;3.3;33.3;
 a/33;3.3;33.3;
aaaaaaa aaaaaaaa aa
aaaaaaa: %
aaaaa: aaaaaaaaa aaaaaa aaaaaaa / aaaaaaa aaaaaaaa aa;;;

开头有 5 行长顶部 header，而结尾有 3 行底部长 header。

如何使用 R 中的 Tidyverse 工具跳过它们？

Answer 1

我们可以使用 read_delim

library(readr)
df1 <- read_delim("fileN.csv", skip=5, n_max = 6, delim= ";", col_names = FALSE)

末尾多了一个;。所以，要么早点删除它，要么之后删除 NA 列

Filter(function(x) !all(is.na(x)), df1)
# A tibble: 6 x 3
#     X1    X2    X3
#   <chr> <dbl> <dbl>
#1  aa/33   3.3   3.3
#2   a/33   3.3   3.3
#3  aa/33   3.3  33.3
#4   a/33   3.3  33.3
#5  aa/33   3.3  33.3
#6   a/33   3.3  33.3

为了让它更有活力，我们可以从 count.fields

指定 n_max

df1 <- read_delim("fileN.csv", skip=5, n_max = length(count.fields("fileN.csv"))-(5+2),
                           delim= ";", col_names = FALSE)

如何使用 dplyr 等 Tidyverse 工具跳过顶部 header 和底部 header？

How to skip top header and bottom header with Tidyverse tools such as dplyr?

r

dplyr

tidyverse