如何使用 dplyr 等 Tidyverse 工具跳过顶部 header 和底部 header?
How to skip top header and bottom header with Tidyverse tools such as dplyr?
我想学习跳过 tidyverse 工具中的顶部 header 和底部 header。
aaaaaaaaaaaaaaaaaaa aaaaaaaaaa aaaaaaa aaaaaaaaaaaa aaaaa aaaaaaaaaaaaaaaaa;;;
aaaaaaaaaaaaaaa;;;
;aaaaa(%);;
;aaaaaaaaaa;aaaaaaaaaaaaa;
aa/33;3.3;3.3;
a/33;3.3;3.3;
aa/33;3.3;33.3;
a/33;3.3;33.3;
aa/33;3.3;33.3;
a/33;3.3;33.3;
aaaaaaa aaaaaaaa aa
aaaaaaa: %
aaaaa: aaaaaaaaa aaaaaa aaaaaaa / aaaaaaa aaaaaaaa aa;;;
开头有 5 行长顶部 header,而结尾有 3 行底部长 header。
如何使用 R 中的 Tidyverse 工具跳过它们?
我们可以使用 read_delim
library(readr)
df1 <- read_delim("fileN.csv", skip=5, n_max = 6, delim= ";", col_names = FALSE)
末尾多了一个;
。所以,要么早点删除它,要么之后删除 NA 列
Filter(function(x) !all(is.na(x)), df1)
# A tibble: 6 x 3
# X1 X2 X3
# <chr> <dbl> <dbl>
#1 aa/33 3.3 3.3
#2 a/33 3.3 3.3
#3 aa/33 3.3 33.3
#4 a/33 3.3 33.3
#5 aa/33 3.3 33.3
#6 a/33 3.3 33.3
为了让它更有活力,我们可以从 count.fields
指定 n_max
df1 <- read_delim("fileN.csv", skip=5, n_max = length(count.fields("fileN.csv"))-(5+2),
delim= ";", col_names = FALSE)
我想学习跳过 tidyverse 工具中的顶部 header 和底部 header。
aaaaaaaaaaaaaaaaaaa aaaaaaaaaa aaaaaaa aaaaaaaaaaaa aaaaa aaaaaaaaaaaaaaaaa;;;
aaaaaaaaaaaaaaa;;;
;aaaaa(%);;
;aaaaaaaaaa;aaaaaaaaaaaaa;
aa/33;3.3;3.3;
a/33;3.3;3.3;
aa/33;3.3;33.3;
a/33;3.3;33.3;
aa/33;3.3;33.3;
a/33;3.3;33.3;
aaaaaaa aaaaaaaa aa
aaaaaaa: %
aaaaa: aaaaaaaaa aaaaaa aaaaaaa / aaaaaaa aaaaaaaa aa;;;
开头有 5 行长顶部 header,而结尾有 3 行底部长 header。
如何使用 R 中的 Tidyverse 工具跳过它们?
我们可以使用 read_delim
library(readr)
df1 <- read_delim("fileN.csv", skip=5, n_max = 6, delim= ";", col_names = FALSE)
末尾多了一个;
。所以,要么早点删除它,要么之后删除 NA 列
Filter(function(x) !all(is.na(x)), df1)
# A tibble: 6 x 3
# X1 X2 X3
# <chr> <dbl> <dbl>
#1 aa/33 3.3 3.3
#2 a/33 3.3 3.3
#3 aa/33 3.3 33.3
#4 a/33 3.3 33.3
#5 aa/33 3.3 33.3
#6 a/33 3.3 33.3
为了让它更有活力,我们可以从 count.fields
n_max
df1 <- read_delim("fileN.csv", skip=5, n_max = length(count.fields("fileN.csv"))-(5+2),
delim= ";", col_names = FALSE)