如何使用 purrr 和 tidyr 修改嵌套数据框中的列类型
How to modify column types in nested data frames using purrr and tidyr
我正在将许多源文件中的数据读入嵌套数据框中。某些列的数据类型不兼容,导致 tidyr::unnest()
函数无法运行。
例如,这是一个基于 iris
数据集的嵌套数据框:
irisnested <- iris %>%
rename_all(tolower) %>%
group_by(species) %>%
nest()
为了重现我的问题,我更改了嵌套数据框的 data
列表列中子数据框之一的列类型:
irisnested$data[[2]]$sepal.length <- as.character(irisnested$data[[2]]$sepal.length)
现在数据框不能再取消嵌套了:
irisnested %>%
unnest(data)
# Error in bind_rows_(x, .id) : Column `sepal.length` can't be converted from numeric to character
为了更正每个嵌套数据框中的列类型,我使用了一个匿名函数:
irisnested %>%
mutate(data = map(data,
function(dtf){
dtf$sepal.length = as.numeric(dtf$sepal.length)
return(dtf)
})) %>%
unnest(data)
现在数据框可以再次取消嵌套了。但是这个匿名函数看起来很复杂,我有直觉,一定有另一种方法可以做到。有没有更好的方法来执行此修改,例如使用 modify_at
?
我们可以使用~
,获取数据为.x
,然后使用mutate
更改感兴趣的列的类型
irisnested %>%
mutate(data = map(data, ~
.x %>%
mutate(sepal.length = as.numeric(sepal.length))))
我正在将许多源文件中的数据读入嵌套数据框中。某些列的数据类型不兼容,导致 tidyr::unnest()
函数无法运行。
例如,这是一个基于 iris
数据集的嵌套数据框:
irisnested <- iris %>%
rename_all(tolower) %>%
group_by(species) %>%
nest()
为了重现我的问题,我更改了嵌套数据框的 data
列表列中子数据框之一的列类型:
irisnested$data[[2]]$sepal.length <- as.character(irisnested$data[[2]]$sepal.length)
现在数据框不能再取消嵌套了:
irisnested %>%
unnest(data)
# Error in bind_rows_(x, .id) : Column `sepal.length` can't be converted from numeric to character
为了更正每个嵌套数据框中的列类型,我使用了一个匿名函数:
irisnested %>%
mutate(data = map(data,
function(dtf){
dtf$sepal.length = as.numeric(dtf$sepal.length)
return(dtf)
})) %>%
unnest(data)
现在数据框可以再次取消嵌套了。但是这个匿名函数看起来很复杂,我有直觉,一定有另一种方法可以做到。有没有更好的方法来执行此修改,例如使用 modify_at
?
我们可以使用~
,获取数据为.x
,然后使用mutate
更改感兴趣的列的类型
irisnested %>%
mutate(data = map(data, ~
.x %>%
mutate(sepal.length = as.numeric(sepal.length))))