在 R 中替代 dlply
alternative to dlply in R
我的数据框包含以下内容:
data$Value data$Name
774 Name1
770 Name1
778 Name1
804 Name1
804 Name1
802 Name1
804 Name1
900 Name2
905 Name2
805 Name2
900 Name2
950 Name2
860 Name2
870 Name2
etc... etc... for 100 Names
因此,每个名称都有 7 个相关联的值。我想按变量 "Name" 对这个数据框进行分组,将其拆分并将每个名称的 7 个值作为列表返回。这是我想要的输出格式:
my_list$Name1 =
[[1]]
[1] 774 770 778 804 804 802 804
my_list$Name2 =
[[1]]
[1] 900, 905, 805, 900, 950, 860, 870
etc...
最简单的解决方案是使用 plyr 的 dlply
函数:
my_list <- dlply(data, "Name", function(x) list(x$Value))
但是,我想避免使用 plyr。什么是好的选择?我考虑过按以下方式拆分我的数据:
splits <- function(x) {
y <- subset(data, select = c(Name, Value))
splits <- split(y, y$Name)
return(splits)
}
my_list <- splits(data)
但是,这仍然是 returns 我的以下格式的列表:
Value Name
(dbl) (chr)
1 774 Name1
2 770 Name1
3 778 Name1
4 804 Name1
5 804 Name1
6 802 Name1
7 804 Name1
更新:解决方案:
my_list <- lapply(split(data$Value, data$Name), list)
一种方法,
y <- subset(data, select = c(Name, Value))
list <- split(y, y$Name)
unlist(sapply(list, '[', 1))
或
unlist(unname(sapply(list, '[', 1)))
或者干脆(@docendo discimus 的赞美)
unlist(unname(split(y$Value, y$Name)))
关于你的评论,那你可以,
unname(split(y$Value, y$Name))
#[[1]]
#[1] 774 770 778 804 804 802 804
#[[2]]
#[1] 900 905 805 900 950 860 870
我的数据框包含以下内容:
data$Value data$Name
774 Name1
770 Name1
778 Name1
804 Name1
804 Name1
802 Name1
804 Name1
900 Name2
905 Name2
805 Name2
900 Name2
950 Name2
860 Name2
870 Name2
etc... etc... for 100 Names
因此,每个名称都有 7 个相关联的值。我想按变量 "Name" 对这个数据框进行分组,将其拆分并将每个名称的 7 个值作为列表返回。这是我想要的输出格式:
my_list$Name1 =
[[1]]
[1] 774 770 778 804 804 802 804
my_list$Name2 =
[[1]]
[1] 900, 905, 805, 900, 950, 860, 870
etc...
最简单的解决方案是使用 plyr 的 dlply
函数:
my_list <- dlply(data, "Name", function(x) list(x$Value))
但是,我想避免使用 plyr。什么是好的选择?我考虑过按以下方式拆分我的数据:
splits <- function(x) {
y <- subset(data, select = c(Name, Value))
splits <- split(y, y$Name)
return(splits)
}
my_list <- splits(data)
但是,这仍然是 returns 我的以下格式的列表:
Value Name
(dbl) (chr)
1 774 Name1
2 770 Name1
3 778 Name1
4 804 Name1
5 804 Name1
6 802 Name1
7 804 Name1
更新:解决方案:
my_list <- lapply(split(data$Value, data$Name), list)
一种方法,
y <- subset(data, select = c(Name, Value))
list <- split(y, y$Name)
unlist(sapply(list, '[', 1))
或
unlist(unname(sapply(list, '[', 1)))
或者干脆(@docendo discimus 的赞美)
unlist(unname(split(y$Value, y$Name)))
关于你的评论,那你可以,
unname(split(y$Value, y$Name))
#[[1]]
#[1] 774 770 778 804 804 802 804
#[[2]]
#[1] 900 905 805 900 950 860 870