计算 R 中的分组缺失值
counting grouped missing values in R
抱歉,如果这个问题很简单
我是 R 的新手,我想按组计算 some_column
列中缺失值的数量,这些缺失值在我的数据集中被 0
值替换,然后获取该组其最大值为 0
个值。这样做也是如此(使用包dplyr
):
missing_data <- group_by(some_data,some_group, count=sum(some_column==0))
但奇怪的是,我在 count
列中得到了整个数据集的相同数字,就好像数据集没有分组一样。有人有想法
好的我知道了
missing_data %>% group_by(some_group) %>% 总结(count=sum(some_column==0))
与dplyr
个动词保持一致:
missing_data <- filter(some_data, some_column == 0) %>%
group_by(some_group) %>%
summarise(count = n()) %>%
arrange(desc(count))
这里是一个使用 mtcars 数据帧的例子
count_zero<-function(x){
sum(x==0,na.rm=TRUE)
}
aggregate(mtcars,list(cyl=(mtcars$cyl)),count_zero)
终于有了答案
missing_data %>% group_by(some_group) %>% summarise(count=sum(some_column==0)) %>% arrange(desc(count))
抱歉,如果这个问题很简单
我是 R 的新手,我想按组计算 some_column
列中缺失值的数量,这些缺失值在我的数据集中被 0
值替换,然后获取该组其最大值为 0
个值。这样做也是如此(使用包dplyr
):
missing_data <- group_by(some_data,some_group, count=sum(some_column==0))
但奇怪的是,我在 count
列中得到了整个数据集的相同数字,就好像数据集没有分组一样。有人有想法
好的我知道了
missing_data %>% group_by(some_group) %>% 总结(count=sum(some_column==0))
与dplyr
个动词保持一致:
missing_data <- filter(some_data, some_column == 0) %>%
group_by(some_group) %>%
summarise(count = n()) %>%
arrange(desc(count))
这里是一个使用 mtcars 数据帧的例子
count_zero<-function(x){
sum(x==0,na.rm=TRUE)
}
aggregate(mtcars,list(cyl=(mtcars$cyl)),count_zero)
终于有了答案
missing_data %>% group_by(some_group) %>% summarise(count=sum(some_column==0)) %>% arrange(desc(count))