计算 R 中的分组缺失值

counting grouped missing values in R

抱歉,如果这个问题很简单

我是 R 的新手,我想按组计算 some_column 列中缺失值的数量,这些缺失值在我的数据集中被 0 值替换,然后获取该组其最大值为 0 个值。这样做也是如此(使用包dplyr):

missing_data <- group_by(some_data,some_group, count=sum(some_column==0))

但奇怪的是,我在 count 列中得到了整个数据集的相同数字,就好像数据集没有分组一样。有人有想法

好的我知道了

missing_data %>% group_by(some_group) %>% 总结(count=sum(some_column==0))

dplyr个动词保持一致:

missing_data <- filter(some_data, some_column == 0) %>%
  group_by(some_group) %>%       
  summarise(count = n()) %>%
  arrange(desc(count))

这里是一个使用 mtcars 数据帧的例子

count_zero<-function(x){
  sum(x==0,na.rm=TRUE)
}
aggregate(mtcars,list(cyl=(mtcars$cyl)),count_zero)

终于有了答案

missing_data %>% group_by(some_group) %>% summarise(count=sum(some_column==0)) %>% arrange(desc(count))