计算 R 中的分组缺失值

Question

抱歉，如果这个问题很简单

我是 R 的新手，我想按组计算 some_column 列中缺失值的数量，这些缺失值在我的数据集中被 0 值替换，然后获取该组其最大值为 0 个值。这样做也是如此（使用包dplyr）：

missing_data <- group_by(some_data,some_group, count=sum(some_column==0))

但奇怪的是，我在 count 列中得到了整个数据集的相同数字，就好像数据集没有分组一样。有人有想法

好的我知道了

missing_data %>% group_by(some_group) %>% 总结(count=sum(some_column==0))

Answer 1

与dplyr个动词保持一致：

missing_data <- filter(some_data, some_column == 0) %>%
  group_by(some_group) %>%       
  summarise(count = n()) %>%
  arrange(desc(count))

Answer 2

这里是一个使用 mtcars 数据帧的例子

count_zero<-function(x){
  sum(x==0,na.rm=TRUE)
}
aggregate(mtcars,list(cyl=(mtcars$cyl)),count_zero)

Answer 3

终于有了答案

missing_data %>% group_by(some_group) %>% summarise(count=sum(some_column==0)) %>% arrange(desc(count))

counting grouped missing values in R