使用 Group_by 创建以值为条件的聚合计数

Question

我有一个数据 table 如下所示：

    serialno state type type2
1       100    FL    A     C
2       100    CA    A     D
3       101    CA    B     D
4       102    GA    A     C
5       103    WA    A     C
6       103    PA    B     C
7       104    CA    B     D
8       104    CA    B     C
9       105    NY    A     D
10      105    NJ    B     C

我需要创建一个新数据 table，该数据由 serialno 聚合，但要计算每种类型现有变量的计数。所以最终结果看起来像这样。

    FL  CA  GA  A   B   C   D
100 1   1       2       1   1
101     1   1       1       1
102             1       1   
103 1       1   1   1   2   
104     2           2   1   1
105 1   1       1   1   1   1

我确定有一个使用 group_by 和 summarize 的某种组合的解决方案，但我一直无法弄清楚。最简单的解决方案是先创建 state、type 和 type2 列，然后使用汇总创建计数吗？

Answer 1

使用：

library(reshape2)
recast(dat, serialno ~ value, id.var = 'serialno', fun.aggregate = length)

给出：

  serialno A B C CA D FL GA NJ NY PA WA
1      100 2 0 1  1 1  1  0  0  0  0  0
2      101 0 1 0  1 1  0  0  0  0  0  0
3      102 1 0 1  0 0  0  1  0  0  0  0
4      103 1 1 2  0 0  0  0  0  0  1  1
5      104 0 2 1  2 1  0  0  0  0  0  0
6      105 1 1 1  0 1  0  0  1  1  0  0

或者：

library(dplyr)
library(tidyr)
dat %>% 
  gather(key, val, state:type2) %>% 
  group_by(serialno, val) %>% 
  tally() %>% 
  spread(val, n, fill = 0)

或者：

library(data.table)
dcast(melt(setDT(dat), id = 1), serialno ~ value, fun.aggregate = length)

或者（根据@Frank 的建议）：

res <- table(melt(dat, id="serialno")[, c("serialno","value")])
print(res, zero.print="")

其中最后一个结果：

        value
serialno A B C CA D FL GA NJ NY PA WA
     100 2   1  1 1  1               
     101   1    1 1                  
     102 1   1          1            
     103 1 1 2                   1  1
     104   2 1  2 1                  
     105 1 1 1    1        1  1

使用 Group_by 创建以值为条件的聚合计数

Using Group_by create aggregated counts conditional on value

r

dplyr

tidyr