查找矩阵中向量元素的频率

Find frequency of vector elements in a matrix

我在 R 中有一个矩阵,这里是一个小例子:

set.seed(1)
n.columns<-6
mat <- matrix(, nrow = 5, ncol = n.columns)
for(column in 1:n.columns){
  mat[, column] <- sample(1:10,5)
}
mat

矩阵如下所示:

     [,1] [,2] [,3] [,4] [,5] [,6]
[1,]    3    9    3    5   10    4
[2,]    4   10    2    7    2    1
[3,]    5    6    6    8    6   10
[4,]    7    5   10    3    1    7
[5,]    2    1    5   10    9    3

我还有一个整数向量 vv<-c(1,3,6),其元素理论上可​​以出现在上面的矩阵 mat 中。

我正在寻找的是 v 中的每个元素出现在 mat 中的次数的概述 每列 。对于当前示例,此概述是

1: 0 1 0 0 1 1
3: 1 0 1 1 0 1
6: 0 1 1 0 1 0

使用 for 循环和 if 语句来实现这一点相当简单,但这个解决方案不是很漂亮。

有专业的方法吗?

一个选项使用sapply

t(sapply(v, function(a) colSums(mat==a)))

#     [,1] [,2] [,3] [,4] [,5] [,6]
#[1,]    0    1    0    0    1    1
#[2,]    1    0    1    1    0    1
#[3,]    0    1    1    0    1    0

使用table

table(mat[mat %in% v], col(mat)[mat %in% v])

#   1 2 3 4 5 6
# 1 0 1 0 0 1 1
# 3 1 0 1 1 0 1
# 6 0 1 1 0 1 0

缺点是所有值不在 v 中的列将不会被报告。

在 data.frame 上使用 sapply 迭代列。

setNames(object = as.data.frame(sapply(v, function(a)
         sapply(as.data.frame(mat), function(b)
                             sum(a %in% b)))), nm = v)
#   1 3 6
#V1 0 1 0
#V2 1 0 1
#V3 0 1 1
#V4 0 1 0
#V5 1 0 1
#V6 1 1 0