计算大 R 数据集中的夫妇数
count number couples in big R dataset
我有一个 4049x30 的数据集,每个单元格都有一个数字或 NA。
我需要计算每行出现多少次某些数字。
即
m<-matrix(c(1, 2, 3,
1, 5, 6,
3, 5, 6,
2, 3, 7), ncol=3, byrow = TRUE)
我有 (2,3) 两次和 (5,6) 两次
非常感谢您的帮助
m_tbl <- table(paste(m[,-ncol(m)], m[,-1], sep = ','))
m_tbl[m_tbl > 1]
# 2,3 5,6
# 2 2
m_tbl <- table(m[,-ncol(m)], m[,-1])
subset(as.data.frame(m_tbl), Freq > 1)
# Var1 Var2 Freq
# 6 2 3 2
# 16 5 6 2
library(data.table)
m_dt <- data.table(c(m[,-ncol(m)]), c(m[,-1]))
m_dt[, .N, V1:V2][N > 1]
# v1 v2 N
# 1: 2 3 2
# 2: 5 6 2
我们也可以
library(dplyr)
library(stringr)
tibble(col1 = str_c(m[, -ncol(m)], m[, -1])) %>%
count(col1) %>%
filter(n > 1)
我有一个 4049x30 的数据集,每个单元格都有一个数字或 NA。 我需要计算每行出现多少次某些数字。 即
m<-matrix(c(1, 2, 3,
1, 5, 6,
3, 5, 6,
2, 3, 7), ncol=3, byrow = TRUE)
我有 (2,3) 两次和 (5,6) 两次
非常感谢您的帮助
m_tbl <- table(paste(m[,-ncol(m)], m[,-1], sep = ','))
m_tbl[m_tbl > 1]
# 2,3 5,6
# 2 2
m_tbl <- table(m[,-ncol(m)], m[,-1])
subset(as.data.frame(m_tbl), Freq > 1)
# Var1 Var2 Freq
# 6 2 3 2
# 16 5 6 2
library(data.table)
m_dt <- data.table(c(m[,-ncol(m)]), c(m[,-1]))
m_dt[, .N, V1:V2][N > 1]
# v1 v2 N
# 1: 2 3 2
# 2: 5 6 2
我们也可以
library(dplyr)
library(stringr)
tibble(col1 = str_c(m[, -ncol(m)], m[, -1])) %>%
count(col1) %>%
filter(n > 1)