根据另一列计算一列出现次数的最佳方法

Question

我有一个包含 4500 个观测值和 12 个变量的数据框。我的数据是这样排列的：第 1 列 (n1) 是一个整数值（可以是这些中的任何一个 - 10,30,70），第 2 列（n2）是一个整数值（可以是这些中的任何一个 - 10,30 ,70)，第 4 列 (mean2) 是另一个整数值（可以是这些-5、-1、0、1、5 中的任何一个）。我想根据另一列的值计算一列的出现次数。例如，我想找到 column4=5 时 column1=10 的次数，然后对 column4 的不同值重复它。然后，我想绘制 column1=10 的图表，x 轴 - column4 值和 y 轴 - colmun1 的出现次数。感谢您的帮助。

dput(head(equal_var_df))
structure(list(n1 = c(10, 30, 70, 10, 30, 70), n2 = c(10, 10, 
10, 30, 30, 30), mean_1 = c(0, 0, 0, 0, 0, 0), mean_2 = c(0, 
0, 0, 0, 0, 0), var_1 = c(1, 1, 1, 1, 1, 1), var_2 = c(1, 1, 
1, 1, 1, 1), tpooled = c(-2.05010551964647, 0.652043624499215, 
1.48215219430884, 0.145893692582399, -0.983505294288748, 0.344138076925374
), pvalue_pooled = c(0.0552094923589302, 0.518297848331878, 0.1423287877924, 
0.884776497768807, 0.329443812298597, 0.731479781532784), result_pooled = c(1, 
1, 1, 1, 1, 1), t_unpooled = c(-2.05010551964647, 0.708471054370747, 
2.17657841099819, 0.127894927531869, -0.983505294288747, 0.346320053469156
), pvalue_unpooled = c(0.0561035624815491, 0.487727231028483, 
0.0438978780734246, 0.900350443079486, 0.329589054416284, 0.730423609249987
), result_unpooled = c(1, 1, 0, 1, 1, 1)), row.names = c(NA, 
-6L), class = c("data.table", "data.frame"), .internal.selfref = <pointer: 0x0000023f500a1ef0>)

Answer 1

require(tidyverse)
df %>%  
  count(n1, n2)

根据另一列计算一列出现次数的最佳方法

Best way to count occurrences of one column based on another column

r

ggplot2

dataframe