根据另一列计算一列出现次数的最佳方法
Best way to count occurrences of one column based on another column
我有一个包含 4500 个观测值和 12 个变量的数据框。我的数据是这样排列的:第 1 列 (n1) 是一个整数值(可以是这些中的任何一个 - 10,30,70),第 2 列(n2)是一个整数值(可以是这些中的任何一个 - 10,30 ,70),第 4 列 (mean2) 是另一个整数值(可以是这些-5、-1、0、1、5 中的任何一个)。我想根据另一列的值计算一列的出现次数。例如,我想找到 column4=5 时 column1=10 的次数,然后对 column4 的不同值重复它。然后,我想绘制 column1=10 的图表,x 轴 - column4 值和 y 轴 - colmun1 的出现次数。感谢您的帮助。
dput(head(equal_var_df))
structure(list(n1 = c(10, 30, 70, 10, 30, 70), n2 = c(10, 10,
10, 30, 30, 30), mean_1 = c(0, 0, 0, 0, 0, 0), mean_2 = c(0,
0, 0, 0, 0, 0), var_1 = c(1, 1, 1, 1, 1, 1), var_2 = c(1, 1,
1, 1, 1, 1), tpooled = c(-2.05010551964647, 0.652043624499215,
1.48215219430884, 0.145893692582399, -0.983505294288748, 0.344138076925374
), pvalue_pooled = c(0.0552094923589302, 0.518297848331878, 0.1423287877924,
0.884776497768807, 0.329443812298597, 0.731479781532784), result_pooled = c(1,
1, 1, 1, 1, 1), t_unpooled = c(-2.05010551964647, 0.708471054370747,
2.17657841099819, 0.127894927531869, -0.983505294288747, 0.346320053469156
), pvalue_unpooled = c(0.0561035624815491, 0.487727231028483,
0.0438978780734246, 0.900350443079486, 0.329589054416284, 0.730423609249987
), result_unpooled = c(1, 1, 0, 1, 1, 1)), row.names = c(NA,
-6L), class = c("data.table", "data.frame"), .internal.selfref = <pointer: 0x0000023f500a1ef0>)
require(tidyverse)
df %>%
count(n1, n2)
我有一个包含 4500 个观测值和 12 个变量的数据框。我的数据是这样排列的:第 1 列 (n1) 是一个整数值(可以是这些中的任何一个 - 10,30,70),第 2 列(n2)是一个整数值(可以是这些中的任何一个 - 10,30 ,70),第 4 列 (mean2) 是另一个整数值(可以是这些-5、-1、0、1、5 中的任何一个)。我想根据另一列的值计算一列的出现次数。例如,我想找到 column4=5 时 column1=10 的次数,然后对 column4 的不同值重复它。然后,我想绘制 column1=10 的图表,x 轴 - column4 值和 y 轴 - colmun1 的出现次数。感谢您的帮助。
dput(head(equal_var_df))
structure(list(n1 = c(10, 30, 70, 10, 30, 70), n2 = c(10, 10,
10, 30, 30, 30), mean_1 = c(0, 0, 0, 0, 0, 0), mean_2 = c(0,
0, 0, 0, 0, 0), var_1 = c(1, 1, 1, 1, 1, 1), var_2 = c(1, 1,
1, 1, 1, 1), tpooled = c(-2.05010551964647, 0.652043624499215,
1.48215219430884, 0.145893692582399, -0.983505294288748, 0.344138076925374
), pvalue_pooled = c(0.0552094923589302, 0.518297848331878, 0.1423287877924,
0.884776497768807, 0.329443812298597, 0.731479781532784), result_pooled = c(1,
1, 1, 1, 1, 1), t_unpooled = c(-2.05010551964647, 0.708471054370747,
2.17657841099819, 0.127894927531869, -0.983505294288747, 0.346320053469156
), pvalue_unpooled = c(0.0561035624815491, 0.487727231028483,
0.0438978780734246, 0.900350443079486, 0.329589054416284, 0.730423609249987
), result_unpooled = c(1, 1, 0, 1, 1, 1)), row.names = c(NA,
-6L), class = c("data.table", "data.frame"), .internal.selfref = <pointer: 0x0000023f500a1ef0>)
require(tidyverse)
df %>%
count(n1, n2)