R中的数值频率计数
Numerical frequency counts in R
我有一个大数据框(100 列和约 250,000 个观察值),我试图同时获取其中数值的频率计数和每个变量的 NA。我曾尝试使用 table
但数据对于该函数来说太大了。关于如何获得这些计数的任何建议?数据仅包含 NA 和数字 1 到 5,因此例如数据的一小部分是:
i1 i2 i3 i4 i5 i6 i7 i8
5 4 3 NA 3 4 3 NA
4 3 2 5 4 3 5 NA
谢谢!
我创建了一个包含 5 列和 250,000 行的数据框,每列都是从向量 c(1:5,NA)
中抽取的样本。我像这样使用应用函数没有问题:
new_df <- apply(df,2,table)
我假设您希望按列分解频率。如果你真的想要整个数据帧的频率,你可以在列上执行提到的应用函数,然后另一个应用函数对行求和,如下所示:
apply(new_df,1,sum)
我的结果是这样的
1 2 3 4 5
167025 166677 166471 166849 166541
我有一个大数据框(100 列和约 250,000 个观察值),我试图同时获取其中数值的频率计数和每个变量的 NA。我曾尝试使用 table
但数据对于该函数来说太大了。关于如何获得这些计数的任何建议?数据仅包含 NA 和数字 1 到 5,因此例如数据的一小部分是:
i1 i2 i3 i4 i5 i6 i7 i8
5 4 3 NA 3 4 3 NA
4 3 2 5 4 3 5 NA
谢谢!
我创建了一个包含 5 列和 250,000 行的数据框,每列都是从向量 c(1:5,NA)
中抽取的样本。我像这样使用应用函数没有问题:
new_df <- apply(df,2,table)
我假设您希望按列分解频率。如果你真的想要整个数据帧的频率,你可以在列上执行提到的应用函数,然后另一个应用函数对行求和,如下所示:
apply(new_df,1,sum)
我的结果是这样的
1 2 3 4 5
167025 166677 166471 166849 166541