如何对多行使用 prop.table

How to use prop.table for multiple rows

我有一个非常大的数据集(大约 45,000 个 obs。)并且想确定个人为各种类别产生的错误(“1”)和正确操作(“0”)的比例。每行代表一个不同的人,一个人可能出现不止一次。

数据集如下所示:

 Type 1     Type 2   Individual
   1          0          T1
   0          0          T4
   0          1          T5
   0          0          T1
   1          1          T1
   0          1          T1
   1          1          T3

我想使用 prop.table 函数,但我似乎只能为整个数据集或相对于整个数据集的每个人找到错误并纠正操作。到目前为止,我尝试过:

prop.table(table(SourcePop$error)
prop.table(table(SourcePop$error, SourcePop$individual)

我想为每个亲戚找到这些比例 仅对他们自己(即仅查看 T1、T2 等的比例)。我是一个巨大的 R 初学者,所以非常感谢任何帮助。 谢谢

假设列 error 引用示例数据的列 Type 1Type 2,则可以通过指定 margin 参数来计算组或个人的比例。

SourcePop <- read.table(text=" 'Type 1'     'Type 2'   Individual
   1          0          T1
   0          0          T4
   0          1          T5
   0          0          T1
   1          1          T1
   0          1          T1
   1          1          T3", header = TRUE)

prop.table(table(SourcePop$Type.1))
#> 
#>         0         1 
#> 0.5714286 0.4285714

prop.table(table(SourcePop$Type.1, SourcePop$Individual), margin = 2)
#>    
#>      T1  T3  T4  T5
#>   0 0.5 0.0 1.0 1.0
#>   1 0.5 1.0 0.0 0.0
prop.table(table(SourcePop$Type.2, SourcePop$Individual), margin = 2)
#>    
#>      T1  T3  T4  T5
#>   0 0.5 0.0 1.0 0.0
#>   1 0.5 1.0 0.0 1.0

reprex package (v0.3.0)

于 2020 年 3 月 28 日创建