将行合并为一行，其中包含多列数据 R

Question

我有一个数据集可以测量体重前和 post 的情况。我试图将具有相似 ID 的行合并为一行，并创建另外两个列来显示每个 ID 的 pre 和 post 的结果。

原版table


ID  Sex         Race        TIME    SH           PRE_WEIGHT POST_WEIGHT
1   FEMALE      White       POST    Poor         168            152
1   FEMALE      White       PRE     Good         168            152
2   MALE        Hispanic    POST    Very Poor    157            143
2   MALE        Hispanic    PRE     Poor         157            143
3   FEMALE      Black       POST    Good         129            118
3   FEMALE      Black       PRE     Satisfactory 129            118

结果应如下所示：


ID  Sex         Race        TIME    SH          PRE_WEIGHT  POST_WEIGHT TIME_PRE    TIME_POST   SH_PRE      SH_POST
1   FEMALE      White       POST    Poor        168         152         POST        PRE         Poor        Good
2   MALE        Hispanic    POST    Very Poor   157         143         POST        PRE         Very Poor   Poor
3   FEMALE      Black       POST    Good        129         118         POST        PRE         Good        Satisfactor

我试着用 reshape 来做，但速度很慢而且没有用。我也无法使用 tidyr 重塑 table。

希望有人能帮助我。

Answer 1

正如@Duck 提到的，你可以做到这一点

library(dplyr)
library(tidyr)

df3 %>% 
   group_by(ID) %>% 
   pivot_wider(names_from = TIME, 
               values_from = SH, 
               names_prefix = "SH_")

#> # A tibble: 3 x 7
#> # Groups:   ID [3]
#>      ID Sex    Race     PRE_WEIGHT POST_WEIGHT SH_POST   SH_PRE      
#>   <dbl> <chr>  <chr>         <dbl>       <dbl> <chr>     <chr>       
#> 1     1 FEMALE White           168         152 Poor      Good        
#> 2     2 MALE   Hispanic        157         143 Very Poor Poor        
#> 3     3 FEMALE Black           129         118 Good      Satisfactory

您的数据

df3 <- readr::read_table("
ID  Sex         Race        TIME    SH           PRE_WEIGHT POST_WEIGHT
1   FEMALE      White       POST    Poor         168            152
1   FEMALE      White       PRE     Good         168            152
2   MALE        Hispanic    POST    Very Poor    157            143
2   MALE        Hispanic    PRE     Poor         157            143
3   FEMALE      Black       POST    Good         129            118
3   FEMALE      Black       PRE     Satisfactory 129            118")

Answer 2

选项data.table

library(data.table)
dcast(setDT(df1), ID + Sex + Race  + PRE_WEIGHT + 
           POST_WEIGHT ~ TIME, value.var = 'SH')

-输出

#   ID    Sex     Race PRE_WEIGHT POST_WEIGHT      POST          PRE
#1:  1 FEMALE    White        168         152      Poor         Good
2#:  2   MALE Hispanic        157         143 Very Poor         Poor
3#:  3 FEMALE    Black        129         118      Good Satisfactory

Answer 3

一个简单的基础 R 选项可能正在使用 reshape，例如，

reshape(
  df,
  direction = "wide",
  idvar = c("ID","Sex","Race"),
  timevar = "TIME"
)

这给出了

  ID    Sex     Race   SH.POST PRE_WEIGHT.POST POST_WEIGHT.POST       SH.PRE
1  1 FEMALE    White      Poor             168              152         Good
3  2   MALE Hispanic Very Poor             157              143         Poor
5  3 FEMALE    Black      Good             129              118 Satisfactory
  PRE_WEIGHT.PRE POST_WEIGHT.PRE
1            168             152
3            157             143
5            129             118

数据

> dput(df)
structure(list(ID = c(1L, 1L, 2L, 2L, 3L, 3L), Sex = c("FEMALE", 
"FEMALE", "MALE", "MALE", "FEMALE", "FEMALE"), Race = c("White",
"White", "Hispanic", "Hispanic", "Black", "Black"), TIME = c("POST", 
"PRE", "POST", "PRE", "POST", "PRE"), SH = c("Poor", "Good",
"Very Poor", "Poor", "Good", "Satisfactory"), PRE_WEIGHT = c(168L,
168L, 157L, 157L, 129L, 129L), POST_WEIGHT = c(152L, 152L, 143L,
143L, 118L, 118L)), class = "data.frame", row.names = c(NA, -6L
))

将行合并为一行，其中包含多列数据 R

Combining rows into one row with multiple columns of data R

r

reshape

tidyr