两层纵向数据:如何重塑?
Two levels of longitudinal data: how to reshape?
我有一个数据集,其中包含每个受试者的海马体积的多个时间点。每个海马体积都有左右测量值。我现在想纵向比较左右变化。我知道如何为时间点重塑我的数据,但我不知道如何将 "side" 的级别添加到它。
这是我的可重现数据集:
mydata <- data.frame(SID=sample(1:150,400, replace=TRUE), hippLeft_T1=sample(6000:8000,400,replace=TRUE), hippRight_T1=sample(6000:8000,400,replace=TRUE),hippLeft_T2=sample(6000:8000,400,replace=TRUE), hippRight_T2=sample(6000:8000,400,replace=TRUE),hippLeft_T3=sample(6000:8000,400,replace=TRUE), hippRight_T3=sample(6000:8000,400,replace=TRUE))
这就是我将如何纵向重塑它:
long <- reshape(mydata, direction="long", varying=list(c(2,4,6),c(3,5,7)),idvar="SID", timevar="time", v.names=c("HippLeft","HippRight"), times=c("time1","time2","time3"))
我应该应用两次重塑以获得左右的水平吗?还是有另一种方法可以做到这一点?谢谢!
**我想要得到的是以下内容:
一种方法是结合使用 unite
、gather
和 separate
来自 tidyr
:
library(tidyr)
long <- mydata %>% unite("times1", hippLeft_T1,hippRight_T1) %>%
unite("times2", hippLeft_T2,hippRight_T2) %>%
unite("times3", hippLeft_T3,hippRight_T3) %>%
gather("times","Hipp",times1:times3) %>%
separate(Hipp,c("Left","Right")) %>%
gather("Side","Hipp",Left:Right)
备注:
- 首先
unite
每次 T1
、T2
和 T3
的左右列,并将这些列命名为 times1
、times2
,以及 times3
- 然后,
gather
这三列分别命名键列times
和值列Hipp
separate
将 Hipp
列变为 Left
和 Right
gather
Left
和 Right
列命名键列 Side
和值列 Hipp
实际上,更好的方法是通过首先合并时间来反转两个 gather
操作:
library(tidyr)
long <- mydata %>% unite("Left", hippLeft_T1,hippLeft_T2,hippLeft_T3) %>%
unite("Right", hippRight_T1,hippRight_T2,hippRight_T3) %>%
gather("Side","Hipp",Left:Right) %>%
separate(Hipp,c("times1","times2","times3")) %>%
gather("times","Hipp",times1:times3)
仅调用一次 gather
的第三种方法是:
library(dplyr)
library(tidyr)
long <- mydata %>% gather("Side","Hipp",-SID) %>%
mutate(times=paste0("times",sub(".*(\d)$","\1",Side)),
Side=sub("^hipp([A-z]+)_T.*","\1",Side)) %>%
select(SID,Side,times,Hipp)
此处,gather
中的键列 Side
具有原始 mydata
列名称的值。我们使用 deployer::mutate
创建名为 times
的该列的副本。然后我们使用 sub
和一些正则表达式来提取 times
值的最后一位数字,并提取 Left
或 Right
作为 Side
值。
设置种子为123
,你的数据是:
set.seed(123)
mydata <- data.frame(SID=sample(1:150,400, replace=TRUE), hippLeft_T1=sample(6000:8000,400,replace=TRUE), hippRight_T1=sample(6000:8000,400,replace=TRUE),hippLeft_T2=sample(6000:8000,400,replace=TRUE), hippRight_T2=sample(6000:8000,400,replace=TRUE),hippLeft_T3=sample(6000:8000,400,replace=TRUE), hippRight_T3=sample(6000:8000,400,replace=TRUE))
head(mydata)
## SID hippLeft_T1 hippRight_T1 hippLeft_T2 hippRight_T2 hippLeft_T3 hippRight_T3
##1 44 7973 6941 7718 7279 6319 7465
##2 119 6274 6732 7775 6249 6289 7220
##3 62 7811 6242 6978 6510 6298 6448
##4 133 7153 6094 7436 7641 7029 7833
##5 142 6791 6525 6973 7608 6986 7606
##6 7 6900 7938 7978 6091 7233 6625
使用第二种或第三种方法的结果是:
print(long)
## SID Side times Hipp
## 1 44 Left times1 7973
## 2 119 Left times1 6274
## 3 62 Left times1 7811
## 4 133 Left times1 7153
## 5 142 Left times1 6791
## 6 7 Left times1 6900
## ...
## 401 44 Right times1 6941
## 402 119 Right times1 6732
## 403 62 Right times1 6242
## 404 133 Right times1 6094
## 405 142 Right times1 6525
## 406 7 Right times1 7938
## ...
## 801 44 Left times2 7718
## 802 119 Left times2 7775
## 803 62 Left times2 6978
## 804 133 Left times2 7436
## 805 142 Left times2 6973
## 806 7 Left times2 7978
## ...
##1201 44 Right times2 7279
##1202 119 Right times2 6249
##1203 62 Right times2 6510
##1204 133 Right times2 7641
##1205 142 Right times2 7608
##1206 7 Right times2 6091
## ...
##1601 44 Left times3 6319
##1602 119 Left times3 6289
##1603 62 Left times3 6298
##1604 133 Left times3 7029
##1605 142 Left times3 6986
##1606 7 Left times3 7233
## ...
##2001 44 Right times3 7465
##2002 119 Right times3 7220
##2003 62 Right times3 6448
##2004 133 Right times3 7833
##2005 142 Right times3 7606
##2006 7 Right times3 6625
我有一个数据集,其中包含每个受试者的海马体积的多个时间点。每个海马体积都有左右测量值。我现在想纵向比较左右变化。我知道如何为时间点重塑我的数据,但我不知道如何将 "side" 的级别添加到它。
这是我的可重现数据集:
mydata <- data.frame(SID=sample(1:150,400, replace=TRUE), hippLeft_T1=sample(6000:8000,400,replace=TRUE), hippRight_T1=sample(6000:8000,400,replace=TRUE),hippLeft_T2=sample(6000:8000,400,replace=TRUE), hippRight_T2=sample(6000:8000,400,replace=TRUE),hippLeft_T3=sample(6000:8000,400,replace=TRUE), hippRight_T3=sample(6000:8000,400,replace=TRUE))
这就是我将如何纵向重塑它:
long <- reshape(mydata, direction="long", varying=list(c(2,4,6),c(3,5,7)),idvar="SID", timevar="time", v.names=c("HippLeft","HippRight"), times=c("time1","time2","time3"))
我应该应用两次重塑以获得左右的水平吗?还是有另一种方法可以做到这一点?谢谢!
**我想要得到的是以下内容:
一种方法是结合使用 unite
、gather
和 separate
来自 tidyr
:
library(tidyr)
long <- mydata %>% unite("times1", hippLeft_T1,hippRight_T1) %>%
unite("times2", hippLeft_T2,hippRight_T2) %>%
unite("times3", hippLeft_T3,hippRight_T3) %>%
gather("times","Hipp",times1:times3) %>%
separate(Hipp,c("Left","Right")) %>%
gather("Side","Hipp",Left:Right)
备注:
- 首先
unite
每次T1
、T2
和T3
的左右列,并将这些列命名为times1
、times2
,以及times3
- 然后,
gather
这三列分别命名键列times
和值列Hipp
separate
将Hipp
列变为Left
和Right
gather
Left
和Right
列命名键列Side
和值列Hipp
实际上,更好的方法是通过首先合并时间来反转两个 gather
操作:
library(tidyr)
long <- mydata %>% unite("Left", hippLeft_T1,hippLeft_T2,hippLeft_T3) %>%
unite("Right", hippRight_T1,hippRight_T2,hippRight_T3) %>%
gather("Side","Hipp",Left:Right) %>%
separate(Hipp,c("times1","times2","times3")) %>%
gather("times","Hipp",times1:times3)
仅调用一次 gather
的第三种方法是:
library(dplyr)
library(tidyr)
long <- mydata %>% gather("Side","Hipp",-SID) %>%
mutate(times=paste0("times",sub(".*(\d)$","\1",Side)),
Side=sub("^hipp([A-z]+)_T.*","\1",Side)) %>%
select(SID,Side,times,Hipp)
此处,gather
中的键列 Side
具有原始 mydata
列名称的值。我们使用 deployer::mutate
创建名为 times
的该列的副本。然后我们使用 sub
和一些正则表达式来提取 times
值的最后一位数字,并提取 Left
或 Right
作为 Side
值。
设置种子为123
,你的数据是:
set.seed(123)
mydata <- data.frame(SID=sample(1:150,400, replace=TRUE), hippLeft_T1=sample(6000:8000,400,replace=TRUE), hippRight_T1=sample(6000:8000,400,replace=TRUE),hippLeft_T2=sample(6000:8000,400,replace=TRUE), hippRight_T2=sample(6000:8000,400,replace=TRUE),hippLeft_T3=sample(6000:8000,400,replace=TRUE), hippRight_T3=sample(6000:8000,400,replace=TRUE))
head(mydata)
## SID hippLeft_T1 hippRight_T1 hippLeft_T2 hippRight_T2 hippLeft_T3 hippRight_T3
##1 44 7973 6941 7718 7279 6319 7465
##2 119 6274 6732 7775 6249 6289 7220
##3 62 7811 6242 6978 6510 6298 6448
##4 133 7153 6094 7436 7641 7029 7833
##5 142 6791 6525 6973 7608 6986 7606
##6 7 6900 7938 7978 6091 7233 6625
使用第二种或第三种方法的结果是:
print(long)
## SID Side times Hipp
## 1 44 Left times1 7973
## 2 119 Left times1 6274
## 3 62 Left times1 7811
## 4 133 Left times1 7153
## 5 142 Left times1 6791
## 6 7 Left times1 6900
## ...
## 401 44 Right times1 6941
## 402 119 Right times1 6732
## 403 62 Right times1 6242
## 404 133 Right times1 6094
## 405 142 Right times1 6525
## 406 7 Right times1 7938
## ...
## 801 44 Left times2 7718
## 802 119 Left times2 7775
## 803 62 Left times2 6978
## 804 133 Left times2 7436
## 805 142 Left times2 6973
## 806 7 Left times2 7978
## ...
##1201 44 Right times2 7279
##1202 119 Right times2 6249
##1203 62 Right times2 6510
##1204 133 Right times2 7641
##1205 142 Right times2 7608
##1206 7 Right times2 6091
## ...
##1601 44 Left times3 6319
##1602 119 Left times3 6289
##1603 62 Left times3 6298
##1604 133 Left times3 7029
##1605 142 Left times3 6986
##1606 7 Left times3 7233
## ...
##2001 44 Right times3 7465
##2002 119 Right times3 7220
##2003 62 Right times3 6448
##2004 133 Right times3 7833
##2005 142 Right times3 7606
##2006 7 Right times3 6625