无法格式化数据以使用 ggplot2 制作箱线图
Cannot format data to make boxplot with ggplot2
我正在尝试在 RStudio 上使用变量 'Control' 和 'Experimental' 制作箱线图,但每个控件需要有 2 个数据子集('Day' 和 'Night').所以基本上我想在一个地块上有 4 个单独的 box-and-whisker 地块(如果这有意义的话?)。
我有两个单独的数据框,标题为 'Day'、'Night' 和 'Hue',因此 x-axis 需要白天和黑夜,色调需要y-axis。我已经尝试 re-arranging 我的数据框有 2 列('Time' 例如 day/night 和 'Hue')但是 ggplot2 似乎也不喜欢这个。
我根本无法让这些图发挥作用,所以任何帮助将不胜感激!
提前致谢!
预计到达时间:
实际数据:
1 色相
2 1 0.26
3 1 0.39
4 1 0.23
5 1 0.24
6 1 0.05
7 1 0.71
8 1 0.59
9 1 0.78
10 1 0.63
11 1 1.09
12 1 0.18
13 1 0.83
14 1 0.20
15 1 0.15
16 1 0.17
17 1 0.24
18 1 0.42
19 1 0.38
20 1 0.61
21 1 0.49
22 1 0.46
23 1 0.50
24 1 0.41
25 1 0.23
26 1 0.11
27 1 0.47
28 1 0.15
29 1 0.40
30 1 0.31
31 1 0.34
32 2 1.37
33 2 0.21
4 2 0.48
35 2 0.10
36 2 0.82
37 2 0.63
38 2 0.48
39 2 0.70
40 2 0.68
41 2 0.76
42 2 0.52
43 2 0.68
44 2 2.62
45 2 0.13
46 2 0.40
47 2 0.39
48 2 0.41
49 2 0.50
50 2 0.66
51 2 0.56
52 2 0.58
53 2 0.17
54 2 0.47
55 2 0.31
56 2 0.39
57 2 0.49
58 2 0.38
59 2 0.48
60 2 0.47
61 2 0.40
62 3 1.16
63 3 0.30
64 3 0.40
65 3 0.53
66 3 0.30
67 3 0.39
68 3 0.38
69 3 0.36
70 3 0.35
71 3 0.34
72 3 0.39
73 3 0.47
74 3 0.37
75 3 0.52
76 3 0.52
77 3 0.50
78 3 0.48
79 3 0.55
80 3 0.62
81 3 0.59
82 3 0.26
83 3 0.39
84 3 0.23
85 3 0.24
86 3 0.47
87 3 0.71
88 3 0.59
89 3 0.78
90 3 0.48
91 3 0.37
92 4 1.43
93 4 0.46
94 4 1.26
95 4 2.65
96 4 1.43
97 4 0.38
98 4 0.35
99 4 0.59
100 4 1.38
101 4 0.51
102 4 1.12
103 4 0.42
104 4 0.43
105 4 0.36
106 4 0.62
107 4 1.60
108 4 0.58
109 4 1.57
110 4 0.43
111 4 1.19
112 4 0.77
113 4 1.37
114 4 2.21
115 4 1.48
116 4 0.20
117 4 2.82
118 4 0.63
119 4 0.48
120 4 2.58
121 4 0.43
而 R 将此数据放入我的箱线图中:
团体
色调
1 控制日 12.43503
2 控制日 15.50208
3 控制日 10.55415
4 控制日 14.55953
5 控制日 14.81230
6 控制日 17.17195
7 控制日 16.72419
8 控制日 12.82169
9 控制日 12.71106
10 对照日 12.39931
11 对照日 16.41781
12 控制日 17.60299
13 对照日 14.94367
14 控制日 19.76444
15 控制日 18.16637
16 对照日 13.53893
17 控制日 12.13074
18 控制日 13.79023
19 控制日 11.37030
20 对照日 18.51498
21 控制日 16.43221
22控制日10.87997
23 控制日 17.54314
24控制日17.46402
25 控制日 19.95249
26控制日14.50452
27 控制日 18.43108
28 控制日 13.29810
29 控制日 10.05007
30 对照日 13.79817
31 控制之夜 18.61311
32 控制之夜 11.38397
33 控制之夜 14.95923
34 控制之夜 14.06546
35 控制之夜 12.49782
36 控制之夜 12.32807
37 控制之夜 14.51005
38 控制之夜 12.62860
39 控制之夜 19.34517
40 控制之夜 18.93672
41 控制之夜 12.43503
42 控制之夜 15.50208
43 控制之夜 10.55415
44 控制之夜 14.55953
45 控制之夜 14.81230
46 控制之夜 17.17195
47 控制之夜 16.72419
48 控制之夜 12.82169
49 控制之夜 12.71106
50 控制之夜 12.39931
51 控制之夜 16.41781
52 控制之夜 17.60299
53 控制之夜 14.94367
54 控制之夜 19.76444
55 控制之夜 18.16637
56 控制之夜 13.53893
57 控制之夜 12.13074
58 控制之夜 13.79023
59 控制之夜 11.37030
60 控制之夜 18.51498
61 实验日 16.43221
62 实验日 10.87997
63 实验第 17.54314 天
64 实验日 17.46402
65 实验日 19.95249
66 实验日 14.50452
67 实验日 18.43108
68 实验日 13.29810
69 实验日 10.05007
70 实验日 13.79817
71 实验日 18.61311
72 实验日 11.38397
73 实验日 14.95923
74 实验日 14.06546
75 实验日 12.49782
76 实验日 12.32807
77 实验日 14.51005
78 实验日 12.62860
79 实验日 19.34517
80 实验日 18.93672
81 实验日 12.43503
82 实验日 15.50208
83 实验日 10.55415
84 实验日 14.55953
85 实验日 14.81230
86 实验日 17.17195
87 实验日 16.72419
88 实验日 12.82169
89 实验日 12.71106
90 实验日 12.39931
91实验之夜16.41781
92实验之夜17.60299
93实验之夜14.94367
94实验之夜19.76444
95实验之夜18.16637
96实验之夜13.53893
97实验之夜12.13074
98实验之夜13.79023
99实验之夜11.37030
100 实验之夜 18.51498
101实验之夜16.43221
102实验之夜10.87997
103实验之夜17.54314
104实验之夜17.46402
105实验之夜19.95249
106实验之夜14.50452
107实验之夜18.43108
108实验之夜13.29810
109实验之夜10.05007
110实验之夜13.79817
111实验之夜18.61311
112实验之夜11.38397
113实验之夜14.95923
114实验之夜14.06546
115实验之夜12.49782
116实验之夜12.32807
117实验之夜14.51005
118实验之夜12.62860
119实验之夜19.34517
120实验之夜18.93672
如评论所述,我建议合并您的两个数据框,因此您有两列:组(包括控制日、控制夜、实验日、实验夜)和色调。
因此您的数据结构将类似于此输出(仅示例数据):
data<-data.frame(Group=rep(c(rep("Control Day",10),rep("Control Night",10),
rep("Experiment Day",10),rep("Experiment Night",10))),
Hue=runif(40,10,20))
那么你的情节应该通过:
plot<-ggplot(data,aes(x=factor(Group),y=Hue))+
geom_boxplot()
plot
我正在尝试在 RStudio 上使用变量 'Control' 和 'Experimental' 制作箱线图,但每个控件需要有 2 个数据子集('Day' 和 'Night').所以基本上我想在一个地块上有 4 个单独的 box-and-whisker 地块(如果这有意义的话?)。
我有两个单独的数据框,标题为 'Day'、'Night' 和 'Hue',因此 x-axis 需要白天和黑夜,色调需要y-axis。我已经尝试 re-arranging 我的数据框有 2 列('Time' 例如 day/night 和 'Hue')但是 ggplot2 似乎也不喜欢这个。
我根本无法让这些图发挥作用,所以任何帮助将不胜感激!
提前致谢!
预计到达时间: 实际数据:
1 色相
2 1 0.26
3 1 0.39
4 1 0.23
5 1 0.24
6 1 0.05
7 1 0.71
8 1 0.59
9 1 0.78
10 1 0.63
11 1 1.09
12 1 0.18
13 1 0.83
14 1 0.20
15 1 0.15
16 1 0.17
17 1 0.24
18 1 0.42
19 1 0.38
20 1 0.61
21 1 0.49
22 1 0.46
23 1 0.50
24 1 0.41
25 1 0.23
26 1 0.11
27 1 0.47
28 1 0.15
29 1 0.40
30 1 0.31
31 1 0.34
32 2 1.37
33 2 0.21
4 2 0.48
35 2 0.10
36 2 0.82
37 2 0.63
38 2 0.48
39 2 0.70 40 2 0.68 41 2 0.76 42 2 0.52 43 2 0.68 44 2 2.62 45 2 0.13 46 2 0.40 47 2 0.39 48 2 0.41 49 2 0.50 50 2 0.66 51 2 0.56 52 2 0.58 53 2 0.17 54 2 0.47 55 2 0.31 56 2 0.39 57 2 0.49 58 2 0.38 59 2 0.48 60 2 0.47 61 2 0.40 62 3 1.16 63 3 0.30 64 3 0.40 65 3 0.53 66 3 0.30 67 3 0.39 68 3 0.38 69 3 0.36 70 3 0.35 71 3 0.34 72 3 0.39 73 3 0.47 74 3 0.37 75 3 0.52 76 3 0.52 77 3 0.50 78 3 0.48 79 3 0.55 80 3 0.62 81 3 0.59 82 3 0.26 83 3 0.39 84 3 0.23 85 3 0.24 86 3 0.47 87 3 0.71 88 3 0.59 89 3 0.78 90 3 0.48 91 3 0.37 92 4 1.43 93 4 0.46 94 4 1.26 95 4 2.65 96 4 1.43 97 4 0.38 98 4 0.35 99 4 0.59 100 4 1.38 101 4 0.51 102 4 1.12 103 4 0.42 104 4 0.43 105 4 0.36 106 4 0.62 107 4 1.60 108 4 0.58 109 4 1.57 110 4 0.43 111 4 1.19 112 4 0.77 113 4 1.37 114 4 2.21 115 4 1.48 116 4 0.20 117 4 2.82 118 4 0.63 119 4 0.48 120 4 2.58 121 4 0.43
而 R 将此数据放入我的箱线图中: 团体 色调
1 控制日 12.43503
2 控制日 15.50208
3 控制日 10.55415
4 控制日 14.55953
5 控制日 14.81230
6 控制日 17.17195
7 控制日 16.72419
8 控制日 12.82169
9 控制日 12.71106
10 对照日 12.39931
11 对照日 16.41781
12 控制日 17.60299
13 对照日 14.94367
14 控制日 19.76444
15 控制日 18.16637
16 对照日 13.53893
17 控制日 12.13074
18 控制日 13.79023
19 控制日 11.37030
20 对照日 18.51498
21 控制日 16.43221
22控制日10.87997
23 控制日 17.54314
24控制日17.46402
25 控制日 19.95249
26控制日14.50452
27 控制日 18.43108
28 控制日 13.29810
29 控制日 10.05007
30 对照日 13.79817
31 控制之夜 18.61311
32 控制之夜 11.38397
33 控制之夜 14.95923
34 控制之夜 14.06546 35 控制之夜 12.49782 36 控制之夜 12.32807 37 控制之夜 14.51005 38 控制之夜 12.62860 39 控制之夜 19.34517 40 控制之夜 18.93672 41 控制之夜 12.43503 42 控制之夜 15.50208 43 控制之夜 10.55415 44 控制之夜 14.55953 45 控制之夜 14.81230 46 控制之夜 17.17195 47 控制之夜 16.72419 48 控制之夜 12.82169 49 控制之夜 12.71106 50 控制之夜 12.39931 51 控制之夜 16.41781 52 控制之夜 17.60299 53 控制之夜 14.94367 54 控制之夜 19.76444 55 控制之夜 18.16637 56 控制之夜 13.53893 57 控制之夜 12.13074 58 控制之夜 13.79023 59 控制之夜 11.37030 60 控制之夜 18.51498 61 实验日 16.43221 62 实验日 10.87997 63 实验第 17.54314 天 64 实验日 17.46402 65 实验日 19.95249 66 实验日 14.50452 67 实验日 18.43108 68 实验日 13.29810 69 实验日 10.05007 70 实验日 13.79817 71 实验日 18.61311 72 实验日 11.38397 73 实验日 14.95923 74 实验日 14.06546 75 实验日 12.49782 76 实验日 12.32807 77 实验日 14.51005 78 实验日 12.62860 79 实验日 19.34517 80 实验日 18.93672 81 实验日 12.43503 82 实验日 15.50208 83 实验日 10.55415 84 实验日 14.55953 85 实验日 14.81230 86 实验日 17.17195 87 实验日 16.72419 88 实验日 12.82169 89 实验日 12.71106 90 实验日 12.39931 91实验之夜16.41781 92实验之夜17.60299 93实验之夜14.94367 94实验之夜19.76444 95实验之夜18.16637 96实验之夜13.53893 97实验之夜12.13074 98实验之夜13.79023 99实验之夜11.37030 100 实验之夜 18.51498 101实验之夜16.43221 102实验之夜10.87997 103实验之夜17.54314 104实验之夜17.46402 105实验之夜19.95249 106实验之夜14.50452 107实验之夜18.43108 108实验之夜13.29810 109实验之夜10.05007 110实验之夜13.79817 111实验之夜18.61311 112实验之夜11.38397 113实验之夜14.95923 114实验之夜14.06546 115实验之夜12.49782 116实验之夜12.32807 117实验之夜14.51005 118实验之夜12.62860 119实验之夜19.34517 120实验之夜18.93672
如评论所述,我建议合并您的两个数据框,因此您有两列:组(包括控制日、控制夜、实验日、实验夜)和色调。
因此您的数据结构将类似于此输出(仅示例数据):
data<-data.frame(Group=rep(c(rep("Control Day",10),rep("Control Night",10),
rep("Experiment Day",10),rep("Experiment Night",10))),
Hue=runif(40,10,20))
那么你的情节应该通过:
plot<-ggplot(data,aes(x=factor(Group),y=Hue))+
geom_boxplot()
plot