根据其他列中的因素计算一列中 R 的平均值和标准差
Calculating mean and standard deviation in R in one column depending on factors in other columns
我想根据 "skada" 列中依赖于其他三列的数据计算平均值和标准差。我的 table 看起来像这样:
"geografi" 列有分类变量:SV、NV、M、SO、SV
"gradering" 列有分类变量:1、2
"plats"列有分类变量:20m, kant
换句话说,这意味着我将得到 SV,1,20m 的均值和标准差; SV,2,20m; SV,1,康德; SV,2,康德; NV,1,20m,......等等。有没有人知道如何轻松做到这一点?
干杯!
您可以使用 data.table:
library(data.table)
setDT(data)[, list(skada_mean = mean(skada), skada_sd = sd(skada)),
by = c("geografi", "gardering", "plats")]
或dyplr:
library(dplyr)
data %>%
group_by(geografi, gardering, plats) %>%
summarise(skada_mean = mean(value), skada_sd = sd(value))
我想根据 "skada" 列中依赖于其他三列的数据计算平均值和标准差。我的 table 看起来像这样:
"geografi" 列有分类变量:SV、NV、M、SO、SV
"gradering" 列有分类变量:1、2
"plats"列有分类变量:20m, kant
换句话说,这意味着我将得到 SV,1,20m 的均值和标准差; SV,2,20m; SV,1,康德; SV,2,康德; NV,1,20m,......等等。有没有人知道如何轻松做到这一点?
干杯!
您可以使用 data.table:
library(data.table)
setDT(data)[, list(skada_mean = mean(skada), skada_sd = sd(skada)),
by = c("geografi", "gardering", "plats")]
或dyplr:
library(dplyr)
data %>%
group_by(geografi, gardering, plats) %>%
summarise(skada_mean = mean(value), skada_sd = sd(value))