有没有办法 运行 对不同长度的变量进行 wilcoxon 检验?
Is there a way to run a wilcoxon test for variables with different lengths?
我正在尝试 运行 wilcox.test()
对来自数据框的两个数据子集。它们的长度不相等(48 对 260)。我想看看活橡树和水橡树的胸径(胸径)有没有区别
Pine_stand <- read.csv("Pine_stand.csv")
live_oaks <- subset(Pine_stand,Species=="live oak",select=c("dbh"));live_oaks
water_oaks <- subset(Pine_stand,Species=="water oak",select=c("dbh"));water_oaks
wilcox.test(live_oaks~water_oaks,conf.int=T,correct=F)
Error in model.frame.default(formula = live_oaks ~ water_oaks) :
invalid type (list) for variable 'live_oaks'
那是我的第一次尝试然后我尝试了这个
Pine_stand <- read.csv("Pine_stand.csv")
live_dbh <- subset(Pine_stand,Species=="live oak",select=c("dbh"));live_oaks
water_dbh <- subset(Pine_stand,Species=="water oak",select=c("dbh"));water_oaks
oaks<-c(live_dbh,water_dbh)
wilcox.test(dbh~Species,data=oaks)
Error in (function (..., row.names = NULL, check.rows = FALSE, check.names = TRUE, :
arguments imply differing number of rows: 48, 260
>
并收到该错误。我已经尝试对这两个组进行矢量化并附加 tapply
...我知道我忽略了一个简单的答案,我就是无法让它工作。我正在阅读的所有示例都在比较两个长度相同的向量。我知道当有不同的数字时我可以手工进行 Wilcoxon 测试,所以应该有办法。欢迎任何建议。
怎么样
wilcox.test(dbh~Species, data=Pine_stand,
subset=(Species %in% c("live oak", "water oak"))
? (如果这些是您的数据集中仅有的两个物种,则不需要 subset
参数。)
是的,您可以 运行 一个 wilcox.test 用于不同长度的变量。如 http://www.r-tutor.com/elementary-statistics/non-parametric-methods/mann-whitney-wilcoxon-test
所述
“Using the Mann-Whitney-Wilcoxon Test, we can decide whether the
population distributions are identical without assuming them to follow
the normal distribution.”
因此,当不满足 t 检验的假设(例如分布不正态或两个样本的方差不相等)时,我们可以使用 t 检验的非参数等效项。
您的代码中的问题在于这两个语句:
live_dbh <- subset(Pine_stand,Species=="live oak",select=c("dbh"))
water_dbh <- subset(Pine_stand,Species=="water oak",select=c("dbh"))
您正在创建两个仅包含 dph 值的向量,但您丢失了有关标签(物种)的信息。因此你应该写:
live_dbh <- subset(Pine_stand,Species=="live oak",select=c("dbh", “Species”))
water_dbh <- subset(Pine_stand,Species=="water oak",select=c("dbh", “Species”))
其次,当您尝试将两个集合与此代码合并时:
oaks<-c(live_dbh,water_dbh)
您创建了一个列表,而不是创建数据框。为什么会这样?首先,正如我们可以从 c() 的文档中读到的那样,它的名称代表“将值组合成向量或列表”。可能你已经用它把两个向量合二为一了。但是,在子集函数的情况下,它实际上给出的是一列数据框而不是向量。因此,我们的 live_dbh 和 water_dbh 集是数据框(现在有了标签,它们甚至有两列)。
如果是一列数据框,您始终可以使用递归参数设置为 TRUE 的 c() 函数来合并它们:
total<-c(one_column_df1, one_column_df2, recursive=TRUE)
然而,使用 rbind 函数通常更安全(并且它也是唯一可以在我们合并多列数据框的情况下使用的函数)。 Rbind 代表行绑定。
oaks<-rbind(live_dbh,water_dbh)
现在你应该可以 运行 wilcox.test:
wilcox.test(dbh~Species,data=oaks)
我正在尝试 运行 wilcox.test()
对来自数据框的两个数据子集。它们的长度不相等(48 对 260)。我想看看活橡树和水橡树的胸径(胸径)有没有区别
Pine_stand <- read.csv("Pine_stand.csv")
live_oaks <- subset(Pine_stand,Species=="live oak",select=c("dbh"));live_oaks
water_oaks <- subset(Pine_stand,Species=="water oak",select=c("dbh"));water_oaks
wilcox.test(live_oaks~water_oaks,conf.int=T,correct=F)
Error in model.frame.default(formula = live_oaks ~ water_oaks) :
invalid type (list) for variable 'live_oaks'
那是我的第一次尝试然后我尝试了这个
Pine_stand <- read.csv("Pine_stand.csv")
live_dbh <- subset(Pine_stand,Species=="live oak",select=c("dbh"));live_oaks
water_dbh <- subset(Pine_stand,Species=="water oak",select=c("dbh"));water_oaks
oaks<-c(live_dbh,water_dbh)
wilcox.test(dbh~Species,data=oaks)
Error in (function (..., row.names = NULL, check.rows = FALSE, check.names = TRUE, :
arguments imply differing number of rows: 48, 260
>
并收到该错误。我已经尝试对这两个组进行矢量化并附加 tapply
...我知道我忽略了一个简单的答案,我就是无法让它工作。我正在阅读的所有示例都在比较两个长度相同的向量。我知道当有不同的数字时我可以手工进行 Wilcoxon 测试,所以应该有办法。欢迎任何建议。
怎么样
wilcox.test(dbh~Species, data=Pine_stand,
subset=(Species %in% c("live oak", "water oak"))
? (如果这些是您的数据集中仅有的两个物种,则不需要 subset
参数。)
是的,您可以 运行 一个 wilcox.test 用于不同长度的变量。如 http://www.r-tutor.com/elementary-statistics/non-parametric-methods/mann-whitney-wilcoxon-test
所述“Using the Mann-Whitney-Wilcoxon Test, we can decide whether the population distributions are identical without assuming them to follow the normal distribution.”
因此,当不满足 t 检验的假设(例如分布不正态或两个样本的方差不相等)时,我们可以使用 t 检验的非参数等效项。
您的代码中的问题在于这两个语句:
live_dbh <- subset(Pine_stand,Species=="live oak",select=c("dbh"))
water_dbh <- subset(Pine_stand,Species=="water oak",select=c("dbh"))
您正在创建两个仅包含 dph 值的向量,但您丢失了有关标签(物种)的信息。因此你应该写:
live_dbh <- subset(Pine_stand,Species=="live oak",select=c("dbh", “Species”))
water_dbh <- subset(Pine_stand,Species=="water oak",select=c("dbh", “Species”))
其次,当您尝试将两个集合与此代码合并时:
oaks<-c(live_dbh,water_dbh)
您创建了一个列表,而不是创建数据框。为什么会这样?首先,正如我们可以从 c() 的文档中读到的那样,它的名称代表“将值组合成向量或列表”。可能你已经用它把两个向量合二为一了。但是,在子集函数的情况下,它实际上给出的是一列数据框而不是向量。因此,我们的 live_dbh 和 water_dbh 集是数据框(现在有了标签,它们甚至有两列)。
如果是一列数据框,您始终可以使用递归参数设置为 TRUE 的 c() 函数来合并它们:
total<-c(one_column_df1, one_column_df2, recursive=TRUE)
然而,使用 rbind 函数通常更安全(并且它也是唯一可以在我们合并多列数据框的情况下使用的函数)。 Rbind 代表行绑定。
oaks<-rbind(live_dbh,water_dbh)
现在你应该可以 运行 wilcox.test:
wilcox.test(dbh~Species,data=oaks)