使用计算出的逻辑回归模型,根据 R 中合适的截止值创建分类器

Using a logistic regression model calculated, create a classifier based on a suitable cut-off value in R

我使用 R 中内置的鸢尾花数据集创建了逻辑回归模型...

# Includes iris dataset.
library(datasets)

# Dummy variable to predict.
iris$dummy.virginica.iris <- 0
iris$dummy.virginica.iris[iris$Species == 'virginica'] <- 1
iris$dummy.virginica.iris

# Logistic regression model.
glmfit<-glm(dummy.virginica.iris ~ Petal.Width, 
        data = iris, 
        family = 'binomial') 
summary(glmfit)

我如何基于此模型创建一个具有合适截止值(例如 0.5)的分类器?任何建议或帮助将不胜感激。

您想将 predict 函数与 type=response 一起使用以获得每一行属于物种 virginica:

的概率
glmfit.pred <- predict(glmfit, type="response")
virginica <- ifelse(glmfit.pred > .5, TRUE, FALSE)
table(iris$Species, virginica)
#             virginica
#              FALSE TRUE
#   setosa        50    0
#   versicolor    48    2
#   virginica      4   46

所以在这个例子中,属于 virginica 的 50 个标本中有 46 个被正确分类,而 50 个 versicolor 标本中有 2 个被错误地更正为 virginica,而 50 个 versicolor 标本中的 48 个被正确分类为不是 virginica,所有 50 个标本setosa 被正确归类为非 virginica。