替换因子中的未知值

Replace Unknown values in factor

我正在寻找如何替换我的数据集中被分类为“未知”的缺失值 所有未知值都在因素列中.. 例如,我的婚姻状况具有已婚、单身、离婚和未知的属性。我正在寻找一种方法来替换“未知”而不是删除……其他因素只有是、否、未知。

bank$marital <- factor(c('married','divorced','married','unknown','single'))

我只想用例如“单个”替换“未知”

bank$marital = bank$marital.fillna(bank$marital.mode[yes],inplace = True)

bank$marital[is.na(bank$marital)]<-mean(bank$marital,na.rm=TRUE)

我不能使用均值,因为它的因素... 但是我找不到正确的方法来替换因子中的“未知”值

你是说下面这样的意思吗?

f <- type.convert(f, as.is = TRUE)
replace(f,is.na(f),mean(f,na.rm = TRUE))
# [1] 1.000 2.775 4.000 3.000 3.100 2.775

虚拟数据

f <- factor(c(1,NA,4,3,3.1,NA))

这个?

参见here

bank <- data.frame(marital = as.factor(c('married','divorced','married','unknown','single')))

levels(bank$marital) <- c(levels(bank$marital), "x")    # add new level

bank$marital[ bank$marital == "unknown" ] <- "x"

bank$marital
#> [1] married  divorced married  x        single  
#> Levels: divorced married single unknown x

reprex package (v0.3.0)

于 2021-01-29 创建