替换因子中的未知值
Replace Unknown values in factor
我正在寻找如何替换我的数据集中被分类为“未知”的缺失值
所有未知值都在因素列中..
例如,我的婚姻状况具有已婚、单身、离婚和未知的属性。我正在寻找一种方法来替换“未知”而不是删除……其他因素只有是、否、未知。
bank$marital <- factor(c('married','divorced','married','unknown','single'))
我只想用例如“单个”替换“未知”
bank$marital = bank$marital.fillna(bank$marital.mode[yes],inplace = True)
bank$marital[is.na(bank$marital)]<-mean(bank$marital,na.rm=TRUE)
我不能使用均值,因为它的因素...
但是我找不到正确的方法来替换因子中的“未知”值
你是说下面这样的意思吗?
f <- type.convert(f, as.is = TRUE)
replace(f,is.na(f),mean(f,na.rm = TRUE))
# [1] 1.000 2.775 4.000 3.000 3.100 2.775
虚拟数据
f <- factor(c(1,NA,4,3,3.1,NA))
这个?
参见here。
bank <- data.frame(marital = as.factor(c('married','divorced','married','unknown','single')))
levels(bank$marital) <- c(levels(bank$marital), "x") # add new level
bank$marital[ bank$marital == "unknown" ] <- "x"
bank$marital
#> [1] married divorced married x single
#> Levels: divorced married single unknown x
由 reprex package (v0.3.0)
于 2021-01-29 创建
我正在寻找如何替换我的数据集中被分类为“未知”的缺失值 所有未知值都在因素列中.. 例如,我的婚姻状况具有已婚、单身、离婚和未知的属性。我正在寻找一种方法来替换“未知”而不是删除……其他因素只有是、否、未知。
bank$marital <- factor(c('married','divorced','married','unknown','single'))
我只想用例如“单个”替换“未知”
bank$marital = bank$marital.fillna(bank$marital.mode[yes],inplace = True)
bank$marital[is.na(bank$marital)]<-mean(bank$marital,na.rm=TRUE)
我不能使用均值,因为它的因素... 但是我找不到正确的方法来替换因子中的“未知”值
你是说下面这样的意思吗?
f <- type.convert(f, as.is = TRUE)
replace(f,is.na(f),mean(f,na.rm = TRUE))
# [1] 1.000 2.775 4.000 3.000 3.100 2.775
虚拟数据
f <- factor(c(1,NA,4,3,3.1,NA))
这个?
参见here。
bank <- data.frame(marital = as.factor(c('married','divorced','married','unknown','single')))
levels(bank$marital) <- c(levels(bank$marital), "x") # add new level
bank$marital[ bank$marital == "unknown" ] <- "x"
bank$marital
#> [1] married divorced married x single
#> Levels: divorced married single unknown x
由 reprex package (v0.3.0)
于 2021-01-29 创建