R - 根据键值对替换数据框列中的所有值

R - replace all values in a dataframe column as per a key-value pair

在 'Auto' 数据集中,一列包含汽车原产地代码。 美国 1 个,欧洲 2 个,日本 3 个。 我想用字符串替换代码。所有 1 都应替换为 'amer',2 将替换为 'euro',3 将替换为 'jap'。

查询

  1. 在 R 中创建键值对的最佳方法是什么? (我是用list做的,有没有更好的方法?)

  2. 根据键值对替换数据框列中值的最有效方法是什么?

这里是模拟数据:

a = replicate(15, sample(1:3, 1))
a
#> 3 3 3 3 1 2 3 1 3 3 1 3 1 2 3


## Create key-value pairings
origin_code = vector(mode='list', length=3)
names(origin_code) = c(1, 2, 3)
origin_code[[1]] = 'amer'
origin_code[[2]] = 'euro'
origin_code[[3]] = 'jap'
origin_code
#> 
$`1`
[1] "amer"

$`2`
[1] "euro"

$`3`
[1] "jap"

## Replace values
<Help needed here>

# I tried the following but got NULL (Why?)
# replace values
b = for (x in unique(a)) {replace(a, a==x, origin_code[x])}
b
#> NULL

由于a是一个数值,可以作为索引

unlist(origin_code[a], use.names = FALSE)
#[1] "jap"  "jap"  "jap"  "jap"  "amer" "euro" "jap"  "amer" "jap"  "jap"  "amer" "jap"  "amer" "euro" "jap" 

如果list和'a'的名字不是数字,那么可以用match

unlist(origin_code[match(a, names(origin_code))], use.names = FALSE)

或者也可以使用命名向量

unname(unlist(origin_code)[as.character(a)])

在 OP 的代码中,我们可以做一个简单的更改

b <- a
for(x in unique(a))  b <- replace(b, b == x, origin_code[[x]])
b

数据

a <- c(3, 3, 3, 3, 1, 2, 3, 1, 3, 3, 1, 3, 1, 2, 3)