唯一名称的子集

Question

我有一个 ID 长度为 18 的向量

mydata$ID=rep(c("WT1","WT2", "WT3", "KO1", "KO2", "KO3"), each=3)

[1] "WT1" "WT1" "WT1" "WT2" "WT2" "WT2" "WT3" "WT3" "WT3" "KO1" "KO1" "KO1" "KO2" "KO2" "KO2" "KO3"
[17] "KO3" "KO3"

我想创建一个元素顺序相同但单独使用的新向量，如下所示：

WT1 WT2 WT3 KO1 KO2 KO3

我试过：

mydata$ID=factor(unique(mydata$ID))

但是 returns:

[1] WT1 WT2 WT3 KO1 KO2 KO3 WT1 WT2 WT3 KO1 KO2 KO3 WT1 WT2 WT3 KO1 KO2 KO3

Answer 1

安装 sqldf 包。然后做

newVector <- sqldf('select distinct(ID) from mydata');

Answer 2

让我们保持简单：

unique(mydata$ID)
[1] "WT1" "WT2" "WT3" "KO1" "KO2" "KO3"

唯一名称的子集

Subset of unique names

r

subset