通过数据中值的向量获取重复行 table

Question

考虑这个 table df 和这个向量 v:

df = data.table(ID=c(50,40,30),fruit=c('mango','grape','melon'))
df
   ID fruit
1: 50 mango
2: 40 grape
3: 30 melon

v = sample(df[,ID],size=30,replace = T)
v
[1] 30 50 30 30 40 50 40 40 50 30 40 50 50 40 30 30 30 40 40 30 50 40 30 30 30 40 30 40 50 30

我想创建一个 df，行数与向量 v 的长度一样多，向量 v 应该是我想重复的行的索引与 ID 列相等。

我试过了：

> df[v%in%ID]
Error in `[.data.table`(df, v %in% ID) : 
  i evaluates to a logical vector length 30 but there are 3 rows. Recycling of logical i is no longer allowed as it hides more bugs than is worth the rare convenience. Explicitly use rep(...,length=.N) if you really need to recycle.
> df[v==ID]
Error in `[.data.table`(df, v == ID) : 
  i evaluates to a logical vector length 30 but there are 3 rows. Recycling of logical i is no longer allowed as it hides more bugs than is worth the rare convenience. Explicitly use rep(...,length=.N) if you really need to recycle.

Answer 1

您可以使用 J(v) 或 .(v) 将 v 加入 df:

df[J(v),on=.(ID)]
df[.(v),on=.(ID)]

       ID  fruit
    <num> <char>
 1:    40  grape
 2:    40  grape
 3:    30  melon
 4:    30  melon
 5:    50  mango
 6:    50  mango
 7:    30  melon
 8:    40  grape
 9:    50  mango
10:    50  mango
11:    30  melon
12:    30  melon
13:    50  mango
14:    50  mango
15:    30  melon
16:    40  grape
17:    30  melon
18:    40  grape
19:    40  grape
20:    40  grape
21:    40  grape
22:    40  grape
23:    30  melon
24:    30  melon
25:    40  grape
26:    40  grape
27:    50  mango
28:    50  mango
29:    50  mango
30:    50  mango

Answer 2

library(data.table)
df = data.table(ID=c(50,40,30),fruit=c('mango','grape','melon'))
df
#>    ID fruit
#> 1: 50 mango
#> 2: 40 grape
#> 3: 30 melon
v = sample(df[,ID],size=30,replace = T)
v <- data.table(ID = v)

df[v, on = list(ID)]
#>     ID fruit
#>  1: 40 grape
#>  2: 40 grape
#>  3: 40 grape
#>  4: 50 mango
#>  5: 40 grape
#>  6: 30 melon
#>  7: 30 melon
#>  8: 30 melon
#>  9: 30 melon
#> 10: 50 mango
#> 11: 40 grape
#> 12: 30 melon
#> 13: 30 melon
#> 14: 30 melon
#> 15: 50 mango
#> 16: 40 grape
#> 17: 50 mango
#> 18: 50 mango
#> 19: 40 grape
#> 20: 30 melon
#> 21: 40 grape
#> 22: 30 melon
#> 23: 30 melon
#> 24: 40 grape
#> 25: 50 mango
#> 26: 50 mango
#> 27: 40 grape
#> 28: 40 grape
#> 29: 40 grape
#> 30: 40 grape
#>     ID fruit

^{由 reprex package (v2.0.1)}

于 2021-12-28 创建

Answer 3

您需要将矢量转换为 df 并根据 ID 列合并它们。

v <- data.frame(ID = v)
df1 <- merge(df, v, by = 'ID')

输出如下所示：

    ID fruit
 1: 30 melon
 2: 30 melon
 3: 30 melon
 4: 30 melon
 5: 30 melon
 6: 30 melon
 7: 30 melon
 8: 30 melon
 9: 30 melon
10: 30 melon
11: 30 melon
12: 40 grape
13: 40 grape
14: 40 grape
15: 40 grape
16: 40 grape
17: 50 mango
18: 50 mango
19: 50 mango
20: 50 mango
21: 50 mango
22: 50 mango
23: 50 mango
24: 50 mango
25: 50 mango
26: 50 mango
27: 50 mango
28: 50 mango
29: 50 mango
30: 50 mango

Answer 4

这是一个很好的解决方案，没有任何复杂的技术。

df[match(v,ID)]

通过数据中值的向量获取重复行 table

get repeated rows by vector of values in data table

r

data.table