如何使用 R 中的 excel 数据集制作列表变量(R Newie)

How to make list variables using an excel data set in R (R Newie)

我正在尝试映射一些关系。我有一个 excel sheet,第一列是帐户 ID 号,接下来的列是相关帐户的 ID 号。如果我在工作中可以访问,我会构建一个关系数据库并从那里开始,但我没有,而且我不确定创建关系数据库是否有助于我需要编写的应用程序。我想编写一个循环,获取第 1 列中的帐号并将其与其中具有相关帐户的每一列相关联(它根据从一个相关帐户到十几个帐户的帐户而有所不同)。我的想法是某种列表变量,其中每个帐户 ID 作为所有相关帐户的唯一标识符。

我花了很多时间阅读列表变量理论,它似乎正是我需要的。这是我可以在 R 中做的事情吗?example of spreadsheet...not the real one because its confidential Desired output

好的,这是您的数据:

df

# A tibble: 3 x 6
     ID Related1 Related2 Related3 Related4 Related5
  <dbl>    <dbl>    <dbl>    <dbl>    <dbl>    <dbl>
1  1111     1211     1212       NA       NA       NA
2  2222     1211     1212     1333       NA       NA
3  3333     4210     5689     8756     6245     5151

现在我想这就是你想要的:

df %>%
  gather(key = key, value = Related, -ID) %>%
  select(-key) %>%
  na.omit() %>%
  arrange(ID, Related)

# A tibble: 10 x 2
      ID Related
   <dbl>   <dbl>
 1  1111    1211
 2  1111    1212
 3  2222    1211
 4  2222    1212
 5  2222    1333
 6  3333    4210
 7  3333    5151
 8  3333    5689
 9  3333    6245
10  3333    8756

正确吗?