如何使用 R 中的 excel 数据集制作列表变量(R Newie)
How to make list variables using an excel data set in R (R Newie)
我正在尝试映射一些关系。我有一个 excel sheet,第一列是帐户 ID 号,接下来的列是相关帐户的 ID 号。如果我在工作中可以访问,我会构建一个关系数据库并从那里开始,但我没有,而且我不确定创建关系数据库是否有助于我需要编写的应用程序。我想编写一个循环,获取第 1 列中的帐号并将其与其中具有相关帐户的每一列相关联(它根据从一个相关帐户到十几个帐户的帐户而有所不同)。我的想法是某种列表变量,其中每个帐户 ID 作为所有相关帐户的唯一标识符。
我花了很多时间阅读列表变量理论,它似乎正是我需要的。这是我可以在 R 中做的事情吗?example of spreadsheet...not the real one because its confidential Desired output
好的,这是您的数据:
df
# A tibble: 3 x 6
ID Related1 Related2 Related3 Related4 Related5
<dbl> <dbl> <dbl> <dbl> <dbl> <dbl>
1 1111 1211 1212 NA NA NA
2 2222 1211 1212 1333 NA NA
3 3333 4210 5689 8756 6245 5151
现在我想这就是你想要的:
df %>%
gather(key = key, value = Related, -ID) %>%
select(-key) %>%
na.omit() %>%
arrange(ID, Related)
# A tibble: 10 x 2
ID Related
<dbl> <dbl>
1 1111 1211
2 1111 1212
3 2222 1211
4 2222 1212
5 2222 1333
6 3333 4210
7 3333 5151
8 3333 5689
9 3333 6245
10 3333 8756
正确吗?
我正在尝试映射一些关系。我有一个 excel sheet,第一列是帐户 ID 号,接下来的列是相关帐户的 ID 号。如果我在工作中可以访问,我会构建一个关系数据库并从那里开始,但我没有,而且我不确定创建关系数据库是否有助于我需要编写的应用程序。我想编写一个循环,获取第 1 列中的帐号并将其与其中具有相关帐户的每一列相关联(它根据从一个相关帐户到十几个帐户的帐户而有所不同)。我的想法是某种列表变量,其中每个帐户 ID 作为所有相关帐户的唯一标识符。
我花了很多时间阅读列表变量理论,它似乎正是我需要的。这是我可以在 R 中做的事情吗?example of spreadsheet...not the real one because its confidential Desired output
好的,这是您的数据:
df
# A tibble: 3 x 6
ID Related1 Related2 Related3 Related4 Related5
<dbl> <dbl> <dbl> <dbl> <dbl> <dbl>
1 1111 1211 1212 NA NA NA
2 2222 1211 1212 1333 NA NA
3 3333 4210 5689 8756 6245 5151
现在我想这就是你想要的:
df %>%
gather(key = key, value = Related, -ID) %>%
select(-key) %>%
na.omit() %>%
arrange(ID, Related)
# A tibble: 10 x 2
ID Related
<dbl> <dbl>
1 1111 1211
2 1111 1212
3 2222 1211
4 2222 1212
5 2222 1333
6 3333 4210
7 3333 5151
8 3333 5689
9 3333 6245
10 3333 8756
正确吗?