比较 R 中的 3 个不同的 .csv 文件并将它们之间的公共数据提取到新的 .csv

Question

我有一个场景，我想比较 3 个不同的 .csv 文件和 extract/write 它们中常见的数据与第 4 个 file.Can 谁能告诉我如何在 R 中实现这一点。

Answer 1

您可以使用 dplyr 在一个管道中执行所有操作。

如果您正在寻找一个解决方案来查找所有 .csv 文件中存在的观察结果，您应该使用内部连接：

library(dplyr)
library(magrittr)

read.csv("first.csv") %>%
  inner_join(read.csv("second.csv")) %>%
  inner_join(read.csv("third.csv")) %>%
  write.csv("fourth.csv", quote = F, row.names = F)

如果您正在寻找一种解决方案来找到任何数据框中存在的所有观察结果，您应该使用完全连接：

read.csv("first.csv") %>%
  full_join(read.csv("second.csv")) %>%
  full_join(read.csv("third.csv")) %>%
  write.csv("fourth.csv", quote = F, row.names = F)

比较 R 中的 3 个不同的 .csv 文件并将它们之间的公共数据提取到新的 .csv

Comparing 3 different .csv files in R and extracting the common data between them to a new .csv

csv

r

shiny

data-science