删除 r 中数据集的重复列字符

Question

我是 r 的新手，我在删除重复字符时遇到问题。

这是我的代码：

library(RCurl)
x <- getURL("https://raw.githubusercontent.com/eparker12/nCoV_tracker/master/input_data/coronavirus.csv")
y <- read.csv(text = x)
z <- duplicated(y$jhuID)

我尝试了类似 z <- ... 的方法，但它没有用。对于数据框中的 jhuID 列，它是 class character 但是有很多重复多次的国家名称，我的目标是删除那些重复的国家名称并确保它只保留一次 class character

例如，如果我按y$jhuID查看数据，我会看到所有出现多次的国家名称。我想要新的数据框，例如 z 当我查看 z$jhulD 时，我会看到国家名称每次只出现一次。

如有任何帮助，我们将不胜感激！！提前致谢

Answer 1

h distinct 和 arrange

的选项

library(dplyr)
y %>%
     distinct(jhu_ID, .keep_all = TRUE) %>%
     arrange(jhu_ID)

删除 r 中数据集的重复列字符

Removing duplicated column characters of dataset in r

r

character

duplicates