删除 r 中数据集的重复列字符
Removing duplicated column characters of dataset in r
我是 r 的新手,我在删除重复字符时遇到问题。
这是我的代码:
library(RCurl)
x <- getURL("https://raw.githubusercontent.com/eparker12/nCoV_tracker/master/input_data/coronavirus.csv")
y <- read.csv(text = x)
z <- duplicated(y$jhuID)
我尝试了类似 z <- ... 的方法,但它没有用。
对于数据框中的 jhuID
列,它是 class character
但是有很多重复多次的国家名称,我的目标是删除那些重复的国家名称并确保它只保留一次 class character
例如,如果我按y$jhuID
查看数据,我会看到所有出现多次的国家名称。我想要新的数据框,例如 z
当我查看 z$jhulD
时,我会看到国家名称每次只出现一次。
如有任何帮助,我们将不胜感激!!提前致谢
h distinct
和 arrange
的选项
library(dplyr)
y %>%
distinct(jhu_ID, .keep_all = TRUE) %>%
arrange(jhu_ID)
我是 r 的新手,我在删除重复字符时遇到问题。
这是我的代码:
library(RCurl)
x <- getURL("https://raw.githubusercontent.com/eparker12/nCoV_tracker/master/input_data/coronavirus.csv")
y <- read.csv(text = x)
z <- duplicated(y$jhuID)
我尝试了类似 z <- ... 的方法,但它没有用。
对于数据框中的 jhuID
列,它是 class character
但是有很多重复多次的国家名称,我的目标是删除那些重复的国家名称并确保它只保留一次 class character
例如,如果我按y$jhuID
查看数据,我会看到所有出现多次的国家名称。我想要新的数据框,例如 z
当我查看 z$jhulD
时,我会看到国家名称每次只出现一次。
如有任何帮助,我们将不胜感激!!提前致谢
h distinct
和 arrange
library(dplyr)
y %>%
distinct(jhu_ID, .keep_all = TRUE) %>%
arrange(jhu_ID)