在引号之间将 csv 列导入为整数
Import csv column as integer when between quotation marks
我是 R 的(非常)新手,我正在努力自学,但我找不到这个问题的答案,或者至少不是最佳答案!
我有一个包含如下行的 CSV:
"123112300500","A","395"
如您所见,第一列和最后一列是整数,但它们在引号内。我不想预处理我的输入(因为我认为 R 可以处理这个),我尝试像这样导入 csv:
set <- read.csv("set.csv", header = TRUE, sep=",", colClasses=c("integer", "character", "integer")
但它不会工作,因为它不需要引号!
我目前的解决方案是
设置$V1 <- as.integer(设置$V1)
但它引入了很多开销(我喜欢 200 万行和具有整数或数值的不同列)。
如何使用 read.csv 来导入标记之间带有整数(或浮点数,或其他所有内容)的值?
提前感谢任何人:)
您确定该列中的所有值都是数字吗? type.convert
似乎可以很好地处理引用的数字...
a <- '"a", "b", "1", "2"
"c", "d", "3", "4"'
df <- read.csv(text=a, stringsAsFactors=F, header=F)
> str(df)
'data.frame': 2 obs. of 4 variables:
$ V1: chr "a" " c"
$ V2: chr " b" " d"
$ V3: int 1 3
$ V4: int 2 4
我是 R 的(非常)新手,我正在努力自学,但我找不到这个问题的答案,或者至少不是最佳答案!
我有一个包含如下行的 CSV: "123112300500","A","395"
如您所见,第一列和最后一列是整数,但它们在引号内。我不想预处理我的输入(因为我认为 R 可以处理这个),我尝试像这样导入 csv:
set <- read.csv("set.csv", header = TRUE, sep=",", colClasses=c("integer", "character", "integer")
但它不会工作,因为它不需要引号!
我目前的解决方案是 设置$V1 <- as.integer(设置$V1) 但它引入了很多开销(我喜欢 200 万行和具有整数或数值的不同列)。
如何使用 read.csv 来导入标记之间带有整数(或浮点数,或其他所有内容)的值?
提前感谢任何人:)
您确定该列中的所有值都是数字吗? type.convert
似乎可以很好地处理引用的数字...
a <- '"a", "b", "1", "2"
"c", "d", "3", "4"'
df <- read.csv(text=a, stringsAsFactors=F, header=F)
> str(df)
'data.frame': 2 obs. of 4 variables:
$ V1: chr "a" " c"
$ V2: chr " b" " d"
$ V3: int 1 3
$ V4: int 2 4