在 R 中更改文件编码
Changing file encoding in R
我在将 excel sheet 导入 R (csv) 时遇到困难。但是,看完这个post,我能够成功导入它。但是,我注意到特定列中的某些数字已转换为不需要的字符 - “Ï52,386.43”“Ï6,887.61”“Ï32,923.45”。有什么想法可以将这些更改为数字吗?
下面是我的代码:
df <- read.csv("data.csv", header = TRUE, strip.white = TRUE,
fileEncoding="latin1", stringsAsFactors=FALSE)
我也试过 fileEncoding = "UTF-8"
但这不起作用 - 我收到以下警告:
Warning messages:
1: In read.table(file = file, header = header, sep = sep, quote = quote, :
invalid input found on input connection 'data.csv'
2: In read.table(file = file, header = header, sep = sep, quote = quote
我正在使用 mac 和 "R version 3.2.4 (2016-03-10)"(如果这有什么区别的话)。以下是受影响列中的前十个条目:
[1] "Ï52,386.43" "Ï6,887.61" "Ï32,923.45" "" "Ï82,108.44"
[6] "Ï6,378.10" "" "Ï22,467.43" "Ï3,850.14" "Ï5,547.83"
事实证明,问题是在将 xls 文件保存为 csv 格式(在 windows 中-在 mac 中打开的过程中,井号变成了 Ï
).感谢您的回复。
我在将 excel sheet 导入 R (csv) 时遇到困难。但是,看完这个post,我能够成功导入它。但是,我注意到特定列中的某些数字已转换为不需要的字符 - “Ï52,386.43”“Ï6,887.61”“Ï32,923.45”。有什么想法可以将这些更改为数字吗?
下面是我的代码:
df <- read.csv("data.csv", header = TRUE, strip.white = TRUE,
fileEncoding="latin1", stringsAsFactors=FALSE)
我也试过 fileEncoding = "UTF-8"
但这不起作用 - 我收到以下警告:
Warning messages:
1: In read.table(file = file, header = header, sep = sep, quote = quote, :
invalid input found on input connection 'data.csv'
2: In read.table(file = file, header = header, sep = sep, quote = quote
我正在使用 mac 和 "R version 3.2.4 (2016-03-10)"(如果这有什么区别的话)。以下是受影响列中的前十个条目:
[1] "Ï52,386.43" "Ï6,887.61" "Ï32,923.45" "" "Ï82,108.44"
[6] "Ï6,378.10" "" "Ï22,467.43" "Ï3,850.14" "Ï5,547.83"
事实证明,问题是在将 xls 文件保存为 csv 格式(在 windows 中-在 mac 中打开的过程中,井号变成了 Ï
).感谢您的回复。