如何在文件格式和文件扩展名不同的 R 中打开 excel 文件?

How to open an excel file in R where file format and file extension differ?

我有一个 excel 文件,当我想打开它时会出现以下警告消息:

您尝试打开的文件 'name.ext' 的格式与文件扩展名指定的格式不同。在打开文件之前,确认文件未损坏且来源可靠。您现在要打开文件吗?

当我点击打开它时,一切正常。但是,我想在 R 中读取此文件,尽管有警告,但无法管理 R 加载内容。我怎样才能做到这一点?

可以下载我想用R打开的文件的一个例子here.我用的是MS Office 2016。

这是一个 XML 文件,开头为 UTF-16 BOM(字节顺序标记)。你可以用 R:

阅读
library(xml2)
library(rvest)

xls <- read_html("LU0444605991_434.xls")
values <- html_text(html_nodes(xls, xpath="//cell/data"))
dat <- data.frame(matrix(values[5:length(values)], ncol=2, byrow=TRUE), 
                  stringsAsFactors=FALSE)
colnames(dat) <- c("datum", "nav")
dat$nav <- as.numeric(dat$nav)

head(dat)
##                 datum      nav
## 1 2009-10-05T00:00:00 117.1047
## 2 2009-10-06T00:00:00 117.0746
## 3 2009-10-07T00:00:00 117.0915
## 4 2009-10-08T00:00:00 117.0822
## 5 2009-10-09T00:00:00 116.8312
## 6 2009-10-12T00:00:00 116.9347

如果你真的想bash你的头反复撞墙来对付疯狂的XML,你可以只使用xml2包(和read_xml)这些 Microsoft 文档中的命名空间。

您仍然需要进行 date/time 转换和数字转换。