由于旧库,我无法在 hdinsights 中使用 dplyrXdf

I am unable to use dplyrXdf in hdinsights due to old libraries

我使用 RevoScaleR 和 dplyrXdf 编写了一个脚本,令我惊讶的是,当我使用 HDInsights(Microsoft Azure 管理的 Spark 集群服务)时,我安装了 R 3.3.3,但我无法安装 dplyrXdf,软件包也不在存储库,我也不能使用 devtools 从 git 安装,我设法在从它各自的 github 存储库更新每个依赖项后安装它,但这太疯狂了,花了我几个小时...... 最大的问题似乎是 dplyr 0.5,这是该服务的最新可用包(当前 CRAN 包是 0.7.4) 难道我做错了什么?可能是配置中的某些东西(比如选择了错误的集群类型)? 我无法相信 MS 会在 R 中投入这么多工作而不更新它的集群服务,我一定是在这里遗漏了一些东西。

您可以相当快速地安装所有依赖项 - 我花了大约 20 分钟。只需查看错误消息并安装所述的软件包即可。我只需要这些