使用计划 sql 拉取维护 R 包中的数据

Maintain data in R package with scheduled sql pulls

我有一个个人的、非 CRAN 的 R 包。它的目的是减少我需要做的重复争论的数量。数据必须从 sql 服务器中提取。来自 SQL 的拉动每周进行一次。我应该把我的 sql 文件放在哪里,我应该把每周定期 sql 拉取的 R 代码放在哪里?

您将需要创建一个 chron 任务来加载包、提取数据(参见 here)并重新编译包。

您是说您使用 SQL 从某处提取数据吗?你的数据来源是什么?或者你的意思是你写 SQL 来创建数据?

在不知道具体情况的情况下,你有两个选择: 1. 您可以使用 RODBC 包并使用 sqlQuery() 例如

Data<- sqlQuery(odbcDriverConnect(...),paste("SELECT 
                            *
                          FROM DTtest;"))

使用SQL从您的数据源'call'您的数据。您可以找到更多信息:https://www.statmethods.net/input/dbinterface.html 这样,您就不必担心将 sql 文件保存在哪里(我假设您指的是数据)。在这种情况下,您只需要确保您的工作目录正确链接到您的 R 脚本,或者至少确保您的 R 输出的位置。

  1. 假设,您有一个 SQL 脚本从其他地方提取数据,您可以 windows 调度程序或任何类型的调度程序来调度和 运行 脚本并进行输出保存在一个文件夹中,您还可以在其中使用 R 从该目录中获取数据。