在 R 中并行 运行 的 Spawn 进程

Spawn process that run in parallel in R

我正在编写一个脚本,需要 运行 在 MySQL 数据库中连续存储信息。

然而,在一天中的某个时候,我想生成一些正在收集的数据的摘要,但是在同一个脚本中编写它会在执行这些摘要时停止收集数据。这是问题的草图:

while (1==1) {
    # get data and store it on the relational database

    # At some point of the day (or time interval) do some summaries
    if (time == certain_time) {
        source("analyze_data.R")
    }
}

问题是我希望数据收集不会停止,由计算机的另一个核心执行。

我看过对包 parallelmulticore 的引用,但我的印象是它们对应用于矢量或列表的重复性任务很有用。

在 R 之外执行逻辑:

编写2个脚本; 1 用 while 循环存储数据,另一个用检查。 运行 一个进程的 while 循环,就这样吧 运行ning.

与此同时,运行 您的另一个(检查脚本)按需获取数据。运行ch。或者,将其放入 cron 作业中。

在 R 之外有强大的工具来处理这种事情;为什么在 R 里面做?

您可以使用 parallel 来分叉一个进程,但您是对的,程序将永远等待所有分叉的进程在继续之前重新聚集在一起(这是 [=10 的用例) =]).

为什么不 运行 两个单独的 R 程序,一个收集数据,一个抓取数据?然后,您只需 运行 一个在后台连续播放,另一个在设定的时间播放。那么问题就变成了将数据从连续数据收集程序中取出并放入汇总程序中。