分区 R 脚本 and/or R 会话(环境)
Partitioning R script and/or R sessions (environment)
好吧,我很好奇一个问题,这将是有帮助和节省时间的,如果不是那不是世界末日。
我研究了一下,但找不到我真正想要的东西。还,
Running multiple R scripts/sessions
我检查了这个 link,但它对我帮助不大。
情况是我有一个大数据集(我尝试使用的测试数据大约有 6.5m 行和 50 列,我也很难将数据集实现到 R 中,我现在使用 60k 行进行分析和用于统计模型。(我试图了解如何操作数据并了解其行为,希望我希望将这些模型和操作整合到我对大数据集所做的所有工作中,即使不是所有 6.5 m 行,1 2m如果可以的话对我来说没问题)。
无论如何,另一个大问题是我的R环境。由于数据如此庞大,因此需要勤奋和大量工作。代码脚本大约有 3500 行,甚至还不到工作量的 15%。问题是通过创建新数据集、分配新模型、模型充分性检查和新模型等,所有这些都让我在环境中花费了新的东西,而我的环境就像 750mb(R session/profile)。我希望如果我划分 R 脚本或环境,我可以减少环境东西(配置文件)的大小。
任何想法都会很棒。感谢您的帮助。
编辑:创建一个干净的脚本并在一个干净的环境中启动后,数据库实现没有错误。以防像我这样遭受此实施问题的人。不过,不告诉这是唯一且准确的方法。
对于这个问题,我通常编写生成特定工作区的脚本,然后保留另一个脚本,其中包含指向所有脚本和保存的工作区的路径。
想象一下这个脚本:
## Dataset x
# Run script to create dataset x
source("pathtoscript.R")
# Save dataset x environment
save.image("pathtodatasetx.Rdata")
# Load dataset x environment
load("pathtodatasetx.Rdata")
这样我可以快速 运行 并在我进行任何更改时保存环境,或者将其加载到我的当前会话中。
好吧,我很好奇一个问题,这将是有帮助和节省时间的,如果不是那不是世界末日。
我研究了一下,但找不到我真正想要的东西。还, Running multiple R scripts/sessions 我检查了这个 link,但它对我帮助不大。
情况是我有一个大数据集(我尝试使用的测试数据大约有 6.5m 行和 50 列,我也很难将数据集实现到 R 中,我现在使用 60k 行进行分析和用于统计模型。(我试图了解如何操作数据并了解其行为,希望我希望将这些模型和操作整合到我对大数据集所做的所有工作中,即使不是所有 6.5 m 行,1 2m如果可以的话对我来说没问题)。
无论如何,另一个大问题是我的R环境。由于数据如此庞大,因此需要勤奋和大量工作。代码脚本大约有 3500 行,甚至还不到工作量的 15%。问题是通过创建新数据集、分配新模型、模型充分性检查和新模型等,所有这些都让我在环境中花费了新的东西,而我的环境就像 750mb(R session/profile)。我希望如果我划分 R 脚本或环境,我可以减少环境东西(配置文件)的大小。
任何想法都会很棒。感谢您的帮助。
编辑:创建一个干净的脚本并在一个干净的环境中启动后,数据库实现没有错误。以防像我这样遭受此实施问题的人。不过,不告诉这是唯一且准确的方法。
对于这个问题,我通常编写生成特定工作区的脚本,然后保留另一个脚本,其中包含指向所有脚本和保存的工作区的路径。
想象一下这个脚本:
## Dataset x
# Run script to create dataset x
source("pathtoscript.R")
# Save dataset x environment
save.image("pathtodatasetx.Rdata")
# Load dataset x environment
load("pathtodatasetx.Rdata")
这样我可以快速 运行 并在我进行任何更改时保存环境,或者将其加载到我的当前会话中。