在 R 中对大数据集使用 glm - 内存耗尽
using glm with large data set in R - memory exhausted
我有一个大型数据集(>600 万行和 12 列),我正在尝试对其执行逻辑回归。数据框的第一列名为 Dep1 并且具有 0 或 1 值。其他列是名称 Var1、Var2、...、Var11,是我感兴趣的自变量。数据框中的一些列是 factor 类型,而其他列是 num。我是 运行ning glm,电话如下:
mylogit <- glm(Dep1 ~ Var1 + Var2 + Var3 + Var4 + Var5 + Var6 + Var7 + Var8 + Var9 + Var10 + Var11,data=dataset,family=binomial())
当我使用所有变量调用 glm 时,我收到消息:
Error: vector memory exhausted (limit reached?)
我可以 运行 glm 使用较小的变量集,例如只有 Var1 到 Var4,但我想用所有变量检查它。有任何解决此错误的建议吗?
我最终按照步骤 进行操作,并且在我重新启动 R 后似乎已经解决了我的问题。
我有一个大型数据集(>600 万行和 12 列),我正在尝试对其执行逻辑回归。数据框的第一列名为 Dep1 并且具有 0 或 1 值。其他列是名称 Var1、Var2、...、Var11,是我感兴趣的自变量。数据框中的一些列是 factor 类型,而其他列是 num。我是 运行ning glm,电话如下:
mylogit <- glm(Dep1 ~ Var1 + Var2 + Var3 + Var4 + Var5 + Var6 + Var7 + Var8 + Var9 + Var10 + Var11,data=dataset,family=binomial())
当我使用所有变量调用 glm 时,我收到消息:
Error: vector memory exhausted (limit reached?)
我可以 运行 glm 使用较小的变量集,例如只有 Var1 到 Var4,但我想用所有变量检查它。有任何解决此错误的建议吗?
我最终按照步骤