为 R 中的回归分析重新定义 Dataframe
Redefining Dataframe for Regression-Analysis in R
我有一个数据框,其中包含从 a 到 b 的多次运输的时间戳以及有关 material(体积、重量等)的信息。
我重新创建了原始 excel sheet 我使用的重要部分。
我的第一步是通过简单地减去日期来计算所需的时间,因为我只需要每天的精度。我将所有时间都放在一个数值向量中,以便于进一步计算和绘图。
但是:
我想对其进行回归分析。我知道如何制作电影。
我的问题是,由于几个 NA,我的 "transport days" 数值向量比 df 中的 cols 短。
我如何将 df 中的 cols 与我的数值向量合并,以便传输时间再次匹配几个 materials?
你在寻找类似
的东西吗
library(dplyr)
df %>%
mutate(diff = as.numeric(t4-t1))
然后你有一个时差列,而列列仍在 df 中。你可以告诉 lm()
如何处理 NA,所以你不需要删除它们(我也不认为你正在这样做)。
我有一个数据框,其中包含从 a 到 b 的多次运输的时间戳以及有关 material(体积、重量等)的信息。
我重新创建了原始 excel sheet 我使用的重要部分。
我的第一步是通过简单地减去日期来计算所需的时间,因为我只需要每天的精度。我将所有时间都放在一个数值向量中,以便于进一步计算和绘图。
但是: 我想对其进行回归分析。我知道如何制作电影。 我的问题是,由于几个 NA,我的 "transport days" 数值向量比 df 中的 cols 短。 我如何将 df 中的 cols 与我的数值向量合并,以便传输时间再次匹配几个 materials?
你在寻找类似
的东西吗library(dplyr)
df %>%
mutate(diff = as.numeric(t4-t1))
然后你有一个时差列,而列列仍在 df 中。你可以告诉 lm()
如何处理 NA,所以你不需要删除它们(我也不认为你正在这样做)。