R：使用目标值列按组插值多列

Question

有一个 15x6 数据框：

df <- data.frame(PART = c("A7","A7","A7","A7","A7","A1","A1","A1","A1","A1","A7","A7","A7","A7","A7"),
                 LIMIT = c(50,50,50,50,50,55,55,55,55,55,52.5,52.5,52.5,52.5,52.5),
                 MEAS = c(14.008,19.053,22.244,24.554,25.521,18.495,22.3,24.867,26.825,27.169,15.299,20.239,23.384,25.606,26.516),
                 MEAS_TARGET = c(16.5,16.5,16.5,16.5,16.5,21.2,21.2,21.2,21.2,21.2,21.5,21.5,21.5,21.5,21.5),
                 INT = c(1.5,2.5,3.5,4.5,5,2,3,4,5,5.2,1.5,2.5,3.5,4.5,5),
                 COL = c(-31.845,-25.51,-21.377,-18.537,-17.546,-41.1,-39.294,-36.813,-33.779,-33.361,-53.589,-49.664,-46.836,-43.581,-40.64))

我正在尝试按 PART 和 LIMIT 列进行分组，并在 MEAS = MEAS_TARGET 时使用线性插值在 INT 和 COL 列中查找缺失值并创建以下 18x6 数据帧结果：

result <- data.frame(PART = c("A7","A7","A7","A7","A7","A1","A1","A1","A1","A1","A7","A7","A7","A7","A7","A7","A1","A7"),
                 LIMIT = c(50,50,50,50,50,55,55,55,55,55,52.5,52.5,52.5,52.5,52.5,50,55,52.5),
                 MEAS = c(14.008,19.053,22.244,24.554,25.521,18.495,22.3,24.867,26.825,27.169,15.299,20.239,23.384,25.606,26.516,16.5,21.2,21.5),
                 MEAS_TARGET = c(16.5,16.5,16.5,16.5,16.5,21.2,21.2,21.2,21.2,21.2,21.5,21.5,21.5,21.5,21.5,16.5,21.2,21.5),
                 INT = c(1.5,2.5,3.5,4.5,5,2,3,4,5,5.2,1.5,2.5,3.5,4.5,5,1.99,2.7,2.9),
                 COL = c(-31.845,-25.51,-21.377,-18.537,-17.546,-41.1,-39.294,-36.813,-33.779,-33.361,-53.589,-49.664,-46.836,-43.581,-40.64,-28.716,-39.816,-48.53))

我尝试为每个组创建 NA 行并使用 and 但无法使其工作。如有任何建议，我们将不胜感激。

Answer 1

我们可以使用 complete 来包含 MEAS = MEAS_TARGET 的新行，并使用 zoo::na.approx.

插入 INT 和 COL 列

library(dplyr)
library(tidyr)

df %>%
  group_by(PART, LIMIT) %>%
  complete(MEAS = unique(c(MEAS, MEAS_TARGET))) %>%
  mutate(across(c(INT, COL), zoo::na.approx)) %>%
  fill(MEAS_TARGET) %>%
  ungroup

R：使用目标值列按组插值多列

R: Interpolation multiple columns by group using target values column

interpolation

r

dplyr

tidyverse