使用最大值改变 IF-Else 语句

Mutate IF-Else Statement using max value

我知道这应该很容易修复,但由于某些原因,我没有得到我正在搜索的正确输出。我有一个大型数据集,我试图根据两个条件创建一个新列,如果计数列标记为 1,如果该行具有最大支付,则创建一个标记为 1 的新列并标记其他列为 0。我创建了一个小示例:

ex <- data.frame(EOC = c(1,1,2,2,2),EOC_cnt = c(1,1,1,0,0), pay = c(500,0,200,12,34))

我想要的是:

ex <- data.frame(EOC = c(1,1,2,2,2),EOC_cnt = c(1,1,1,0,0), pay = c(500,0,200,12,34)),EOC_cnt1 = c(1,0,1,0,0)

我有:

out <- ex %>% group_by(EOC) %>% mutate(EOC_cnt1 = ifelse(EOC_cnt ==1 & pmax(pay) , "1", "0"))

这适用于这个较小的示例,但是当我将它应用于我的较大数据集时,我仍然没有得到每个 EOC 组的单个 1。有没有其他方法可以获得我正在寻找的结果?

(我的 EOC_cnt 列中基本上有重复项,我想创建一个新列,其中每个 EOC 只有一个 1)

这里是答案全为 0 的示例:

dput(ex2)
structure(list(pay = c(342.39, 48.27, 299.96, 274.12, 342.39, 
121.36), EOC = c(1, 1, 1, 1, 1, 1), EOC_cnt = c(0, 1, 0, 0, 0, 
0)), row.names = c(NA, -6L), class = c("data.table", "data.frame"
), .internal.selfref = <pointer: 0x000001cdf95a1ef0>)

我们不需要ifelse,可以用+as.integer

强制转换为二进制
ex %>% 
    group_by(EOC) %>% 
    mutate(EOC_cnt1 = +(pay == max(pay) & EOC_cnt == 1))

如果有重复,那么我们使用match找到第一个都为TRUE的位置

ex %>%
   group_by(EOC) %>%
   mutate(EOC_cnt1 =  +(row_number() %in% which(pay == max(pay) & EOC_cnt == 1)[1]))

根据新数据'ex2',不清楚是否只需要在'EOC_cnt'为1的元素中检查'pay'的max。在这种情况下,根据 'EOC_cnt' 1 值对 'pay' 进行子集化,取 max 并进行比较

ex2 %>% 
 group_by(EOC) %>% 
 mutate(EOC_cnt2 = +(pay == max(pay[EOC_cnt == 1]) & EOC_cnt == 1))