使用 lubridate::month() 编写矢量化函数以生成财政年度
Writing vectorized function with lubridate::month() to produce fiscal year
我正在编写一个函数来获取日期并输出(6 月 30 日)会计年度月份,其中 7 月是 FY 月 1,8 月是 2,6 月是 12。
例如,给定两年的日期,我希望此数据的输出为 c(1:12, 1:12)
:
data.frame(perf_dt = seq.Date(from = as.Date("2019-07-01"),
to = as.Date("2021-06-01"),
by = "month"))
我现在的功能是这个。它包括可选地允许输出标签的逻辑。
FY_mo <- function(date, label = F, abbrev = F) {
a <- (5 + (lubridate::month(date) %% 12)) + 1
CY_num = lubridate::month(date)
ifelse(!label, a,
ifelse(abbrev,
month.abb[CY_num],
month.name[CY_num]))
}
当我为它提供单独的日期时,这会起作用。例如,来自 testthat
的测试通过:
test_that("FY_mo works on indiv input dates", {
expect_equal(7, FY_mo(as.Date("2020-01-01")))
expect_equal("January", FY_mo(as.Date("2020-01-01"), label = TRUE))
expect_equal("Jan", FY_mo(as.Date("2020-01-01"), label = TRUE, abbrev = TRUE))
})
但是当我给它一个向量时它不起作用。下面的代码输出所有“13”。
data.frame(perf_dt = seq.Date(from = as.Date("2019-07-01"),
to = as.Date("2021-06-01"),
by = "month")) %>%
dplyr::mutate(FY_mo = FY_mo(perf_dt)) %>%
dplyr::pull(FY_mo)
#[1] 13 13 13 13 13 13 13 13 13 13 13 13 13 13 13 13 13 13 13 13 13 13 13 13
我的错误在哪里?有没有更好的方法来构造函数以生成正确的向量输出?
这不是一个错误,但因为我们在这里使用 ifelse
来检查条件,并且 ifelse
returns 与 test
长度相同的向量。由于我们的 test
长度为 1 (length(!label)
),它 returns 只有第一个值并回收它。这里因为我们只有一个条件来检查,所以我们可以使用 if
/else
而不是 ifelse
来避免这个问题。
FY_mo <- function(date, label = F, abbrev = F) {
a <- match(lubridate::month(date), c(7:12, 1:6))
CY_num = lubridate::month(date)
if(!label) a
else if (abbrev) month.abb[CY_num]
else month.name[CY_num]
}
data.frame(perf_dt = seq.Date(from = as.Date("2019-07-01"),
to = as.Date("2021-06-01"),
by = "month")) %>%
dplyr::mutate(FY_mo = FY_mo(perf_dt)) %>%
dplyr::pull(FY_mo)
#[1] 1 2 3 4 5 6 7 8 9 10 11 12 1 2 3 4 5 6 7 8 9 10 11 12
我正在编写一个函数来获取日期并输出(6 月 30 日)会计年度月份,其中 7 月是 FY 月 1,8 月是 2,6 月是 12。
例如,给定两年的日期,我希望此数据的输出为 c(1:12, 1:12)
:
data.frame(perf_dt = seq.Date(from = as.Date("2019-07-01"),
to = as.Date("2021-06-01"),
by = "month"))
我现在的功能是这个。它包括可选地允许输出标签的逻辑。
FY_mo <- function(date, label = F, abbrev = F) {
a <- (5 + (lubridate::month(date) %% 12)) + 1
CY_num = lubridate::month(date)
ifelse(!label, a,
ifelse(abbrev,
month.abb[CY_num],
month.name[CY_num]))
}
当我为它提供单独的日期时,这会起作用。例如,来自 testthat
的测试通过:
test_that("FY_mo works on indiv input dates", {
expect_equal(7, FY_mo(as.Date("2020-01-01")))
expect_equal("January", FY_mo(as.Date("2020-01-01"), label = TRUE))
expect_equal("Jan", FY_mo(as.Date("2020-01-01"), label = TRUE, abbrev = TRUE))
})
但是当我给它一个向量时它不起作用。下面的代码输出所有“13”。
data.frame(perf_dt = seq.Date(from = as.Date("2019-07-01"),
to = as.Date("2021-06-01"),
by = "month")) %>%
dplyr::mutate(FY_mo = FY_mo(perf_dt)) %>%
dplyr::pull(FY_mo)
#[1] 13 13 13 13 13 13 13 13 13 13 13 13 13 13 13 13 13 13 13 13 13 13 13 13
我的错误在哪里?有没有更好的方法来构造函数以生成正确的向量输出?
这不是一个错误,但因为我们在这里使用 ifelse
来检查条件,并且 ifelse
returns 与 test
长度相同的向量。由于我们的 test
长度为 1 (length(!label)
),它 returns 只有第一个值并回收它。这里因为我们只有一个条件来检查,所以我们可以使用 if
/else
而不是 ifelse
来避免这个问题。
FY_mo <- function(date, label = F, abbrev = F) {
a <- match(lubridate::month(date), c(7:12, 1:6))
CY_num = lubridate::month(date)
if(!label) a
else if (abbrev) month.abb[CY_num]
else month.name[CY_num]
}
data.frame(perf_dt = seq.Date(from = as.Date("2019-07-01"),
to = as.Date("2021-06-01"),
by = "month")) %>%
dplyr::mutate(FY_mo = FY_mo(perf_dt)) %>%
dplyr::pull(FY_mo)
#[1] 1 2 3 4 5 6 7 8 9 10 11 12 1 2 3 4 5 6 7 8 9 10 11 12