如何在 Rstudio 中组合两个日期变量,只保留两个变量的最早日期?
How do I combine two date variables in Rstudio, keeping only earliest date from the two variables?
Rstudio 新手。在 Windows 上使用版本 0.99.491。由于我使用安全的服务器访问,我无法下载任何额外的包。
在一个有 450994 行和 92 个变量的数据集中,我目前使用以下三个变量
d$patient:patient的id-number,用于合并排列所有变量。 (因子 w. 320000 级别“123456789012”,...:NA 1 2 3 4 4 4 5 ...)
d$utiadm:首次入院日期(日期,格式:NA NA NA "2016-01-01" NA ...)
d$utiAB:抗生素首次赎回日期(日期,格式:NA "2016-01-02" NA NA NA ...)
日期表示为 "YYYY-MM-DD",我希望新日期保持不变。
一些患者已经入院并兑换了抗生素,而大多数患者要么已经入院,要么已经兑换了抗生素。对于那些只表达一个变量的人,我想将日期保留在新变量中。对于既有入院又有抗生素的,我想保留第一个来的日期,后面的就舍弃(如果他们先入院,那么我不在乎他们后来是否接受了抗生素)。
如何将两个日期变量组合成一个新的日期变量 (d$utiall),保留所有不重叠的日期,只保留它们重叠的第一个日期?
希望其他人可以受益 :)
d$utiall <- apply(d[c('utiadm', 'utiAB')], 1, min, na.rm = T)
如果某些行在两个变量中都是 NA,这会发出警告,但无论如何都将这些行编码为 NA。
无论如何它对我有用。
Rstudio 新手。在 Windows 上使用版本 0.99.491。由于我使用安全的服务器访问,我无法下载任何额外的包。
在一个有 450994 行和 92 个变量的数据集中,我目前使用以下三个变量
d$patient:patient的id-number,用于合并排列所有变量。 (因子 w. 320000 级别“123456789012”,...:NA 1 2 3 4 4 4 5 ...)
d$utiadm:首次入院日期(日期,格式:NA NA NA "2016-01-01" NA ...)
d$utiAB:抗生素首次赎回日期(日期,格式:NA "2016-01-02" NA NA NA ...)
日期表示为 "YYYY-MM-DD",我希望新日期保持不变。
一些患者已经入院并兑换了抗生素,而大多数患者要么已经入院,要么已经兑换了抗生素。对于那些只表达一个变量的人,我想将日期保留在新变量中。对于既有入院又有抗生素的,我想保留第一个来的日期,后面的就舍弃(如果他们先入院,那么我不在乎他们后来是否接受了抗生素)。
如何将两个日期变量组合成一个新的日期变量 (d$utiall),保留所有不重叠的日期,只保留它们重叠的第一个日期?
希望其他人可以受益 :)
d$utiall <- apply(d[c('utiadm', 'utiAB')], 1, min, na.rm = T)
如果某些行在两个变量中都是 NA,这会发出警告,但无论如何都将这些行编码为 NA。
无论如何它对我有用。