使用 pandas 根据条件动态移动日期
Shift dates on the fly based on a condition using pandas
我有一个如下所示的数据框
df1 = pd.DataFrame({'person_id': [11, 21, 31, 41, 51],
'date_1': ['12/30/1961', '05/29/1967', '02/03/1957', '7/27/1959', '01/13/1971'],
'backward': [0,120,1,2,3],
'forward': [0,12,1,0,0]})
df1['date_1'] = pd.to_datetime(df1['date_1'])
我想做的是
1) 根据 forward
列中的值向前移动 date_1
列(添加日期)。
2) 如果 forward
列的值为 0
,则从 backward
中选取值并移动日期 backward
(减去日期)
3) 如果 forward
和 backward
都是 0
,它不会像我们 add/subtract 0 days to date
那样对日期产生任何影响。出于编码目的,如果您仍然想知道选择哪一列,那么我们可以考虑 backward
列。
这是我试过的
df1['new_date'] = df1['date_1'].sub(pd.to_timedelta(df1['forward'],unit='d'))
df1['bool'] = df1['date_1'].eq(df1['new_date']) # i do this to find out which rows aren't changed. So I can look at backward column to subtract days for these records
df1.loc[df1.bool == True, "new_date"] = df1['date_1'].sub(pd.to_timedelta(df1['backward'],unit='d'))
我希望我的输出如下所示。如您所见,对于最后两行和第一行,forward
列的值为 0,因此我们从 backward
列和 subtract the dates
中选取值
您可以使用 mask
on forward 将 0 替换为 minus backward 列,然后将 to_timedelta
这个系列添加到日期
df1['new_date'] = (df1['date_1']
+ pd.to_timedelta(df1['forward'].mask(lambda x: x.eq(0),
-df1['backward']),
unit='d')
)
print (df1)
person_id date_1 backward forward new_date
0 11 1961-12-30 0 0 1961-12-30
1 21 1967-05-29 120 12 1967-06-10
2 31 1957-02-03 1 1 1957-02-04
3 41 1959-07-27 2 0 1959-07-25
4 51 1971-01-13 3 0 1971-01-10
我有一个如下所示的数据框
df1 = pd.DataFrame({'person_id': [11, 21, 31, 41, 51],
'date_1': ['12/30/1961', '05/29/1967', '02/03/1957', '7/27/1959', '01/13/1971'],
'backward': [0,120,1,2,3],
'forward': [0,12,1,0,0]})
df1['date_1'] = pd.to_datetime(df1['date_1'])
我想做的是
1) 根据 forward
列中的值向前移动 date_1
列(添加日期)。
2) 如果 forward
列的值为 0
,则从 backward
中选取值并移动日期 backward
(减去日期)
3) 如果 forward
和 backward
都是 0
,它不会像我们 add/subtract 0 days to date
那样对日期产生任何影响。出于编码目的,如果您仍然想知道选择哪一列,那么我们可以考虑 backward
列。
这是我试过的
df1['new_date'] = df1['date_1'].sub(pd.to_timedelta(df1['forward'],unit='d'))
df1['bool'] = df1['date_1'].eq(df1['new_date']) # i do this to find out which rows aren't changed. So I can look at backward column to subtract days for these records
df1.loc[df1.bool == True, "new_date"] = df1['date_1'].sub(pd.to_timedelta(df1['backward'],unit='d'))
我希望我的输出如下所示。如您所见,对于最后两行和第一行,forward
列的值为 0,因此我们从 backward
列和 subtract the dates
您可以使用 mask
on forward 将 0 替换为 minus backward 列,然后将 to_timedelta
这个系列添加到日期
df1['new_date'] = (df1['date_1']
+ pd.to_timedelta(df1['forward'].mask(lambda x: x.eq(0),
-df1['backward']),
unit='d')
)
print (df1)
person_id date_1 backward forward new_date
0 11 1961-12-30 0 0 1961-12-30
1 21 1967-05-29 120 12 1967-06-10
2 31 1957-02-03 1 1 1957-02-04
3 41 1959-07-27 2 0 1959-07-25
4 51 1971-01-13 3 0 1971-01-10