Pandas - 如何将 float64 转换为 timedelta 并自定义输出?
Pandas - How to convert from float64 to timedelta and customize the output?
我有一个包含以下列的 DF:
datetime datetime64[ns]
objid int64
delay timedelta64[ns]
延迟的输出示例是:`
0 days 00:04:59
出于某种原因,当我将此 DF 加载到 dcc.Store 会话变量时,
data = df.to_json()
return data
并在另一个回调中读回,
df = pd.read_json(data)
它returns以下类型:
datetime datetime64[ns]
objid int64
delay float64
现在同上例,延时输出为:
299000.0
我不确定它为什么返回 float64 而不是 timedelta64(可能是因为某些 NaN?)。
所以我在做:
df['delay'] = pd.to_timedelta(df['delay'], unit='s')
输出为:
P3DT11H3M20S
据我了解,它与原始结果不同,即使是 iso 格式也是如此。
我做错了什么?
如何从 float64 转换为 timedelta64[s],并将输出自定义为 %d %H:%M:%S
?
你的“timedelta”以毫秒为单位,而不是秒,所以使用unit="ms"
你可以得到你想要的格式如下
timedeltas = pandas.to_timedelta([299000,301000],unit="ms")
print(timedeltas)
print(timedeltas.map(str)) # maybe close enough?
fmt = "{days} {hours:02d}:{minutes:02d}:{seconds:02d}"
exact = timedeltas.map(lambda timedelta:fmt.format(**timedelta.components.__dict__))
print(exact)
使用[=12=时datetime和delay被改为ms ].使用 astype()
将其转换回来
import json
d = list(pd.date_range(dt.datetime(2020,7,1), dt.datetime(2020,7,2), freq="15min"))
df = pd.DataFrame({"datetime":d, "objid":[random.randint(0,100) for x in d], "delay":d - np.roll(d, 1)})
print(df.dtypes)
df2 = pd.DataFrame(json.loads(df.to_json()))
print(df2.dtypes)
df2 = df2.astype({"datetime":"datetime64[ms]","delay":"timedelta64[ms]"})
print(df2.dtypes)
print(df2[:10].to_string(index=False))
输出
datetime datetime64[ns]
objid int64
delay timedelta64[ns]
dtype: object
datetime int64
objid int64
delay int64
dtype: object
datetime datetime64[ns]
objid int64
delay timedelta64[ns]
dtype: object
datetime objid delay
2020-07-01 00:00:00 59 -1 days +00:00:00
2020-07-01 00:15:00 14 0 days 00:15:00
2020-07-01 00:30:00 42 0 days 00:15:00
2020-07-01 00:45:00 29 0 days 00:15:00
2020-07-01 01:00:00 85 0 days 00:15:00
2020-07-01 01:15:00 37 0 days 00:15:00
2020-07-01 01:30:00 59 0 days 00:15:00
2020-07-01 01:45:00 61 0 days 00:15:00
2020-07-01 02:00:00 63 0 days 00:15:00
2020-07-01 02:15:00 14 0 days 00:15:00
我有一个包含以下列的 DF:
datetime datetime64[ns]
objid int64
delay timedelta64[ns]
延迟的输出示例是:`
0 days 00:04:59
出于某种原因,当我将此 DF 加载到 dcc.Store 会话变量时,
data = df.to_json()
return data
并在另一个回调中读回,
df = pd.read_json(data)
它returns以下类型:
datetime datetime64[ns]
objid int64
delay float64
现在同上例,延时输出为:
299000.0
我不确定它为什么返回 float64 而不是 timedelta64(可能是因为某些 NaN?)。
所以我在做:
df['delay'] = pd.to_timedelta(df['delay'], unit='s')
输出为:
P3DT11H3M20S
据我了解,它与原始结果不同,即使是 iso 格式也是如此。
我做错了什么?
如何从 float64 转换为 timedelta64[s],并将输出自定义为 %d %H:%M:%S
?
你的“timedelta”以毫秒为单位,而不是秒,所以使用unit="ms"
你可以得到你想要的格式如下
timedeltas = pandas.to_timedelta([299000,301000],unit="ms")
print(timedeltas)
print(timedeltas.map(str)) # maybe close enough?
fmt = "{days} {hours:02d}:{minutes:02d}:{seconds:02d}"
exact = timedeltas.map(lambda timedelta:fmt.format(**timedelta.components.__dict__))
print(exact)
使用[=12=时datetime和delay被改为ms ].使用 astype()
import json
d = list(pd.date_range(dt.datetime(2020,7,1), dt.datetime(2020,7,2), freq="15min"))
df = pd.DataFrame({"datetime":d, "objid":[random.randint(0,100) for x in d], "delay":d - np.roll(d, 1)})
print(df.dtypes)
df2 = pd.DataFrame(json.loads(df.to_json()))
print(df2.dtypes)
df2 = df2.astype({"datetime":"datetime64[ms]","delay":"timedelta64[ms]"})
print(df2.dtypes)
print(df2[:10].to_string(index=False))
输出
datetime datetime64[ns]
objid int64
delay timedelta64[ns]
dtype: object
datetime int64
objid int64
delay int64
dtype: object
datetime datetime64[ns]
objid int64
delay timedelta64[ns]
dtype: object
datetime objid delay
2020-07-01 00:00:00 59 -1 days +00:00:00
2020-07-01 00:15:00 14 0 days 00:15:00
2020-07-01 00:30:00 42 0 days 00:15:00
2020-07-01 00:45:00 29 0 days 00:15:00
2020-07-01 01:00:00 85 0 days 00:15:00
2020-07-01 01:15:00 37 0 days 00:15:00
2020-07-01 01:30:00 59 0 days 00:15:00
2020-07-01 01:45:00 61 0 days 00:15:00
2020-07-01 02:00:00 63 0 days 00:15:00
2020-07-01 02:15:00 14 0 days 00:15:00