如何根据时间间隔将时间 Indexed Dask 数据帧输出到 csv

How to output a time Indexed Dask dataframe to csv based on time intervals

我有一个时间索引的数据帧,我想以 15 分钟的间隔输出到多个 csv 文件,有没有办法在不依赖应用或映射的情况下在 dask 中做到这一点?我使用的数据源可以全部在一个文件中,也可以分开,因此现有分区会有所不同。

处理此问题的最佳方法是使用 repartition to repartition the data into 15 minute partitions, and then use to_csv 输出到文件(每个分区创建一个文件)。

像这样的东西应该可以工作:

df.repartition(freq='15T').to_csv(...)