如何在 dask 数据框中使用排名函数?
How to use the rank function in dask dataframe?
如何在 dask 数据帧上使用 pandas 的 pd.rank()
函数。
或者在 dask 中是否有任何替代的 inbuild 函数来做同样的事情。
目前不支持此操作。这很难并行进行,而且很少完全需要。您可以改为收集 nlargest
,然后根据计算出的 pandas 结果计算 pd.rank
?
或者,如果您尝试跨列计算排名,则可以使用 map_partitions
df.map_partitions(pd.rank, axis="columns")
如何在 dask 数据帧上使用 pandas 的 pd.rank()
函数。
或者在 dask 中是否有任何替代的 inbuild 函数来做同样的事情。
目前不支持此操作。这很难并行进行,而且很少完全需要。您可以改为收集 nlargest
,然后根据计算出的 pandas 结果计算 pd.rank
?
或者,如果您尝试跨列计算排名,则可以使用 map_partitions
df.map_partitions(pd.rank, axis="columns")