dask 条件 select - 缺少 iloc

dask conditional select - iloc missing

我该如何实施

df.loc[df.some_string_column == '', 'some_string_column'] = np.nan

昏昏欲睡? Das 似乎不支持使用 bloc /loc 索引器。我得到的错误是

TypeError: '_LocIndexer' object does not support item assignment

一般来说,在 dask 中,您将不得不使用赋值来创建新的数据框,而不是改变现有的数据框;尽管语法相似,但正在创建一个新的计算图。在您的情况下,这可能类似于:

df['some_string_column'] = df.some_string_column.map(
    lambda x: x if x else np.nan))

df['some_string_column'] = df.some_string_column.where(
    df.some_string_column != '', np.nan)