Panda DataFrames 中最小有序分类数据

Minimum of ordered categorical data in Panda DataFrames

我有一个 Pandas DataFrame,其中一个 Serie 包含有序的分类数据。此系列的某些值可能缺失 (NaN)。我想在不考虑 NaN 的情况下获得最小值,但我得到了奇怪的结果...

代码:

raw_cat = pd.Categorical(["a", "b", "c", "a"],
                         categories=["b", "c", "d"],
                         ordered=True)
s = pd.Series(raw_cat)
raw_cat.min(numeric_only=True), s.min(numeric_only=True)

输出:

('b', nan)

预期输出:

('b', 'b')

我误会了什么?谢谢你的帮助。

此问题是 Pandas 0.24.0 及更高版本的回归。它在 Pandas 0.24.2.

中是正确的

https://github.com/pandas-dev/pandas/issues/25299