Panda DataFrames 中最小有序分类数据
Minimum of ordered categorical data in Panda DataFrames
我有一个 Pandas DataFrame,其中一个 Serie 包含有序的分类数据。此系列的某些值可能缺失 (NaN)。我想在不考虑 NaN 的情况下获得最小值,但我得到了奇怪的结果...
代码:
raw_cat = pd.Categorical(["a", "b", "c", "a"],
categories=["b", "c", "d"],
ordered=True)
s = pd.Series(raw_cat)
raw_cat.min(numeric_only=True), s.min(numeric_only=True)
输出:
('b', nan)
预期输出:
('b', 'b')
我误会了什么?谢谢你的帮助。
此问题是 Pandas 0.24.0 及更高版本的回归。它在 Pandas 0.24.2.
中是正确的
我有一个 Pandas DataFrame,其中一个 Serie 包含有序的分类数据。此系列的某些值可能缺失 (NaN)。我想在不考虑 NaN 的情况下获得最小值,但我得到了奇怪的结果...
代码:
raw_cat = pd.Categorical(["a", "b", "c", "a"],
categories=["b", "c", "d"],
ordered=True)
s = pd.Series(raw_cat)
raw_cat.min(numeric_only=True), s.min(numeric_only=True)
输出:
('b', nan)
预期输出:
('b', 'b')
我误会了什么?谢谢你的帮助。
此问题是 Pandas 0.24.0 及更高版本的回归。它在 Pandas 0.24.2.
中是正确的