我可以在方法链中使用 pd.drop 来删除特定行吗?

Can I use pd.drop in method chaining to drop specific rows?

我想知道在链接方法构建数据框时是否可以使用 pandas .drop 方法删除行。

一旦数据框存在,就可以直接删除行:

import pandas as pd

df1 = pd.DataFrame({'A': [1, 2, 3], 'B': [5, 4, 3]})
print(df1)

# drop the entries that match "2"
df1 = df1[df1['A'] !=2]
print(df1)

但是,我想在创建数据框时执行此操作:

df2 = (pd.DataFrame({'A': [1, 2, 3], 'B': [5, 4, 3]})
        .rename(columns={'A': 'AA'})
#        .drop(lambda x: x['A']!=2)
        )
print(df2)

注释行不起作用,但也许有正确的方法。感谢任何输入。

也许您可以尝试在定义行代码末尾使用“.loc”进行选择。

使用DataFrame.loc with callable:

df2 = (pd.DataFrame({'A': [1, 2, 3], 'B': [5, 4, 3]})
        .rename(columns={'A': 'AA'})
        .loc[lambda x: x['AA']!=2]
        )

DataFrame.query:

df2 = (pd.DataFrame({'A': [1, 2, 3], 'B': [5, 4, 3]})
        .rename(columns={'A': 'AA'})
        .query("AA != 2")
        )
print(df2)
   AA  B
0   1  5
2   3  3

您可以使用 DataFrame.apply with DataFrame.dropna:

df2 = (pd.DataFrame({'A': [1, 2, 3], 'B': [5, 4, 3]})
        .rename(columns={'A': 'AA'})
       .apply(lambda x: x if x['AA'] !=2 else np.nan,axis=1).dropna()
        )
print(df2)


    AA    B
0  1.0  5.0
2  3.0  3.0