使用 `or`b 布尔值查询 pandas 数据框?

Query pandas data frame with `or`b boolean?

我有一个简单的 pandas 数据框。

import pandas as pd    
x = [5, 10, 20, 30, 5, 10, 20, 30, 5, 10, 20, 30]
y = [100, 100, 200, 200, 300, 300, 400, 400, 500, 500, 600, 600]
users =['mark', 'mark', 'mark', 'rachel', 'rachel', 'rachel', 'jeff', 'jeff', 'jeff', 'lauren', 'lauren', 'lauren']

df = pd.DataFrame(dict(x=x, y=y, users=users)

我想保留数据框的某些行。假设所有 "rachels" 和 "jeffs"。我试过 df.query:

df=df.query('users=="rachel"' or 'users=="jeff"')

结果是只有users=="rachel"的数据框。有没有办法合并查询?

标准方法是使用按位或运算符 |。为了清楚地解释原因,我建议查看 this answer。由于 Python 的评估顺序,您还需要在每个条件周围使用括号。

df[(df.users == 'rachel') | (df.users == 'jeff')]
    users   x    y
3  rachel  30  200
4  rachel   5  300
5  rachel  10  300
6    jeff  20  400
7    jeff  30  400
8    jeff   5  500

使用查询,您仍然可以只使用 or 运算符:

df.query("users=='rachel' | users=='jeff'")
    users   x    y
3  rachel  30  200
4  rachel   5  300
5  rachel  10  300
6    jeff  20  400
7    jeff  30  400
8    jeff   5  500

另一种方式是:

df=df.query('users=="rachel"').append(df.query('users=="jeff"'))