numpy 条件列表成员元素明智

numpy conditional list membership element wise

我有一个二维 numpy 数组:

a = np.array([[0,1],
              [2,3]])

我有一个要保留的值列表:

vals_keep = [1,2]

我想测试数组中每个元素的列表成员资格。类似于:

mask = a in vals_keep

我想要的结果:

array([[False,  True],
       [True,  False]])

这是一种使用广播的方法:

In [35]: (a[:, :, None] == vals_keep).any(2)
Out[35]: 
array([[False,  True],
       [ True, False]])

对于小型数组(少于 100 行),它比 isin 更快:

In [37]: %timeit np.isin(a, vals_keep)
22 µs ± 728 ns per loop (mean ± std. dev. of 7 runs, 10000 loops each)

In [38]: %timeit (a[:, :, None] == vals_keep).any(2)
12.6 µs ± 95.7 ns per loop (mean ± std. dev. of 7 runs, 100000 loops each)

对于大型数组,最好使用 isin,因为 3D 广播对于大型 arrays/matrices 不是很有效。

您可以使用isin

isin is an element-wise function version of the python keyword in

np.isin(a, vals_keep)

array([[False,  True],
       [ True, False]])

isin 的另一个好处是它可以灵活处理不同维度的数组:

a = np.arange(4).reshape(1,2,2,1)
np.isin(a, vals_keep)

array([[[[False],
         [ True]],

        [[ True],
         [False]]]])