Numpy根据mask生成全局数组的子集

Numpy generation of subsets of global array based on mask

我有兴趣根据使用 numpy 的匹配布尔掩码为特定轴从全局二维数组生成 np.array 的列表(或 np.array)。我想知道是否可以使用 np.ma.mask() 或类似的...

举个例子可能更好:

number= 10
x = np.linspace(0,number,num=number+1,dtype=int)
B = np.vstack((x%3==0, x%2==0, x%1==0))
X = np.vstack((x//3, x//2, x-1))

list_ = []
for i in range(1,number+1):
    pointer = X[:,i][B[:,i]]
    list_.append(pointer)

print(list_)
[array([0]), array([1, 1]), array([1, 2]), array([2, 3]), array([4]), array([2, 3, 5]), array([6]), array([4, 7]), array([3, 8]), array([5, 9])]

在 for 循环中,我基本上是根据布尔掩码 B 在二维数组 X 中提取 axis=1 上的值。我通过遍历 axis=0 并选择 X[:,i 来实现此目的][双]]。我想知道是否可以在没有循环的情况下执行此操作,因为范围可能非常大,并且完全在 numpy 中执行,也许在 np.ma.array(X,mask=B)?[= 上使用 where 语句11=]

干杯!

以下是我将遵循的以矢量化方式解决案例的步骤 -

  1. 使用 boolean indexing 到 select 来自 X 的有效元素。
  2. 获取我们看到列索引为输入掩码移动的索引。这将在转置掩码后实现,使用 np.where 和 selecting 第一个输入参数。
  3. 最后,使用这些索引,拆分在步骤 1 中获得的有效元素数组。

实现看起来像这样 -

cut_idx = np.unique(np.where(B[:,1:].T)[0],return_index=True)[1]
out_list_ = np.split(X[:,1:].T[B[:,1:].T],cut_idx[1:])