索引 numpy 数组的总和

Sum of indexed numpy arrays

假设我有一个索引数组:

I=[0 1 2 3 0 3]

值数组:

W=[w0, w1, w2, w3]

如何使用如下生成的矢量化 numpy 表达式创建数组 X

X = np.zeros(I.max() + 1)
for i in range(len(I)):
   X[I[i]] += W[I[i]]

在上面的例子中X=[w0+w0, w1, w2, w3+w3]

从可复制的对象开始

>>> I = np.r_[0, 1, 2, 3, 0, 3]
>>> W = np.r_[60, 50, 40, 30, 20, 10]
>>> M = W[I]

然后注意其中一个有

>>> W[I]
array([60, 50, 40, 30, 60, 30])
>>> W[W[I]==W]
array([60, 50, 40, 30])
>>> np.unique(W[I], return_counts=True)[1]
array([2, 1, 1, 2])

最后,干什么

>>> W[M==W]*np.unique(M, return_counts=True)[1] #  X
array([120, 50, 40, 60])

让我们(几乎)用字符串来做到这一点

>>> W = np.array(['w0', 'w1', 'w2', 'w3', 'w4', 'w5'])
>>> M = W[I]
>>> M
array(['w0', 'w1', 'w2', 'w3', 'w0', 'w3'], dtype='|S2')
>>> W[M==W]
array(['w0', 'w1', 'w2', 'w3'], dtype='|S2')
>>> np.unique(W[I], return_counts=True)[1]
array([2, 1, 1, 2])

这导致心理上的考虑

>>> [2*'w0', 'w1', 'w2', 2*'w3']