np.vectorize 将二维 numpy 数组作为输入失败

Question

我正在尝试向量化一个以 numpy 数组作为输入的函数。我有一个二维 numpy 数组（形状为 1000,100），该函数将应用于 1000 行中的每一行。我尝试使用 np.vectorize 对函数进行矢量化。这是代码：

def fun(i):
    print(i)
    location = geocoder.google([i[1], i[0]], method="reverse")
    #print type(location)
    location = str(location)
    location = location.split("Reverse")
    if len(location) > 1:
        location1 = location[1]
    return [i[0], i[1], location1]

#using np.vectorize
vec_fun = np.vectorize(fun)

引发错误

<ipython-input-19-1ee9482c6161> in fun(i)
      1 def fun(i):
      2     print(i)
----> 3     location = geocoder.google([i[1], i[0]], method="reverse")
      4     #print type(location)
      5     location = lstr(location)

IndexError: invalid index to scalar variable.

我打印了传递给 fun 的参数，它打印单个值（向量的第一个元素）而不是向量（1 行），这是索引错误的原因，但我是不知道如何解决这个问题。

Answer 1

vectorize 对数组的每个元素运行您的函数，因此这不是正确的选择。改为使用常规循环：

for row in some_array:
    i0, i1, loc = fun(row)

要对输出做什么取决于您。请记住，如果 len(location) <= 1，您的函数不会分配 location1，并且在这种情况下会引发错误。它还 returns 第三个输出中的字符串而不是数值。

一旦你解决了这些问题，如果你想制作一个输出数组：

output = np.empty((some_array.shape[0], 3))
for i, row in enumerate(some_array):
    output[i, :] = fun(row)

Answer 2

到这个时候我想你已经解决了你的问题。但是，我刚刚找到了解决此问题的方法，并且可能会帮助其他有相同问题的人。您可以将 signature="str" 参数传递给 np.vectorize 以指定输入和输出形状。例如，签名 "(n) -> ()" 需要长度为 (n)（行）的输入形状并输出标量 ()。因此，它将广播最多行：

def my_sum(row):
    return np.sum(row)

row_sum = np.vectorize(my_sum, signature="(n) -> ()")

my_mat = np.array([
    [1, 1, 1],
    [2, 2, 2],
])

row_sum(my_mat)
OUT: array([3, 6])

np.vectorize 将二维 numpy 数组作为输入失败

np.vectorize fails on a 2-d numpy array as input

python

numpy

vectorization