Numpy - np.arrays 到列表的自动隐式转换
Numpy - automatic implicit conversion of np.arrays into lists
我正在尝试制作其他 numpy.array's
的 numpy.array
,用于 Monte Carlo 模拟。我想获取数组的一个元素(另一个 1d 数组)并对其执行一些函数 returns 该数组的一个子部分,然后重新分配它。 最初所有数组的长度都相同,这似乎导致了问题。
我想做:例如
c1 = np.array([np.array(xi) for xi in [[1,2],[1],[1,3]]])
c1[2] = np.array([5])
效果很好给:
array([array([1, 2]), array([1]), array([5])], dtype=object)
当我进行转换时,我得到了相同类型的结构,使所有子数组的长度相同。
c2 = np.array([np.array(xi) for xi in [[1,2],[1],[1,3]]])
c2[1] = np.array([4,5])
给予
array([array([1, 2]), array([4, 5]), array([1, 3])], dtype=object).
相反发生的是:例如
当我开始所有长度相同的数组时,它们从 np.arrays
转换为 lists
。
c3 = np.array([np.array(xi) for xi in [[1,2],[1,2],[1,4]]])
这给出了
array([[1, 2], [1, 2], [1, 4]]).
现在,如果我尝试调整其中一个列表的长度
c3[1] = np.array([5])
我得到广播
array([[1, 2], [5, 5], [1, 4]])
当我想要
array([array([1, 2]), array([5]), array([1, 4])])
性能问题:
这都是为了 Monte Carlo 模拟,通常我希望处理一个包含大约 10'000 个子数组的数组,其中每个子数组是一个包含大约 1'000 个元素的数组(浮动)。我一直在使用 numpy,因为它的随机数生成速度非常快,而且它对向量化函数有很好的性能,具体来说我想最终对这些函数执行某种累积和(np.cumsum
),以及其他一些更深奥的职能。我能够用列表做这种事情,但它花费了大约 20 倍的时间,并且我希望尽可能优化。
非常感谢。
numpy 不允许您更改 np.arrays 的形状 np.arrays:
>>> c3 = np.array([np.array(xi) for xi in [[1,2],[1,2],[1,4]]])
>>> c4 = np.array([c3[:1],np.array([5]), c3[2:]])
Traceback (most recent call last):
File "<stdin>", line 1, in <module>
ValueError: could not broadcast input array from shape (2) into shape (1)
你可以做的是对 np.empty
使用 dtype=np.ndarry
:
>>> ourList = [[1,2],[1,2],[1,4]]
>>> c3 = np.empty(len(ourList), dtype=np.ndarray)
>>> for i in xrange(len(ourList)):
>>> c3[i] = np.array(outList[i])
>>> c3
array([array([1, 2]), array([1, 2]), array([1, 4])], dtype=object)
>>> c3[1] = np.array([5])
>>> c3
array([array([1, 2]), array([5]), array([1, 4])], dtype=object)
这是您要找的吗?
您可能只想输入一个零或一些不会影响模拟的巨大 negative/positive 数字:
>>> c3 = np.array([np.array(xi) for xi in [[1,2],[1,2],[1,4]]])
>>> c3[1] = np.array([5])
>>> c3
array([[1, 2],
[5, 5],
[1, 4]])
>>> c3[1][1] = -9999999
>>> c3
array([[ 1, 2],
[ 5, -9999999],
[ 1, 4]])
我正在尝试制作其他 numpy.array's
的 numpy.array
,用于 Monte Carlo 模拟。我想获取数组的一个元素(另一个 1d 数组)并对其执行一些函数 returns 该数组的一个子部分,然后重新分配它。 最初所有数组的长度都相同,这似乎导致了问题。
我想做:例如
c1 = np.array([np.array(xi) for xi in [[1,2],[1],[1,3]]])
c1[2] = np.array([5])
效果很好给:
array([array([1, 2]), array([1]), array([5])], dtype=object)
当我进行转换时,我得到了相同类型的结构,使所有子数组的长度相同。
c2 = np.array([np.array(xi) for xi in [[1,2],[1],[1,3]]])
c2[1] = np.array([4,5])
给予
array([array([1, 2]), array([4, 5]), array([1, 3])], dtype=object).
相反发生的是:例如
当我开始所有长度相同的数组时,它们从 np.arrays
转换为 lists
。
c3 = np.array([np.array(xi) for xi in [[1,2],[1,2],[1,4]]])
这给出了
array([[1, 2], [1, 2], [1, 4]]).
现在,如果我尝试调整其中一个列表的长度
c3[1] = np.array([5])
我得到广播
array([[1, 2], [5, 5], [1, 4]])
当我想要
array([array([1, 2]), array([5]), array([1, 4])])
性能问题:
这都是为了 Monte Carlo 模拟,通常我希望处理一个包含大约 10'000 个子数组的数组,其中每个子数组是一个包含大约 1'000 个元素的数组(浮动)。我一直在使用 numpy,因为它的随机数生成速度非常快,而且它对向量化函数有很好的性能,具体来说我想最终对这些函数执行某种累积和(np.cumsum
),以及其他一些更深奥的职能。我能够用列表做这种事情,但它花费了大约 20 倍的时间,并且我希望尽可能优化。
非常感谢。
numpy 不允许您更改 np.arrays 的形状 np.arrays:
>>> c3 = np.array([np.array(xi) for xi in [[1,2],[1,2],[1,4]]])
>>> c4 = np.array([c3[:1],np.array([5]), c3[2:]])
Traceback (most recent call last):
File "<stdin>", line 1, in <module>
ValueError: could not broadcast input array from shape (2) into shape (1)
你可以做的是对 np.empty
使用 dtype=np.ndarry
:
>>> ourList = [[1,2],[1,2],[1,4]]
>>> c3 = np.empty(len(ourList), dtype=np.ndarray)
>>> for i in xrange(len(ourList)):
>>> c3[i] = np.array(outList[i])
>>> c3
array([array([1, 2]), array([1, 2]), array([1, 4])], dtype=object)
>>> c3[1] = np.array([5])
>>> c3
array([array([1, 2]), array([5]), array([1, 4])], dtype=object)
这是您要找的吗?
您可能只想输入一个零或一些不会影响模拟的巨大 negative/positive 数字:
>>> c3 = np.array([np.array(xi) for xi in [[1,2],[1,2],[1,4]]])
>>> c3[1] = np.array([5])
>>> c3
array([[1, 2],
[5, 5],
[1, 4]])
>>> c3[1][1] = -9999999
>>> c3
array([[ 1, 2],
[ 5, -9999999],
[ 1, 4]])