每行具有不同标准偏差的 Numpy 数组

Question

我想要一个 NxM 矩阵，其中每行中的数字是从不同正态分布（相同 mean 但不同标准差）生成的随机样本。以下代码有效：

import numpy as np

mean = 0.0 # same mean
stds = [1.0, 2.0, 3.0] # different stds
matrix = np.random.random((3,10))

for i,std in enumerate(stds):
     matrix[i] = np.random.normal(mean, std, matrix.shape[1])

但是，此代码效率不高，因为涉及 for 循环。有更快的方法吗？

Answer 1

这个怎么样？

rows = 10000
stds = [1, 5, 10]

data = np.random.normal(size=(rows, len(stds)))
scaled = data * stds

print(np.std(scaled, axis=0))

输出：

[ 0.99417905  5.00908719 10.02930637]

这利用了两个正态分布可以通过线性缩放相互转换的事实（在这种情况下，乘以标准差）。在输出中，每一列（第二轴）将包含一个正态分布的变量，对应于 stds.

中的值

Answer 2

np.random.normal() is vectorized；您可以切换轴并转置结果：

np.random.seed(444)
arr = np.random.normal(loc=0., scale=[1., 2., 3.], size=(1000, 3)).T

print(arr.mean(axis=1))
# [-0.06678394 -0.12606733 -0.04992722]
print(arr.std(axis=1))
# [0.99080274 2.03563299 3.01426507]

也就是说，scale 参数是 column-wise 标准偏差，因此需要通过 .T 转置，因为你想要 row-wise输入。

每行具有不同标准偏差的 Numpy 数组

Numpy array with different standard deviation per row

python

numpy

normal-distribution

gaussian

vectorization