Python :通过仅将数字保持在两个限制之间来减少数组

Python : Reduce an array by only keeping number between two limits

我有一个数组矩阵 Nx4,我想通过只保留第二列和第三列特定范围内的值来减少它。我写了一个不起作用的代码,因为它不计算我已经在减少数组。

data/array 示例:

1   358 33  7.1
2   659 85  7.1
3   111 145 7.1
4   558 116 7.1
5   632 40  7.1
6   415 335 7.1
7   207 30  7.1
8   564 47  7.1
9   352 41  7.1
10  700 570 7.1
11  275 499 7.1
12  482 177 7.1
13  737 565 7.1
14  298 43  7.1
15  155 195 7.1
16  598 417 7.1
17  93  313 7.1
18  1150    597 7.1
19  410 451 7.1
20  34  793 7.1
21  997 904 7.1
22  1024    452 7.1
23  740 128 7.1
24  522 86  7.1
25  679 643 7.1
26  973 37  7.1
27  372 42  7.1

例如,我想为第二列保留范围 = [80, 2000] 中的值,为第三列保留范围 = [130, 2000] 中的值。我的真实数组有超过 1'000'000 行。

这是我的代码:

def filter_data(data, XRANGE, YRANGE) :

    data_f = np.copy(data)

    for l in range(len(data_f)) :

        if XRANGE[0] < data_f[l,1] < XRANGE[1] and YRANGE[0] < data_f[l,1] < YRANGE[1] :

            pass
        
        else :

            data = np.delete(data, l, axis=0)

    return data

我怎样才能以不同的方式更有效地做事?

您可以通过使用掩码并通过计算它们的逐点乘积来组合它们(相当于 AND 布尔运算符):

>>> x_range, y_range = [0, 2], [0, 5]

>>> data
array([[ 1,  2,  3],
       [ 1,  1,  1],
       [ 5,  1,  7],
       [ 1, 10,  2]])

先根据data[:, 0]data[:, 1]的约束构造两个mask:

>>> x_mask = (data[:,0] > x_range[0])*(data[:,0] < x_range[1])
array([ True,  True, False,  True])


>>> y_mask = (data[:,1] > y_range[0])*(data[:,1] < y_range[1])
array([ True,  True,  True, False])

基本上生成的掩码等同于 x > x_min & x < x_max & y > y_min & y < y_max:

>>> x_mask*y_mask
array([ True,  True, False, False])

>>> data[x_mask*y_mask]
array([[1, 2, 3],
       [1, 1, 1]])

这是我认为你在谈论的内容的一个简单示例。

我首先创建一个示例数组 (n,3)。

然后我找到第二列和第三列中的值超过某个值的地方(我们称它为 4),并将此乘以数组与第二列和第三列的原始值相乘。

最后将这个新数组连接到原始数组的第一列,如下所示

a = np.asarray([[2,3,4],
                [3,4,5],
                [4,5,6],
                [10,12,14]])
val = 4
b = a[:,1:3] > val
c = a[:,1:3]*b

np.concatenate((a[:,0:1],c),axis=1)

编辑:更新示例后:for (n,4) array

a = np.asarray([[2,3,4,5],
                [3,4,5,6],
                [4,5,6,8],
                [10,12,14,9]])

val = 4
b = a[:,1:3] > val
c = a[:,1:3]*b

np.concatenate((a[:,0:1],c,a[:,3:4]),axis=1)