使用包含浮点值的 np.lexsort 对 numpy 数组进行排序

Sorting numpy array with np.lexsort containing float values

我正在编写一个程序,根据特定公司内的能量值对氨基酸的名称进行排序。

我已经提取了相关数据到下面的numpy数组中。

我试过了

In[37]: Data = np.array([
 ['ASN 205', -9.64164],
 ['LEU 206', -8.985774],
 ['ASN 207', -7.314434],
 ['PRO 208', -4.105338],
 ['ASN 209', -2.092342],
 ['GLY 210', -2.101412],
 ['LYS 211', -2.483852],
 ['ARG 212', -24.20364],
 ['SER 213', -1.181002],
 ['VAL 214', 0.057618]])
In[38]: ind3 = np.lexsort((Data[:,0],Data[:,1]))
In[39]: Result = Data[ind3]
In[40]: Result
Out[40]: 
array([['SER 213', '-1.181002'],
       ['ASN 209', '-2.092342'],
       ['GLY 210', '-2.101412'],
       ['LYS 211', '-2.483852'],
       ['ARG 212', '-24.20364'],
       ['PRO 208', '-4.105338'],
       ['ASN 207', '-7.314434'],
       ['LEU 206', '-8.985774'],
       ['ASN 205', '-9.64164'],
       ['VAL 214', '0.057618']], 
      dtype='|S9')

但这里的问题是浮点值是按字典顺序排列的。我希望它根据它们的值进行排序,首先是 -24.20364,然后是 ...-2.483852。

我该怎么做?

解释:np.array 将所有传递的参数转换为适合所有参数的最大类型,即您的浮点数在第 1 行中转换。 您可以改为使用具有特定数据类型的元组,如下所示:

Data = np.array([
 ('ASN 205', -9.64164),
 ('LEU 206', -8.985774),
 ('ASN 207', -7.314434),
 ('PRO 208', -4.105338),
 ('ASN 209', -2.092342),
 ('GLY 210', -2.101412),
 ('LYS 211', -2.483852),
 ('ARG 212', -24.20364),
 ('SER 213', -1.181002),
 ('VAL 214', 0.057618)], dtype=[('f', '|S9'), ('g', float)])
ind3 = np.lexsort((Data['f'], Data['g']))
Result = Data[ind3]Out[8]:

输出:

array([('ARG 212', -24.20364), ('ASN 205', -9.64164),
       ('LEU 206', -8.985774), ('ASN 207', -7.314434),
       ('PRO 208', -4.105338), ('LYS 211', -2.483852),
       ('GLY 210', -2.101412), ('ASN 209', -2.092342),
       ('SER 213', -1.181002), ('VAL 214', 0.057618)], 
      dtype=[('f', 'S9'), ('g', '<f8')])