用 numpy lstsq 计算残差

calculation of residuals with numpy lstsq

我有 x,y 数据:

import numpy as np
x = np.array([ 2.5, 1.25, 0.625, 0.3125, 0.15625, 0.078125])
y = np.array([ 2448636.,1232116.,617889.,310678.,154454.,78338.])

X = np.vstack((x, np.zeros(len(x))))
popt,res,rank,val = np.linalg.lstsq(X.T,y)
popt,res,rank,val

给我:

(array([ 981270.29919414,       0.        ]),
 array([], dtype=float64),
 1,
 array([ 2.88639894,  0.        ]))

为什么残差为零?如果我添加一个而不是零,则计算残差:

X = np.vstack((x, np.ones(len(x)))) # added ones instead of zeros
popt,res,rank,val = np.linalg.lstsq(X.T,y)
popt,res,rank,val

(array([ 978897.28500355,    4016.82089552]),
array([ 42727293.12864216]),
2,
array([ 3.49623683,  1.45176681]))

此外,如果我计算 excel 中的残差平方和,如果截距设置为零,我会得到 9261214,如果将截距设置为 x,我会得到 5478137

lstsq 将很难适应该列的零:相应参数的任何值(可能是截距)都可以。

要将截距固定为 0,如果这是您需要做的,只需发送 x 数组,但要确保它的形状适合 lstsq:

In [214]: popt,res,rank,val = np.linalg.lstsq(np.atleast_2d(x).T,y)
In [215]: popt
Out[215]: array([ 981270.29919414])
In [216]: res
Out[216]: array([ 92621214.2278382])