如何确定数据点的回归线(理论)?
How to determine the regression line for the data points(Theory)?
确定以下数据点的回归线:
(x1, y1) = (1, 4), (x2, y2) = (2, 3), (x3, y3) = (3, 9)
即function h(x) = w + hx
最小化此数据的平方误差损失。
这个问题归结为数学。
首先,我们编写误差函数
误差函数的导数告诉我们当我们改变变量时误差是如何变化的。因为有两个变量(m和b),所以它是一个偏导数。当导数等于零时,我们知道我们已经达到最小值(并且因为我们正在采用二次导数,我们知道有一个全局最小值)。
写出总和中的每一项给我们
两个变量,两个方程意味着我们可以同时求解!
在你的例子中,我们有 h=m 和 w=b
作为双重检查,Desmos 是一个很棒的工具https://www.desmos.com/calculator
确定以下数据点的回归线:
(x1, y1) = (1, 4), (x2, y2) = (2, 3), (x3, y3) = (3, 9)
即function h(x) = w + hx
最小化此数据的平方误差损失。
这个问题归结为数学。
首先,我们编写误差函数
误差函数的导数告诉我们当我们改变变量时误差是如何变化的。因为有两个变量(m和b),所以它是一个偏导数。当导数等于零时,我们知道我们已经达到最小值(并且因为我们正在采用二次导数,我们知道有一个全局最小值)。
写出总和中的每一项给我们
两个变量,两个方程意味着我们可以同时求解!
在你的例子中,我们有 h=m 和 w=b
作为双重检查,Desmos 是一个很棒的工具https://www.desmos.com/calculator