1
大学物理综合设计实验
1.6.7.1 1.最小二乘法
1.最小二乘法

最小二乘法(又称最小平方法)是一种数学优化技术。它通过最小化误差的平方和寻找数据的最佳函数匹配(也称回归或拟合)。利用最小二乘法可以简便地求得未知的数据,并使得这些求得的数据与实际数据之间误差的平方和为最小。

数据拟合有很多分类,如一元拟合、多元拟合、直线(线性)拟合、曲线(非线性)拟合。以下以较为简单的二元线性拟合介绍最小二乘法的原理及应用。

(1)最小二乘法原理。

xi以直线形式组合成函数M,假定i=2(二元函数,M又称因变量;xi又称自变量),即有

对于方程(F6-1)的回归问题有两类,其一,已知一组自变量(x1、x2)测量值,通过最小二乘回归,拟合出系数a、b,以确定回归方程。其二,已知一组系数(a、b)为测量值,同样可以通过最小二乘方法,确定两个变量(x1、x2)。究其实质,两类是一样的问题,只是将两个系数和两个变量互换位置而已。以下讨论就是第二类问题。

若进行了K次测量,测得未知量的系数为ai,bi,并设函数在K次测量中结果为M1,M2,…,MK,则得测定方程组(也称矛盾方程组)

显然,在以上方程组中,不可能存在一组x1,x2值使k个方程均成立。以X1,X2表示各测定值的最佳值,且以ν1,ν2,…,νk表示各测定方程对应的残差,故

上述方程组称为误差方程组。

要使以上方程组中X1,X2为最佳值,按最小二乘法原理必有

要使得∑ν2i=∑[(aiX1+biX2)-Mi2为最小,必须满足下列条件:

由此得出正规方程组:

该式通常写成

在此省略了各变量的角标i;[aa]=a21+a22+…a2k;[aM]=a1M1+a2M2+…akMk;

其余类同。将上式写成行列式形式为

即可求出X1,X2

(2)最小二乘法运算结果的误差。

K个方程组成的方程组中的任一方程的标准差均为

又设ε1,ε2代表X1,X2最佳值的标准误差,即可从下式算得

(3)最小二乘法应用举例(以测汞第一激发电位为例)。

测得的数据曲线如图F6-1所示。写出如下的方程组:

在上述方程组中,有2个待求未知变量,但有5个方程,不可能找到一组Ve、Vc值使上述5个方程均成立,故要采用最小二乘法估算2个未知量。计算结果如表F6-1所示。

图F6-1 汞第一激发电位测试曲线

表F6-1 各量计算值

(Ve为第一激发电位,Vc为接触电势,νi为残差)

列出正规方程组:

解得:

Ve=4.92V, Vc=3.66V

将得到的Ve、Vc值代入式(F6-11),即得νi,从而得到最小值为0.024。可以解释为,对于矛盾方程组(F6-11),只有Ve=4.92V,Vc=3.66V,才会使得的值最小,因此该组值是最小二乘下的最佳值。