1、首先我了解一下回归直线的原理。如果散点图中点的分布从整体看大致在一条直线附近,我们就称这两个变量之间具有线性相关关系,这条直线叫做回归直线。根据不同的标准,可以画出不同的直线来近似表示这种线性相关关系。
2、先求 x、y 的平均数 x_=(3+4+5+6)/4=9/2,y_=(2.5+3+4+4.5)/4=7/2,然后求对应的 x、y 的乘积之和 :3*2.5+4*3+5*4+6*4.5=66.5 ,x_*y_=63/4 ,接着计算 x 的平方之和:9+16+25+36=86,x_^2=81/4 ,现在可以计算 b 了:b=(66.5-4*63/4) / (86-4*81/4)=0.7 ,而 a=y_-bx_=7/2-0.7*9/2=0.35 ,所以回归直线方程为 y=bx+a=0.7x+0.35 。
3、还可用最小二乘法:总离差不能用n个离差之和来表示,通常是用离差的平方和,即7a6431333366303162作为总离差,并使之达到最小,这样回归直线就是所有直线中Q取最小值的那一条,这种使“离差平方和最小”的方法,叫做最小二乘法。
4、用最小二乘法求:由于绝对值使得计算不变,在实际应用中人们更喜欢用:Q=(y1-bx1-a)?+(y2-bx2-a)?+······+(yn-bxn-a)?,这样,问题就归结于:当a,b取什么值时Q最小,即到点直线y=bx+a的“整体距离”最小。
KaoJiaZhao.Com