admin管理员组

文章数量:1531441

线性回归模型就属于监督学习里的回归模型。线性回归是通过属性的线性组合进行预测的函数,一元线性回归较为简单。这里我们主要介绍多元回归的直接解法------正规方程



可以表示为

且可求出,若要满足误差项最小:即将y投影到X上

注意这里若要使X’X可逆,必须满足x列向量线性无关。但但数据量很大的时候,很难满足,我们往往采用PCA或求伪逆

再得到模型后,我们还要进模型检验,验证模型的准确性:

t检验常能用作检验回归方程中各个参数的显著性,而f检验则能用作检验整个回归关系的显著性。各解释变量联合起来对被解释变量有显著的线性关系,并不意味着每一个解释变量分别对被解释变量有显著的线性关系

模型显著性检验(F检验)和系数显著性检验(t检验)


在对F的定义中,由于SSR和SSE之和是个定值,两者负相关。当SSE最小时,模型吻合最好。计算出F。再与理论值F比较。
回归系数显著性检验的出发点就是为了验证每一个变量是否能够成为重要因素。
每一个偏回归系数的t统计值,对应着概率值p,p小于0.05着拒绝原假设,否则,没通过显著性检验的变量不是影响利润的重要

本文标签: 线性模型