回归分析

生成方程以描述一个或多个预测变量与响应变量之间的统计学关系,并预测新观测值。回归一般使用通过使平方残差之和最小化来导出方程的普通最小二乘法。

回归结果表明预测变量与响应之间关系的方向、大小和统计学显著性。

·    每个系数的符号表明关系的方向。  

·    系数表示保持模型中其他预测变量恒定时,预测变量的单位变化导致的响应平均变化。

·    每个系数的 P 值检验系数等于零(无效应)这一原假设。因此,较低的 p 值说明预测变量对模型而言是有意义的补充。

·    方程在给定预测变量值的情况下预测新观测值。

例如,您为一家薯片公司工作,该公司正在分析发货前影响每个包装内碎薯片百分比的因子(响应变量)。您正在进行回归分析,并以马铃薯相对其他成分的百分比和加工温度(摄氏度)作为两个预测变量。下面是简化的结果表。

回归方程: %碎薯片 = 4.231 - 0.044(马铃薯百分比)+ 0.023(加工温度 C)

预测变量

系数

P

常量

4.231

0.322

马铃薯百分比

-0.044

0.001

加工温度

0.023

0.020

R-Sq = 67.2%

回归结果表明,由于两个预测变量的 p 值都很低,因此它们都是显著的。这两个预测变量一共占碎薯片方差的 67.2%。具体地说:

·    马铃薯含量每增加 1%,碎薯片百分比预期会减少 0.044%。

·    加工温度每增加 1 摄氏度,碎薯片百分比预期会增加 0.023%。

·    为了预测马铃薯含量为 50% 且加工温度为 175C 时的碎薯片百分比,您计算出碎薯片的期望值为 4.831%。

注意

含一个预测变量的模型称为简单线性回归,否则称为多元线性回归。