二元 Logistic 回归

拟合优度检验 - Hosmer-Lemeshow 检验

  

拟合 Logistic 模型时,您想要选择一个可以良好拟合数据的模型(链接函数和预测变量)。可以使用拟合优度统计量来比较不同模型的拟合。较低的 p 值表示预测概率以二项分布无法预测的方式偏离观测概率。

默认情况下,Minitab 提供三种拟合优度检验:Pearson、Deviance 和 Hosmer-Lemeshow。

Hosmer-Lemeshow 检验通过比较观测和预期频率来评定模型拟合。检验按估计的概率从低到高对数据进行分组,然后执行卡方检验来确定观测和预期频率之间是否存在显著差异。

输出示例

拟合优度检验
 
检验             自由度   卡方   P 值
偏差                 67  76.77  0.194
Pearson              67  76.11  0.209
Hosmer-Lemeshow       8   5.58  0.694
 
 
Hosmer-Lemeshow 检验的观测频率和预期频率
 
                     购买 = 1    购买 = 0
组   事件概率范围   观测  期望  观测  期望
 1  (0.000, 0.065)     1   0.4     6   6.6
 2  (0.065, 0.137)     1   0.7     6   6.3
 3  (0.137, 0.193)     1   1.1     6   5.9
 4  (0.193, 0.232)     0   1.5     7   5.5
 5  (0.232, 0.252)     2   1.7     5   5.3
 6  (0.252, 0.304)     1   2.0     6   5.0
 7  (0.304, 0.466)     4   2.8     3   4.2
 8  (0.466, 0.514)     4   3.5     3   3.5
 9  (0.514, 0.552)     5   4.3     3   3.7
10  (0.552, 0.568)     3   4.0     4   3.0
                                          

解释

对于这些谷类食品数据,检验中相对较大的 p 值 (0.694) 表明观测和预期频率是一致的。

组 = 4 时,这些值之间的差异最大:

·    值 = 1 时,观测频率是 0,但是预期为 1.5 个观测值。

·    值 = 0 时,观测频率是 7,但是预期只有 5.5 个观测值。

如果浏览一下观测和预期频率表,您可以发现 Obs 和 Exp 值通常非常接近。