二元 Logistic 回归

相关性度量

  

相关性度量表包含以下内容:

·    对信息,包含具有不同响应值的观测值对的数量和百分比,它们是一致对不一致对结对

·    Somers 的 D 显示存在的比不一致对一致的对数除以总对数。

·    Goodman-Kruskal Gamma 显示存在的比不一致对一致的对数除以剔除结对的总对数。

·    Kendall 的 Tau-a 显示存在的比不一致对一致的对数除以包括具有相同响应值的对在内的总观测值对数。

要创建用于这些统计量的对,每个观测到的“成功”都要和每个“失败”配对。然后注意,根据模型预测的实际“成功”的成功概率是否较高。

·    如果对应于“成功”的观测值的预测成功概率较高,该对应视为一致对。

·    如果对应于“失败”的观测值的预测成功概率较高,该对应视为不一致对。

·    如果观测的“成功”和“失败”的预测成功概率相同,该对应视为结对。

Somers 的 D、Goodman-Kruskal Gamma 和 Kendall 的 Tau-a 的值越大,表明模型的预测能力越强。

输出示例

相关性度量
 
配对    数量  百分比  度量结果综述             值
一致     786    72.9  Somer 的 D             0.47
不一致   283    26.3  Goodman-Kruskal Gamma  0.47
结         9     0.8  Kendall 的 Tau-a       0.20
合计    1078   100.0
 
相关性介于响应变量与预测概率之间
                                               

解释

对于谷类食品数据,72.9% 的对是一致对,26.3% 的对是不一致对。因此,某个对一致的几率比不一致的几率高 50%。

因为结对特别少,所以 Somers 的 D (0.47) 和 Goodman-Kruskal Gamma (0.47) 非常接近。它们以总对数百分比的形式说明存在的比较一致的对数。在此计算中,Somers 的 D 包括结对,Goodman-Kruskal Gamma 不包括。