Logistic回归分析
Logistic回归分析是与线性回归分析方法非常相似的一种多元统计方法。适用于因变量的取值仅有两个(即二分类变量,一般用1和0表示)的情况,如发病与未发病、阳性与阴性、死亡与生存、治愈与未治愈、暴露与未暴露等,对于这类数据如果采用线性回归方法则效果很不理想,此时用Logistic回归分析则可以很好的解决问题。
一、Logistic回归模型
设Y是一个二分类变量,取值只可能为1和0,另外有影响Y取值的n个自变量
X1,X2,...,Xn,记PP(Y1|X1,X2,...,Xn)表示在n个自变量的作用下Y取值为1的概率,
则Logistic回归模型为:
11exp(01X12X2...nXn)P
它可以化成如下的线性形式:
Pln01X12X2...nXn1P
通常用最大似然估计法估计模型中的参数。
二、Logistic回归模型的检验与变量筛选
根据R Square的值评价模型的拟合效果。
变量筛选的原理与普通的回归分析方法是一样的,不再重复。
三、Logistic回归的应用
(1)可以进行危险因素分析
计算结果各关于各变量系数的Wald统计量和Sig水平就直接反映了因素Xi对因变量
Y的危险性或重要性的大小。
(2)预测与判别
Logistic回归是一个概率模型,可以利用它预测某事件发生的概率。当然也可以进行判别分析,而且可以给出概率,并且对数据的要求不是很高。
四、SPSS操作方法
1.选择菜单
2.概率预测值和分类预测结果作为变量保存
其它使用默认选项即可。
例:试对临床422名病人的资料进行分析,研究急性肾衰竭患者死亡的危险因素和统计规律。
Logistic回归分析.sav
解:在SPSS中采用Logistic回归全变量方式分析得到:
(1)模型的拟合优度为0.755。
(2)对死亡有显著影响的变量有:5个(满足Sig<0.05)。
(3)分类的正确率为90.5%
(4)求出了回归系数,得到了预测概率与分类结果。
(5)还可以继续进行分析,比如逐步回归,剔出混杂因素。
因篇幅问题不能全部显示,请点此查看更多更全内容