您的当前位置:首页正文

Logistic回归分析

2020-09-13 来源:汇智旅游网


Logistic回归分析

Logistic回归分析是与线性回归分析方法非常相似的一种多元统计方法。适用于因变量的取值仅有两个(即二分类变量,一般用1和0表示)的情况,如发病与未发病、阳性与阴性、死亡与生存、治愈与未治愈、暴露与未暴露等,对于这类数据如果采用线性回归方法则效果很不理想,此时用Logistic回归分析则可以很好的解决问题。

一、Logistic回归模型

设Y是一个二分类变量,取值只可能为1和0,另外有影响Y取值的n个自变量

X1,X2,...,Xn,记PP(Y1|X1,X2,...,Xn)表示在n个自变量的作用下Y取值为1的概率,

则Logistic回归模型为:

11exp(01X12X2...nXn)P

它可以化成如下的线性形式:

Pln01X12X2...nXn1P

通常用最大似然估计法估计模型中的参数。

二、Logistic回归模型的检验与变量筛选

根据R Square的值评价模型的拟合效果。

变量筛选的原理与普通的回归分析方法是一样的,不再重复。

三、Logistic回归的应用

(1)可以进行危险因素分析

计算结果各关于各变量系数的Wald统计量和Sig水平就直接反映了因素Xi对因变量

Y的危险性或重要性的大小。

(2)预测与判别

Logistic回归是一个概率模型,可以利用它预测某事件发生的概率。当然也可以进行判别分析,而且可以给出概率,并且对数据的要求不是很高。

四、SPSS操作方法

1.选择菜单

2.概率预测值和分类预测结果作为变量保存

其它使用默认选项即可。

例:试对临床422名病人的资料进行分析,研究急性肾衰竭患者死亡的危险因素和统计规律。

Logistic回归分析.sav

解:在SPSS中采用Logistic回归全变量方式分析得到:

(1)模型的拟合优度为0.755。

(2)对死亡有显著影响的变量有:5个(满足Sig<0.05)。

(3)分类的正确率为90.5%

(4)求出了回归系数,得到了预测概率与分类结果。

(5)还可以继续进行分析,比如逐步回归,剔出混杂因素。

因篇幅问题不能全部显示,请点此查看更多更全内容