Content
Logistic regression Conditional logistic regression Application
讲述内容:{dy}节 logistic回归第二节 条件logistic回归第三节 logistic回归的应用 及其注意事项
目的:作出以多个自变量(危险因素)估计应变量(结果因素)的logistic回归方程.属于概率型非线性回归.资料:1. 应变量为反映某现象发生与不发生的二值变量;2. 自变量宜全部或大部分为分类变量,可有少数数值变量.分类变量要数量化.
用途:研究某种疾病或现象发生和多个危 险因素(或保护因子)的数量关系.用 检验(或u检验)的局限性: 1.只能研究1个危险因素; 2.只能得出定性结论.
种类: 1. 成组(非条件)logistic回归方程. 2. 配对(条件)logistic回归方程.
{dy}节 logistic回归 (非条件logistic回归 )
一、基本概念
,
在m个自变量的作用下阳性结果发生的概率记作:
若令:
回归模型
概率P:0~1,logitP:-∞~∞.
取值范围
图16-1 logistic函数的图形
模型参数的意义
常数项 表示暴露剂量为0时个体发病与不发病概率之比的自然对数.回归系数 表示自变量 改变一个单位时logitP 的改变量.
流行病学衡量危险因素作用大小的比数比例指标.计算公式为:
优势比OR(odds ratio)
与logisticP 的关系:
二、logistic回归模型的参数估计
参数估计 原理:{zd0}似然( likelihood )估计
2. 优势比估计 可反映某一因素两个不同水平(c1,c0)的优势比.
例16-1 表16-1是一个研究吸烟、饮酒与食道癌关系的病例-对照资料,试作logistic回归分析.
确定各变量编码
表16-1 吸烟与食道癌关系的病例-对照调查资料
经logistic回归计算后得:
的95可信区间:
三、logistic回归模型的假设检验
2.
1.似然比检验
方法:前进法、后退法和逐步法.检验统计量:不是 F 统计量,而是似然比统计量、Wald 统计量和计分统计量之一.
四、变量筛选
例16-2 为了探讨冠心病发生的有关危险因素,对26例冠心病病人和28例对照者进行病例对照研究,各因素的说明及资料见表16-2和表16-3.试用logistic 逐步回归分析方法筛选危险因素.
表16-2 冠心病8个可能的危险因素与赋值
表16-3 冠心病危险因素的病例对照调查资料
表16-4 例16-2进入方程中的自变量及有关参数的估计值
学会看结果!
一、原理
第二节 条件logistic回归
表16-5 1: M 条件logistic回归数据的格式
* t = 0 为病例,其他为对照
条件 logistic 模型
二、应用实例
表16-7 喉癌1:2配对病例对照调查资料整理表
P344:
表16-8 例16-3进入方程中的自变量及有关参数的估计值
采用逐步法
6个危险因素 变量筛选 4个进方程,结果见表16-9.
一、logistic回归的应用1.流行病学危险因素分析 logistic回归分析的特点之一是参数意义清楚,即得到某一因素的回归系数后,可以很快估计出这一因素在不同水平下的优势比或近似相对危险度,因此非常适合于流行病学研究.logistic回归既适合于队列研究(cohort study),也适合于病例-对照研究(case-control study),同样还可以用于断面研究(cross-sectional study)
第三节 logistic回归的应用及其注意事项
2.临床试验数据分析 临床试验的目的大多是为了评价某种xx或xx方法的效果,如果有其他影响效果的非处理因素(如年龄、病情等)在试验组和对照组中分布不均衡,就有可能夸大或掩盖试验组的xx效果. 尽管在分组时要求按随机化原则分配,但由于样本含量有限,非处理因素在试验组和对照组内的分布仍有可能不均衡,需要在分析阶段对构成混杂的非处理因素进行调整.当评价指标为二值变量时(如有效和无效),可以利用logistic回归分析得到调整后的xx评价结果.对于按分层设计的临床试验可以用相同的方法对分层因素进行调整和分析.
3.分析xx或毒物的剂量反应 在一些xx或毒物效价的剂量-反应实验研究中,每一只动物xx耐受量可能有很大的不同,不同剂量使动物发生"阳性反应"的概率分布常呈正偏态,将剂量取对数后则概率分布接近正态分布.由于正态分布函数与logistic分布函数十分接近,如果用P表示在剂量为X时的阳性率,可用下述模型表示它们之间的关系
用这一模型可以求出任一剂量的阳性反应率
传统的一些方法往往对实验设计有严格的要求,如剂量按等比级数排列,各剂量组的例数必须相同等, 采用logistic回归的方法则没有这些限制.
4.预测与判别 logistic回归是一个概率型模型,因此可以利用它预测某事件发生的概率.例如在临床上可以根据患者的一些检查指标,判断患某种疾病的概率有多大.关于判别问题见第十八章.
二、logistic回归应用的注意事项
本章小结:
目的:作出以多个自变量(危险因素)估计应变量(结果因素)的logistic回归方程.属于概率型非线性回归.资料:1. 应变量为反映某现象发生与不发生的二值变量;2. 自变量宜全部或大部分为分类变量,可有少数数值 变量.分类变量要数量化.
用途:研究某种疾病或现象发生和多个危险因素(或保护因子)的数量关系.
种类: 1. 成组(非条件)logistic回归方程.2. 配对(条件)logistic回归方程.
课后应用思考题: 为了分析影响医院抢救急性心肌梗死(AMI)患者能否成功的因素,某医院收集了5年中所有的AMI患者的抢救病史(有关因素很多,由于篇幅有限,本例仅列出3个),共200例见下表.其中P=0表示抢救成功,P=1表示抢救未成功而死亡;X1=1表示抢救前已发生休克, X1=0表示抢救前未发生休克; X2=1表示抢救前已发生心衰, X2=0表示抢救前未发生心衰; X3=1表示患者从开始AMI症状到抢救时已超过12小时, X3=0表示患者从开始AMI症状到抢救时未超过12小时. 请问{zh0}采用哪种分析方法?为什么? 分析结果有哪些?
AMI患者的抢救危险因素资料
6
1
1
1
6
1
1
1
6
0
1
1
6
0
1
1
9
1
0
1
6
1
0
1
6
0
0
1
17
0
0
1
15
1
1
0
19
1
1
0
4
0
1
0
17
0
1
0
10
1
0
0
34
1
0
0
4
0
0
0
35
0
0
0
N
X3
X2
X1
N
X3
X2
X1
P=1(在医院抢救未成功而死亡)
P=0(在医院抢救成功)