最新危险度分析和Logistic回归PPT课件.ppt
《最新危险度分析和Logistic回归PPT课件.ppt》由会员分享,可在线阅读,更多相关《最新危险度分析和Logistic回归PPT课件.ppt(48页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、危险度分析和危险度分析和LogisticLogistic回回归归 危险度分析和LOGISTIC回归主要用于研究影响肿瘤和其它各种疾病的发病因素或预后因素。 一般的相对危险度计算通常用于单因素分析。 LOGISTIC回归可用于多因素分析。 第十七章危险度分析和第十七章危险度分析和LogisticLogistic回归回归队列研究队列研究一般模式: 发病 a 暴露组 不发病 b确定范围的人群 (未发病) 发病 c 非暴露组 不发病 d第二节第二节 队列研究队列研究可归纳为:发病不发病小计暴露组aba+b非暴露组cdc+d小计a+cb+dn=a+b+c+d这时有估计值 暴露组发病率 =a/(a+b)
2、非暴露组发病率 =c/(c+d) 故相对危险度的估计值 =a/(a+b)/c/(c+d) 1 p0 p第二节第二节 队列研究队列研究01/PPRR RR的假设检验: H0:总体相对危险度为1, 即RR=1 H1:总体相对危险度不为1,即RR1 2MH=(ad-bc)2(n-1)/(a+b)(c+d)(a+c)(b+d) 它与四格表2未校正公式所得2相差仅为系数n/(n-1)。 2MH =(n-1)/n2 其中 2=(ad-bc)2n/(a+b)(c+d)(a+c)(b+d) 当n较大时,两者差别甚微,因而有些统计学家建议,上述检验仍用四格表的2或用Yates校正2计算。第二节第二节 队列研究队
3、列研究总体相对危险度95%,99%可信区间分别可由公式 )/96. 11(2MHRR )/58. 21(2MHRR 计算而得。 同样可有总体特异危险度AR的估计值及其95%可信区间为 01ppAR )/96. 11(2MHAR 第二节第二节 队列研究队列研究 例例21.221.2 为研究血液中儿茶酚胺水平与冠心病发病之间的关系,对609名男子按血液中儿茶酚胺水平分为高低两组,经过十年追踪观察得结果如下表,试作危险度分析。表17.1 血中儿茶酚胺水平与冠心病发病关系血中儿茶酚胺 冠心病 水平 发病 未发病 小计 高 27(a) 95(b) 122 低 44(c) 443(d) 487 小计 71
4、 538 609第二节第二节 队列研究队列研究解解: : RR=(27/122)/(44/487)=2.45 H0: RR=1 H1:RR1 2MH=(27443-4495)2(609-1)/(12248771538)=16.22 由于2MH=16.2220.01 ,故 P20.01=6.635,故P0.01,拒绝H0,认为总体比数比不为1,患子宫内膜癌与绝经期使用过雌激素有关;并估计绝经期使用过雌激素的妇女患子宫内膜癌的相对危险度是不用者的3.71倍。22病例对照研究优点: 简单易行,不需长期随访,特别适用于研究发病率低的疾病。病例对照研究缺点: 回顾性研究,从果到因,不合理,可靠性差。一成
5、组病例对照研究一成组病例对照研究二分层分析二分层分析 有时在分析某危险因素与疾病之间的关系时, 有些额外因素会对所分析的问题起干扰作用,这些额外因素就称为混杂因素。它能部分甚至全部掩盖危险因素与疾病之间的真实关系,故必须设法排除。例如要研究卫生状况与某传染病发病之间的关系,但传播可能与居住密度有关 ,故居住密度对所研究的问题就成为一个混杂因素,如果结论中未排除该因素之干扰,将影响推断之可靠性。以下这个假设例说明混杂因素所起的干扰作用,假定混杂因素分为2个水平(,)表17.3 混杂因素干扰的假设例 混杂因素未分层 混杂因素分层分析 暴露 非暴露 暴露 非暴露 暴露 非暴露 病例 300 56 2
6、94 21 6 35 对照 700 944 606 79 94 865混杂因素未分层时=(300944)/(56700)=7.22 混杂因素分层 层=(29479)/(60621)=1.83 层=(6865)/(9435)=1.58 未分层时=7.22,似乎表明该危险因素作用很大 ,二分层分析二分层分析 但将混杂因素分为两层后,层的分别仅为1.83,1.58。 由此可见该混杂因素的干扰会导致不正确的推断。分层分析有助于克服混杂因素之干扰。 分层分析(Stratified Analysis)是对可能的混杂因素(常常是性别,年龄,或其它有关条件)进行分层,使得每一层内混杂因素处于同一水平上,这样就
7、可排除它的干扰。二分层分析二分层分析 K层22表统计分析步骤: 以P323,例17.4为例,根据年龄分为5层 (1)计算各层的比数比,作显著性检验。 (2)检验各层的总体比数比是否相同。 如差异有统计学意义,结束。 (3)如差异无统计学意义, 计算公共比数比。 (4)检验公共比数比和1之间的差异是否有统计学意义。三配对病例对照研究三配对病例对照研究 在成组病例对照研究中,为了排除混杂因素的干扰可以使用分层分析,但当可能的混杂因素较多时,所分层次就会很多,而且必须调查较大的样本, 否则各层中频数就会太小,这种情况有时会给工作带来困难,一个较好的控制混杂因素的办法就是配对病例对照研究(Paired
8、 Case-Contral Study)。 本方法的基本点就是对每一名病例, 选择一名或数名各种控制因素与病例相近的非病例作为对照者,在调查一开始就把他们配成对 ,然后一对对地进行比较分析。这样做可以使各对内部保持均衡,尽可能排除或减少混杂因素的影响,从而提高分析的效能。配对因素可以是按属性分类的变量,如性别、民族、血型、职业、既往病史等,也可以是连续性变量,如年龄、血压、某种生理、生化指标等。三配对病例对照研究三配对病例对照研究 Logistic回归是一个较好的,目前常用的,控制混杂因素的多因素分析方法。 多变量分析中使用的多元线性回归模型,应变量y常取为一个计量数据。 Logistic回归
9、中y呈现为二值变量形式。如发病与不发病,死与活,成功与失败,阳性与阴性, 等等。当应变量只取二个数值时常记为1与0,在SAS的logistic回归中最好记成1与2。Y=1: 反应,如: 发病,死亡,成功Y=2:不反应,如:不发病,存活,不成功 第五节第五节 LogisticLogistic回归回归Y:反应变量(response variable)X: 协变量(covariate),解释(explanatory)变量, 伴随变量等, X可以呈现二值变量的形式,也可以计量的或等级的指标。 logistic回归是一种概率模型。设P为Y呈现反应值为1的概率,P=P(Y=1),则Q=1-P,为呈现非反应
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 最新 危险 分析 Logistic 回归 PPT 课件
限制150内