数学建模多元统计分析引论.ppt
《数学建模多元统计分析引论.ppt》由会员分享,可在线阅读,更多相关《数学建模多元统计分析引论.ppt(56页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、数学建模多元统计分析引论现在学习的是第1页,共56页统计软件的重要作用“计算机软件给统计学带来革命性变化”发表论文或进行科研课题时,注明统计软件和采用的统计分析方法.统计分析工具的选择:CHISSSAS,SPSS,STATA现在学习的是第2页,共56页实例实例携带火柴和发生肺癌间的关系的研究。人们观察发现那些携带火柴的人更有可能发生肺癌。难道这表明携带火柴可能引起肺癌?混杂因素混杂因素这中间存在混杂因素-吸烟客观事实,携带火柴不可能引起肺癌。现在学习的是第3页,共56页混杂因素的影响混杂因素的影响图1.1危险因素、混杂因素和结果的关系携带火柴肺癌吸烟现在学习的是第4页,共56页 实例解析实例解
2、析4 喝咖啡与心肌梗塞喝咖啡与心肌梗塞MI关系的研究。关系的研究。有有人人观观察察发发现现喝喝咖咖啡啡的的人人,很很多多人人患患MI,这种现象是表象还是内在因果关系的?这种现象是表象还是内在因果关系的?数数据据来来自自2000年年,小小儿儿科科邀邀请请一一位位美美国国医医学学及及生生物物统统计计学学教教授来院讲学的例子。授来院讲学的例子。现在学习的是第5页,共56页 研究者调查研究者调查MI及非及非MI病人各病人各150例,得到如下例,得到如下数据。表数据。表1.1 MI NoMI%Coffee 90 60 60No coffee 60 90 40 优势比优势比:OR=90*90/(60*60
3、)=2.25 Pearson chi2(1)=12.0,P=0.001。说明喝咖啡人MI发生的危险性是不喝的2.25倍。两组MI发生率差异有显著意义。结论:喝咖啡与心肌梗塞MI有关!对否?现在学习的是第6页,共56页 研究者怀虑结论,考虑到其中可能混杂其它研究者怀虑结论,考虑到其中可能混杂其它因素,如吸烟对喝咖啡与心肌梗塞因素,如吸烟对喝咖啡与心肌梗塞MI间关系的影响,间关系的影响,进一步分层分析得到。进一步分层分析得到。表表 控制吸烟因素的干扰后结果控制吸烟因素的干扰后结果 Smoker Nosmoker MI NoMI%MI NoMI%Coffee 80 40 67 10 20 33 No
4、ffee 20 10 67 40 80 33 优势比优势比 OR=1,OR=1 P=1.00,P=1.00现在学习的是第7页,共56页表明,在吸烟组和不吸烟组中。喝咖啡与不喝咖啡的MI发生的相对危险度相同的。喝咖啡与心肌梗塞喝咖啡与心肌梗塞MI关系关系说明当存在混杂因素时说明当存在混杂因素时,单因素分单因素分析结论并不科学。析结论并不科学。现在学习的是第8页,共56页案例案例:研究生招生与性别的关系研究研究生招生与性别的关系研究现在学习的是第9页,共56页案例讨论研究生招生与性案例讨论研究生招生与性别的关系研究别的关系研究美国加州贝克莱分校1973年研究生的录取情况如上表.结果显示,男生报考人
5、数据2691人,录取1197人,录取比例44.5%,女生报考人数据1835人,录取556人,录取比例30.3%。有人认为该校在研究生录取中存在性别歧视。试对此进行讨论与分析。现在学习的是第10页,共56页混杂因素的定义混杂因素的定义当某一危险因素和结果的相关性受第三个变量和危险因素及结果之间关系的影响,这第三个变量称为混杂因素。l上两例中,混杂因素是吸烟现在学习的是第11页,共56页排除混杂因素的两种方法1、分层分析、分层分析 2、多元统计分析、多元统计分析现在学习的是第12页,共56页分层分析是在其它影响因素保持恒定情况下,评价某一危险因素对结果的影响。例如,上面我们可以分别在吸烟者和非吸烟
6、者之中,比较喝啡咖与和不喝啡咖的人。这可使我们在不依赖于吸烟的情况下,分析喝啡咖对MI的影响。1分层分析方法-控制混杂因素对结果的影响现在学习的是第13页,共56页分层分析的优缺点优点:直观简洁。缺点:当考虑因素较多时分组数量倍增,需要例数较多,有时无法实现。现在学习的是第14页,共56页生命在于运动。运动有利于长寿流水不腐。这是人类长期经验的总结,但事实果真如此吗?是科学的结论,还是事物的假象呢?实例解析实例解析运动与寿命关系的研究现在学习的是第15页,共56页许多研究表明长期运动人的寿命比久坐型生活方式人的寿命长。但是,如果运动者寿命长的真正原因是他不吸烟,没有家族病史,好的生活环境等,那
7、么运动将不能改变一个人的寿命。运动与人的寿命的关系现在学习的是第16页,共56页美国美国Aerobics中心的追踪研究中心的追踪研究 在19701989年间,它们追踪观察25,341男性和7084女性,研究运动和死亡率的关系。男性参加者被追踪观察平均8.4年,女性平均7.5年。所有参加者接受了基线检查,这些检查包括体检、实验室检测及踏车试验评价身体适宜运动量。结果如表1.1。Blair,S.N.,Kampert,J.B.,Kohl,H.W.,etal.”Influencesofcardiorespiratoryfitnessandotherprecursorsoncardiovasculard
8、iseaseandall-causemortalityinmenandwomen.”JAMA1996;276:205-10现在学习的是第17页,共56页表1.3Aerobics中心追踪研究过程中生存与死亡者基线特征(男性组)指标生存死亡(n=24,740)(n=601)年龄(SD)42.7(9.7)52.1(11.4)*体重指数26.0(3.6)26.3(3.5)收缩压121.1(13.5)130.4(19.1)*总胆固醇213.1(40.6)228.9(45.4)空腹血糖100.4(16.3)108.1(32.0)现在学习的是第18页,共56页l运动量(%)l低20.141.6l中42.03
9、9.1l高37.919.3*l冠心病家族史25.433.8*l吸烟26.336.9*l异常心电图6.926.3*l慢性病18.440.3*现在学习的是第19页,共56页分析发现,存活者和死亡者之间是有明显区别的。特点是存活者较年轻,血压较低,低胆固醇,很少吸烟并且高运动量(基于他们踏车试验时间长短及程度)。但表1.1并没有回答我们的基本问题:运动是否独立地延长寿命?它并没有回答这个问题是由于虽然高运动量组很少在研究期间死亡,但他们或者较很少吸烟,或年轻,或有较低的血压。我们应排除排除混杂因素的影响。现在学习的是第20页,共56页分层分析法表1.4Aerobics中心追踪研究中全因死亡患者吸烟和
10、体质的分层分析每万人年分层相对危险度死亡数(CI)吸烟低运动量48.01.63(1.26-2.13)*中/高运动量29.41.0(参照组)不吸烟低运动量44.02.19(1.77-2.70)*中/高运动量20.11.0(参照组)可见低运动量组死亡率高于中/高运动量组的死亡率,这一分层分析表明运动的作用不依赖于吸烟状态。现在学习的是第21页,共56页但是,有可能影响运动和长寿之间关系的其它变量是怎样的?你可以层层分析每一原因,来证明运动对长寿的影响不但不依赖于吸烟状态,也不依赖于年龄、性别、高血脂、高血压等等。如果分层分析3个变量吸烟状态、年龄、体重(正常/异常),你将需要在8个组中分析运动和死
11、亡率的关系。如果分层分析6个变量吸烟状态、年龄、性别、体重、胆固醇水平、高血压状态(是不是),你将需要在64个组中分析运动和死亡率的关系。现在学习的是第22页,共56页多因素分析法为判断运动是否独立地与死亡有关,研究者们运用了COX比例风险分析(proportionalhazardsanalysis)的多元分析方法,结果如表1.2。准 许 引 自:Blair,S.N.,etal.”Influencesofcardiorespiratoryfitnessandotherprecursorsoncardiovascular disease and all-cause mortality in wo
12、men.”JAMA 1996;276:205-10.Copyright1996,AmericanMedicalAssociation.Additionaldataprovidedbyauthors.现在学习的是第23页,共56页表1.5Aerobics中心追踪研究全死亡率危险因素的多元分析自变量死亡率调整相对危险度RR(百万分数)(95%CI)运动量低38.11.52(1.28-1.82)*中/高25.01.0(参照组)吸烟状况吸烟39.41.65(1.39-1.97)*不吸烟23.91.0(参照组)现在学习的是第24页,共56页收缩压140mmHg35.61.30(1.08-1.58)*14
13、0mmHg26.11.0(参照组)胆固醇240mg/dl35.11.34(1.13-1.59)*240mg/dl26.11.0(参照组)冠心病家族史有29.91.07(0.90-1.29)无27.81.0(参照组)体重指数27Kg/m228.81.02(0.86-1.22)27Kg/m228.21.0(参照组)现在学习的是第25页,共56页空腹血糖120mg/dl34.41.24(0.98-1.56)120mg/dl27.91.0(参照组)异常心电图有44.41.64(1.34-2.01)*无27.11.0(参照组)慢性疾病有41.21.63(1.37-1.95)*无25.31.0(参照组)现
14、在学习的是第26页,共56页表明,如果你比较男性中每千人年死亡数,你可以看出在低运动组(38.1)比中/高运动量组(25.0)有较高的死亡数。其相对危险度为38.1/25.0=1.52。说明低运动量的人死亡的危险性是高运动人的1.52倍。这显示运动与生存率有关,它并不依赖于吸烟、高血压、高胆固醇及家族史。运动与人的寿命的关系现在学习的是第27页,共56页实例解析吸烟和冠状血管疾病再通术后的预后间的关系Aerobics中心的追踪研究,他们追踪了5437例冠状血管疾病并接受再通手术(用线和球打开阻塞的冠状血管)的病人,将病人分为不吸烟、以前吸烟(至少在手术前6个月戒掉)、刚戒烟(因手术后刚戒掉)、
15、及持续吸烟4个组。结果见表1.4.5Hasdai,D.,Garratt,K.N.,Grill,D.E.,Lerman,A.,Homes,D.R.“Effectofsamokingstatusonthelong-termoutcomeaftersuccessfulpercutaneouscoronaryrevascularization.”N.Engl,J.Med.1997;336:755-61.现在学习的是第28页,共56页表1.6吸烟状况和死亡危险性的两变量关系组别死亡相对危险度RR(95%CI)不吸烟1.0(参照组)以前吸烟1.08(0.92-1.26)刚戒烟0.56(0.40-0.77)
16、*持续吸烟0.74(0.59-0.94)*引自:D.,et al.“Effect of smoking status on the long-termoutcomeaftersuccessfulpercutaneouscoronaryrevascularization.”N.Engl.J.Med.1997;336:755-61.现在学习的是第29页,共56页持续吸烟组的死亡相对危险度怎么比不吸烟组低呢?(烟草公司希望)在你假定在此研究中可能有差错之前,一些其它研究发现在冠状动脉疾病血栓溶解治疗中,吸烟和预后具有同样的关系,这一作用被称为“吸烟者悖论”是 什 么 原 因 导 致 这 一“悖 论”
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 数学 建模 多元 统计分析 引论
限制150内