统计学方法分类与选择重点知识.pptx
![资源得分’ title=](/images/score_1.gif)
![资源得分’ title=](/images/score_1.gif)
![资源得分’ title=](/images/score_1.gif)
![资源得分’ title=](/images/score_1.gif)
![资源得分’ title=](/images/score_05.gif)
《统计学方法分类与选择重点知识.pptx》由会员分享,可在线阅读,更多相关《统计学方法分类与选择重点知识.pptx(49页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、根据研究设计类型选择分析方根据研究设计类型选择分析方法法 第1页/共49页(一)、成组比较的设计 在成组比较设计中,若是两组比较需要应用t检验或X2检验。多组比较需应用方差分析、行列表X2检验或分级的分析方法。第2页/共49页(二)、配对(自身实验前后)设计 这种类型的设计需要按照配比的t检验,X2检验及配对的病例对照研究方法进行数据分析。第3页/共49页 (三)、重复测量的设计 这类设计方法是在给定一个处理因素后在不同的时间重复测量某一效应变量的改变情况。如欲评价生物制品接种后的免疫学效果,在接种后的2周、4周、6周和8周测定抗体滴度,即为此类设计类型。对于这种设计类型的数据需应用重复测量的
2、方差分析方法进行数据的分析。第4页/共49页(四)、多因素设计 若在研究设计中有多个自变量,则可根据因变量的性质选择合适的多因素分析方法。如果自变量是数值变量,则可考虑应用多元回归分析方法、协方差分析方法。如果是分类变量,则可选择logistic回归分析方法、判别分析方法及聚类分析方法等。第5页/共49页 根据变量的类型选择分析方根据变量的类型选择分析方法法第6页/共49页区别与明确研究的因变量和自变量具有重要的流行病学与生物统计学意义,首先它有助于选择拟研究的变量,对调查表的设计具有指导作用。其次数据分析阶段可以指导数据分析方法的选择及模型的建立。若因变量是分类变量,则常考虑应用分类变量的分
3、析方法,如卡方检验,logistic回归分析等。如果因变量是数值变量,则考虑应用数值变量的分析方法如t检验、方差分析,协方差分析、多元回归等。同时明确自变量与因变量可以建立正确的统计学分析模型。第7页/共49页因变量应该放在模型的左侧,自变量则放在模型的右侧。例如欲评价不同治疗方法(口服药物、注射胰岛素及膳食控制)对糖尿病人的治疗效果(血糖水平),在分析时要求调整病人的性别、年龄和病程的影响。对本例的处理需要进行协方差分析,在应用SAS进行分析时,要将血糖水平(因变量)放在模型的左则,而治疗方法或其它协变量(covariate)即性别、年龄和病程放在模型的右侧。又如分析脂蛋白(a)与冠心病发生
4、的关系,则冠心病是否发生为因变量,脂蛋白(a)则为自变量,不可颠倒这种关系。第8页/共49页不同变量类型的数据分析方法选择因变量因变量自变量自变量数值变量数值变量分类变量分类变量有序变量有序变量数值变量数值变量相关分析,多元回归相关分析,多元回归分析分析t t检验检验,方差分析,协方差分析,协方差分析,多元方差分析,多元回归分析回归分析相关分析,多元回归相关分析,多元回归分析分析分类变量分类变量t t检验检验,方差分析,方差分析,logisticlogistic回归分回归分析析,判别分析,判别分析,聚类分析聚类分析c c2 2检验,检验,logisticlogistic回回归分析归分析c c2
5、 2检验检验有序变量有序变量方差分析,方差分析,logisticlogistic回归分析回归分析,判别判别分析,聚类分析分析,聚类分析c c2 2检验,检验,logisticlogistic回回归分析归分析相关分析,相关分析,c c2 2检验检验生存时间生存时间生存分析生存分析第9页/共49页不同研究设计和数据类型的数据分析方法选择 研究设计类型研究设计类型变量类型变量类型两组比较两组比较两组以上比较两组以上比较实验前后比较实验前后比较重复测量重复测量两变量间的联系两变量间的联系重重复复测测量量的的方方 差差 分分析析线线性性回回归归,Pearson相关系数相关系数 数值变量数值变量 t检验检
6、验方差分析方差分析配对配对t检验检验 分类变量分类变量 c c2 2检验检验c c2 2检验检验配对配对c c2 2检验检验列联表相关系数列联表相关系数 有序变量有序变量Mann-Whitney秩秩和和检检验验Kruskal-Wallis分分析析Wilcoxon符符号号秩和检验秩和检验Spearman相相 关关 系系数数 生存时间生存时间生存分析生存分析第10页/共49页数据的分析程序数据的分析程序 第11页/共49页第12页/共49页第13页/共49页数据的转换数据的转换第14页/共49页1)非正态数据的变量转换 多数的统计学分析方法是建立在数据正态分布的基础上的,若数据不符合正态分布,则不
7、能够应用参数检验(parametric test)的方法,只能应用非参数检验(non-parametric test)的方法,而非参数的方法不是对原始数据的检验,如秩和检验就是非参数检验方法之一,它是对原始数据的秩次(rank)进行检验,这样可能损失数据信息,降低检验效率 第15页/共49页 在对数值变量进行分析时,需首先根据统计分析方法/统计分析公式的限制性使用条件对数据进行“条件”检验,如正态性检验和方差齐性检验等。很多统计学软件具有方便的正态性检验、方差齐性检验功能如SAS软件等.若经过检验数据不符合使用条件,就需要进行数据的变量变换,变换后符合条件就可以应用参数检验的方法,否则,只有应
8、用非参数检验的方法。数据变量转换的方法很多,可以根据数据的分布特征,选择合适的数据转换方法。常用的方法有对数变换,平方根变换或倒数变换等。第16页/共49页 2)分类变量转换成哑变量 若分类变量是二分类尺度及顺序尺度,则可直接应用其原有的数量化数值,但对于名义尺度因为各类别间没有顺序关系,在进行不同分析(包括多元分析、logistic回归、Cox回归等)时,不能使用原始的计算机录入数值,必经进行变量转换。即将该变量转换成(水平数-1)个哑变量,再将这些新转换的变量放入多因素模型中。第17页/共49页t t检验的应用条件检验的应用条件两组数据的比较1样本量比较小(n50)2样本来自正态总体3两样
9、本总体方差齐同当两样本方差不齐时可以采用t检验,变量变换,或者秩和检验。第19页/共49页方差分析的应用条件方差分析的应用条件两组以上数据的比较1各样本是相互独立的随机样本;2各样本要来自正态总体;3要求各个样本的总体方差齐同。第20页/共49页多个样本均数间的两两比较多个样本均数间的两两比较NewmanKeuls检验,亦称StudentNewmanKeuls(SNK)检验,简称q检验。最小显著性差距(LSD)t检验。第21页/共49页协方差分析协方差分析定量分析中,进行两个样本或者多个样本的均数比较时,不仅需要使用假设检验判断其差异是否具有统计学差异,还应该考虑他们之间是否存在混杂因素(协变
10、量)的影响。若存在协变量,则应该通过协方差分析进行校正。协方差分析是定量变量分析中控制混杂因素的重要手段第22页/共49页 影响观察指标的其他非研究性因素(混杂因素)在统计分析中又称之为协变量;考虑协变量影响的方差分析即为协方差分析。协方差分析是解决以上问题的分析方法,它将线性回归与方差分析结合起来,检验2个或者多个修正均数之间有无差别的假设检验方法。一般是先用直线回归的方法找出各组因变量与协变量之间的数量关系,求得修假定协变量相等时的修正系数,然后用方差分析比较修正均数间的差别。第23页/共49页协方差分析的条件协方差分析的条件1各个样本来自方差齐同的正态总体2各组的总体直线回归系数相同,且
11、都不为0。第24页/共49页协方差分析的判别步骤:协方差分析的判别步骤:1正态性和方差齐性检验;2判断协变量与因变量有无线性关系;3判断各组回归直线是否平行。第25页/共49页直线回归与相关的区别与联系直线回归与相关的区别与联系第26页/共49页区别直线相关直线回归变量地位变量 x 变量 y 处于平等的地位,彼此相关关系变量 y 称为因变量,处在被解释的地位,x 称为自变量,用于预测因变量的变化变量性质所涉及的变量 x 和 y 都是随机变量,要求两个变量服从双变量正态分布因变量 y 是随机变量,自变量 x 可以是随机变量,也可以是非随机的确定变量实际作用主要是描述两个变量之间线性关系的密切程度
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 统计学 方法 分类 选择 重点 知识
![提示](https://www.taowenge.com/images/bang_tan.gif)
限制150内