统计学方法的分类与选择-重点知识.ppt
《统计学方法的分类与选择-重点知识.ppt》由会员分享,可在线阅读,更多相关《统计学方法的分类与选择-重点知识.ppt(49页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、 统统 计计 学学 方方 法法 的的 分分 类类 与与 选选 择择根据研究设计类型选择分析方法根据研究设计类型选择分析方法 (一)、成组比较的设计 在成组比较设计中,若是两组比较需要应用t检验或X2检验。多组比较需应用方差分析、行列表X2检验或分级的分析方法。(二)、配对(自身实验前后)设计 这种类型的设计需要按照配比的t检验,X2检验及配对的病例对照研究方法进行数据分析。(三)、重复测量的设计 这类设计方法是在给定一个处理因素后在不同的时间重复测量某一效应变量的改变情况。如欲评价生物制品接种后的免疫学效果,在接种后的2周、4周、6周和8周测定抗体滴度,即为此类设计类型。对于这种设计类型的数据
2、需应用重复测量的方差分析方法进行数据的分析。(四)、多因素设计 若在研究设计中有多个自变量,则可根据因变量的性质选择合适的多因素分析方法。如果自变量是数值变量,则可考虑应用多元回归分析方法、协方差分析方法。如果是分类变量,则可选择logistic回归分析方法、判别分析方法及聚类分析方法等。根据变量的类型选择分析方法根据变量的类型选择分析方法n区别与明确研究的因变量和自变量具有重要的流行病学与生物统计学意义,首先它有助于选择拟研究的变量,对调查表的设计具有指导作用。n其次数据分析阶段可以指导数据分析方法的选择及模型的建立。若因变量是分类变量,则常考虑应用分类变量的分析方法,如卡方检验,logis
3、tic回归分析等。如果因变量是数值变量,则考虑应用数值变量的分析方法如t检验、方差分析,协方差分析、多元回归等。同时明确自变量与因变量可以建立正确的统计学分析模型。n因变量应该放在模型的左侧,自变量则放在模型的右侧。n例如欲评价不同治疗方法(口服药物、注射胰岛素及膳食控制)对糖尿病人的治疗效果(血糖水平),在分析时要求调整病人的性别、年龄和病程的影响。对本例的处理需要进行协方差分析,在应用SAS进行分析时,要将血糖水平(因变量)放在模型的左则,而治疗方法或其它协变量(covariate)即性别、年龄和病程放在模型的右侧。又如分析脂蛋白(a)与冠心病发生的关系,则冠心病是否发生为因变量,脂蛋白(
4、a)则为自变量,不可颠倒这种关系。不同变量类型的数据分析方法选择不同变量类型的数据分析方法选择不同研究设计和数据类型的数据分析方法选择不同研究设计和数据类型的数据分析方法选择 数据的分析程序数据的分析程序 数据的转换数据的转换1)非正态数据的变量转换 多数的统计学分析方法是建立在数据正态分布的基础上的,若数据不符合正态分布,则不能够应用参数检验(parametric test)的方法,只能应用非参数检验(non-parametric test)的方法,而非参数的方法不是对原始数据的检验,如秩和检验就是非参数检验方法之一,它是对原始数据的秩次(rank)进行检验,这样可能损失数据信息,降低检验效
5、率 n 在对数值变量进行分析时,需首先根据统计分析方法/统计分析公式的限制性使用条件对数据进行“条件”检验,如正态性检验和方差齐性检验等。很多统计学软件具有方便的正态性检验、方差齐性检验功能如SAS软件等.若经过检验数据不符合使用条件,就需要进行数据的变量变换,变换后符合条件就可以应用参数检验的方法,否则,只有应用非参数检验的方法。n数据变量转换的方法很多,可以根据数据的分布特征,选择合适的数据转换方法。常用的方法有对数变换,平方根变换或倒数变换等。2)分类变量转换成哑变量 若分类变量是二分类尺度及顺序尺度,则可直接应用其原有的数量化数值,但对于名义尺度因为各类别间没有顺序关系,在进行不同分析
6、(包括多元分析、logistic回归、Cox回归等)时,不能使用原始的计算机录入数值,必经进行变量转换。即将该变量转换成(水平数-1)个哑变量,再将这些新转换的变量放入多因素模型中。t t检验的应用条件检验的应用条件n两组数据的比较n1样本量比较小(n50)n2样本来自正态总体n3两样本总体方差齐同n当两样本方差不齐时可以采用t检验,变量变换,或者秩和检验。方差分析的应用条件方差分析的应用条件n两组以上数据的比较n1各样本是相互独立的随机样本;n2各样本要来自正态总体;n3要求各个样本的总体方差齐同。多个样本均数间的两两比较多个样本均数间的两两比较nNewmanKeuls检验,亦称Studen
7、tNewmanKeuls(SNK)检验,简称q检验。n最小显著性差距(LSD)t检验。协方差分析协方差分析n定量分析中,进行两个样本或者多个样本的均数比较时,不仅需要使用假设检验判断其差异是否具有统计学差异,还应该考虑他们之间是否存在混杂因素(协变量)的影响。若存在协变量,则应该通过协方差分析进行校正。协方差分析是定量变量分析中控制混杂因素的重要手段 影响观察指标的其他非研究性因素(混杂因素)在统计分析中又称之为协变量;考虑协变量影响的方差分析即为协方差分析。协方差分析是解决以上问题的分析方法,它将线性回归与方差分析结合起来,检验2个或者多个修正均数之间有无差别的假设检验方法。一般是先用直线回
8、归的方法找出各组因变量与协变量之间的数量关系,求得修假定协变量相等时的修正系数,然后用方差分析比较修正均数间的差别。协方差分析的条件协方差分析的条件1各个样本来自方差齐同的正态总体2各组的总体直线回归系数相同,且都不为0。协方差分析的判别步骤:协方差分析的判别步骤:n1正态性和方差齐性检验;n2判断协变量与因变量有无线性关系;n3判断各组回归直线是否平行。直线回归与相关的区别与联系直线回归与相关的区别与联系多元线性回归的基本概念多元线性回归的基本概念 事物间的相互联系往往是多方面的,在很多情况下对应变量y 发生影响的自变量往往不止一个。多元线性回归的目的就是用一个多元线性回归方程表示多个自变量
9、和1个应变量间的关系。标准偏回归系数表示其他自变量固定的情况下,xi改变一个单位,y平均改变bi个单位。多元线性回归的应用条件:多元线性回归的应用条件:n1.独立性:各观察对象间相互独立。n2.线性:自变量与应变量间的关系为线性。n3.正态性:自变量取不同值时,应变量的分布为正态。n4.方差齐性:自变量取不同值时,应变量的总体方差相等。n5.当不符合条件时,可对自变量进行变换。如:n要比较各个自变量对于应变量的作用大小,不能用偏回归系数,因为各偏回归系数的单位不同。必须把偏回归系数标准化,化成没有单位的标准偏回归系数.n消除不同单位的影响后,标准偏回归系数的绝对值越大,该自变量对于应变量的作用
10、越大,但该差别是否有统计意义,也必须经过检验。(2)对各偏回归系数的显著性检验:F检验与 t检验 1.计算截距和各偏回归系数。2.多元回归方程的显著性检验:(1)整个方程的显著性检验:用方差分析。STEPWISE REGRESSIONn一逐步回归分析的基本概念 逐步回归分析的目的是建立“最优”回归方程。“最优”回归方程是指包含所有对y有显著作用的自变量,而不包含对y作用不显著的自变量的方程。逐步回归分析的计算方法逐步回归分析的计算方法n 在供选的自变量Xi中,按其对y的作用大小,由大到小地把自变量逐个引入方程,每引入一个自变量就对它作显著性检验,显著时才引入,而当新的自变量进入方程后,对方程中
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 统计学 方法 分类 选择 重点 知识
限制150内