SPSS数据分析的医学统计方法选择.pdf
《SPSS数据分析的医学统计方法选择.pdf》由会员分享,可在线阅读,更多相关《SPSS数据分析的医学统计方法选择.pdf(18页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、SPSS 数据分析的医学统计方法选择 目 录 数据分析的统计方法选择小结.错误!未定义书签。目 录.1 资料 1.2 完全随机分组设计的资料.2 配对设计或随机区组设计.3 变量之间的关联性分析.4 资料 2.5 1.连续性资料.5 1.1 两组独立样本比较.5 1.2 两组配对样本的比较.5 1.3 多组完全随机样本比较.6 1.4 多组随机区组样本比较.6 2分类资料.6 2.1 四格表资料.6 2.2 2C 表或 R2 表资料的统计分析.7 2.3 RC 表资料的统计分析.7 2.4 配对分类资料的统计分析.8 资料 3.8 一、两个变量之间的关联性分析.8 二、回归分析.9 资料 4.
2、10 一统计方法抉择的条件.10 1分析目的.10 2资料类型.10 3设计方法.11 4分布特征及数理统计条件.12 二数据资料的描述.13 1数值变量资料的描述.13 2分类变量资料的描述.13 三数据资料的比较.14 1假设检验的基本步骤.14 2假设检验结论的两类错误.15 3假设检验的注意事项.15 4常用假设检验方法.16 四变量间的相关分析.17 1数值变量(计量资料)的关系分析.18 2无序分类变量(计数资料)的相关分析.18 3有序分类变量(等级资料)等级相关.18 资料 1 完全随机分组设计的资料 一、两组或多组计量资料的比较 1.两组资料:1)大样本资料或服从正态分布的小
3、样本资料(1)若方差齐性,则作成组 t 检验(2)若方差不齐,则作 t检验或用成组的 Wilcoxon 秩和检验 2)小样本偏态分布资料,则用成组的 Wilcoxon 秩和检验 2.多组资料:1)若大样本资料或服从正态分布,并且方差齐性,则作完全随机的方差分析。如果方差分析的统计检验为有统计学意义,则进一步作统计分析:选择合适的方法(如:LSD 检验,Bonferroni 检验等)进行两两比较。2)如果小样本的偏态分布资料或方差不齐,则作 Kruskal Wallis 的统计检验。如果 Kruskal Wallis 的统计检验为有统计学意义,则进一步作统计分析:选择合适的方法(如:用成组的 W
4、ilcoxon 秩和检验,但用 Bonferroni 方法校正 P 值等)进行两两比较。二、分类资料的统计分析 1.单样本资料与总体比较 1)二分类资料:(1)小样本时:用二项分布进行确切概率法检验;(2)大样本时:用 U 检验。2)多分类资料:用 Pearson 2检验(又称拟合优度检验)。2.四格表资料 1)n40 并且所以理论数大于 5,则用 Pearson 2 2)n40 并且所以理论数大于 1 并且至少存在一个理论数5,则用校正 2或用Fishers 确切概率法检验 3)n40 或存在理论数40 并且理论数小于 5 的格子数行列表中格子总数的 25%,则用Fishers 确切概率法检
5、验 4.RC 表资料的统计分析 1)列变量为效应指标,并且为有序多分类变量,行变量为分组变量,则 CMH 2或 Kruskal Wallis 的秩和检验 2)列变量为效应指标,并且为无序多分类变量,行变量为有序多分类变量,作none zero correlation analysis 的 CMH 2 3)列变量和行变量均为有序多分类变量,可以作 Spearman 相关分析 4)列变量和行变量均为无序多分类变量,(1)n40 并且理论数小于 5 的格子数行列表中格子总数的 25%,则用Fishers 确切概率法检验 三、Poisson 分布资料 1.单样本资料与总体比较:1)观察值较小时:用确切
6、概率法进行检验。2)观察值较大时:用正态近似的 U 检验。2.两个样本比较:用正态近似的 U 检验。配对设计或随机区组设计 四、两组或多组计量资料的比较 1.两组资料:1)大样本资料或配对差值服从正态分布的小样本资料,作配对 t 检验 2)小样本并且差值呈偏态分布资料,则用 Wilcoxon 的符号配对秩检验 2.多组资料:1)若大样本资料或残差服从正态分布,并且方差齐性,则作随机区组的方差分析。如果方差分析的统计检验为有统计学意义,则进一步作统计分析:选择合适的方法(如:LSD 检验,Bonferroni 检验等)进行两两比较。2)如果小样本时,差值呈偏态分布资料或方差不齐,则作 Fredm
7、an 的统计检验。如果 Fredman 的统计检验为有统计学意义,则进一步作统计分析:选择合适的方法(如:用 Wilcoxon 的符号配对秩检验,但用 Bonferroni 方法校正 P 值等)进行两两比较。五、分类资料的统计分析 1.四格表资料 1)b+c40,则用 McNemar 配对 2检验或配对边际2检验 2)b+c40,则用二项分布确切概率法检验 2.CC 表资料:1)配对比较:用 McNemar 配对 2检验或配对边际2检验 2)一致性问题(Agreement):用 Kap 检验 变量之间的关联性分析 六、两个变量之间的关联性分析 1.两个变量均为连续型变量 1)小样本并且两个变量
8、服从双正态分布,则用 Pearson 相关系数做统计分析 2)大样本或两个变量不服从双正态分布,则用 Spearman 相关系数进行统计分析 2.两个变量均为有序分类变量,可以用 Spearman 相关系数进行统计分析 3.一个变量为有序分类变量,另一个变量为连续型变量,可以用 Spearman 相关系数进行统计分析 七、回归分析 1.直线回归:如果回归分析中的残差服从正态分布(大样本时无需正态性),残差与自变量无趋势变化,则直线回归(单个自变量的线性回归,称为简单回归),否则应作适当的变换,使其满足上述条件。2.多重线性回归:应变量(Y)为连续型变量(即计量资料),自变量(X1,X2,Xp)
9、可以为连续型变量、有序分类变量或二分类变量。如果回归分析中的残差服从正态分布(大样本时无需正态性),残差与自变量无趋势变化,可以作多重线性回归。1)观察性研究:可以用逐步线性回归寻找(拟)主要的影响因素 2)实验性研究:在保持主要研究因素变量(干预变量)外,可以适当地引入一些其它可能的混杂因素变量,以校正这些混杂因素对结果的混杂作用 3.二分类的 Logistic 回归:应变量为二分类变量,自变量(X1,X2,Xp)可以为连续型变量、有序分类变量或二分类变量。1)非配对的情况:用非条件 Logistic 回归(1)观察性研究:可以用逐步线性回归寻找(拟)主要的影响因素(2)实验性研究:在保持主
10、要研究因素变量(干预变量)外,可以适当地引入一些其它可能的混杂因素变量,以校正这些混杂因素对结果的混杂作用 2)配对的情况:用条件 Logistic 回归(1)观察性研究:可以用逐步线性回归寻找(拟)主要的影响因素(2)实验性研究:在保持主要研究因素变量(干预变量)外,可以适当地引入一些其它可能的混杂因素变量,以校正这些混杂因素对结果的混杂作用 4.有序多分类有序的 Logistic 回归:应变量为有序多分类变量,自变量(X1,X2,Xp)可以为连续型变量、有序分类变量或二分类变量。1)观察性研究:可以用逐步线性回归寻找(拟)主要的影响因素 2)实验性研究:在保持主要研究因素变量(干预变量)外
11、,可以适当地引入一些其它可能的混杂因素变量,以校正这些混杂因素对结果的混杂作用 5.无序多分类有序的 Logistic 回归:应变量为无序多分类变量,自变量(X1,X2,Xp)可以为连续型变量、有序分类变量或二分类变量。1)观察性研究:可以用逐步线性回归寻找(拟)主要的影响因素 2)实验性研究:在保持主要研究因素变量(干预变量)外,可以适当地引入一些其它可能的混杂因素变量,以校正这些混杂因素对结果的混杂作用 八、生存分析资料:(要求资料记录结局和结局发生的时间,如:死亡和死亡发生的时间)1.用 Kaplan-Meier 方法估计生存曲线 2.大样本时,可以寿命表方法估计 3.单因素可以用 Lo
12、grank 比较两条或多条生存曲线 4.多个因素时,可以作多重的 Cox 回归 1)观察性研究:可以用逐步线性回归寻找(拟)主要的影响因素 2)实验性研究:在保持主要研究因素变量(干预变量)外,可以适当地引入一些其它可能的混杂因素变量,以校正这些混杂因素对结果的混杂作用 资料 2 1.连续性资料 1.1 两组独立样本比较 1.1.1 资料符合正态分布,且两组方差齐性,直接采用 t 检验。1.1.2 资料不符合正态分布(1)可进行数据转换,如对数转换等,使之服从正态分布,然后对转换后的数据采用t 检验;(2)采用非参数检验,如 Wilcoxon 检验。1.1.3 资料方差不齐(1)采用 Satt
13、erthwate 的 t检验;(2)采用非参数检验,如 Wilcoxon 检验。1.2 两组配对样本的比较 1.2.1 两组差值服从正态分布,采用配对 t 检验。1.2.2 两组差值不服从正态分布,采用 wilcoxon 的符号配对秩和检验。1.3 多组完全随机样本比较 1.3.1 资料符合正态分布,且各组方差齐性,直接采用完全随机的方差分析。如果检验结果为有统计学意义,则进一步作两两比较,两两比较的方法有 LSD 检验,Bonferroni 法,tukey 法,Scheffe 法,SNK 法等。1.3.2 资料不符合正态分布,或各组方差不齐,则采用非参数检验的 KruscalWallis法。
14、如果检验结果为有统计学意义,则进一步作两两比较,一般采用 Bonferroni 法校正 P值,然后用成组的 Wilcoxon 检验。1.4 多组随机区组样本比较 1.4.1 资料符合正态分布,且各组方差齐性,直接采用随机区组的方差分析。如果检验结果为有统计学意义,则进一步作两两比较,两两比较的方法有 LSD 检验,Bonferroni 法,tukey 法,Scheffe 法,SNK 法等。1.4.2 资料不符合正态分布,或各组方差不齐,则采用非参数检验的 Fridman 检验法。如果检验结果为有统计学意义,则进一步作两两比较,一般采用 Bonferroni 法校正 P 值,然后用符号配对的 W
15、ilcoxon 检验。需要注意的问题:(1)一般来说,如果是大样本,比如各组例数大于 50,可以不作正态性检验,直接采用 t 检验或方差分析。因为统计学上有中心极限定理,假定大样本是服从正态分布的。(2)当进行多组比较时,最容易犯的错误是仅比较其中的两组,而不顾其他组,这样作容易增大犯假阳性错误的概率。正确的做法应该是,先作总的各组间的比较,如果总的来说差别有统计学意义,然后才能作其中任意两组的比较,这些两两比较有特定的统计方法,如上面提到的 LSD 检验,Bonferroni 法,tukey 法,Scheffe 法,SNK 法等。绝不能对其中的两组直接采用 t 检验,这样即使得出结果也未必正
16、确。(3)关于常用的设计方法:多组资料尽管最终分析都是采用方差分析,但不同设计会有差别。常用的设计如完全随即设计,随机区组设计,析因设计,裂区设计,嵌套设计等。2分类资料 2.1 四格表资料 2.1.1 例数大于 40,且所有理论数大于 5,则用普通的 Pearson 检验。2.1.2 例数大于 40,所有理论数大于 1,且至少一个理论数小于 5,则用校正的检验或Fishers 确切概率法检验。2.1.3 例数小于 40,或有理论数小于 2,则用 Fishers 确切概率法检验。2.2 2C 表或 R2 表资料的统计分析 2.2.1 列变量行变量均为无序分类变量,则(1)例数大于 40,且理论
17、数小于 5 的格子数目总格子数目的 25,则用 Fishers确切概率法检验。2.2.2 列变量为效应指标,且为有序多分类变量,行变量为分组变量,用普通的 Pearson检验只说明组间构成比不同,如要说明疗效,则可用行平均分差检验或成组的 Wilcoxon 秩和检验。2.2.3 列变量为效应指标,且为二分类变量,行变量为有序多分类变量,则可采用普通的 Pearson 检验比较各组之间有无差别,如果总的来说有差别,还可进一步作两两比较,以说明是否任意两组之间的差别都有统计学意义。2.3 RC 表资料的统计分析 2.3.1 列变量行变量均为无序分类变量,则(1)例数大于 40,且理论数小于 5 的
18、格子数目总格子数目的 25,则用 Fishers确切概率法检验。(3)如果要作相关性分析,可采用 Pearson 相关系数。2.3.2 列变量为效应指标,且为有序多分类变量,行变量为分组变量,用普通的 Pearson检验只说明组间构成比不同,如要说明疗效或强弱程度的不同,则可用行平均分差检验或成组的 Wilcoxon 秩和检验或 Ridit 分析。2.3.3 列变量为效应指标,且为无序多分类变量,行变量为有序多分类变量,则可采用普通的 Pearson 检验比较各组之间有无差别,如果有差别,还可进一步作两两比较,以说明是否任意两组之间的差别都有统计学意义。2.3.4 列变量行变量均为有序多分类变
19、量(1)如要做组间差别分析,则可用行平均分差检验或成组的Wilcoxon秩和检验或Ridit分析。如果总的来说有差别,还可进一步作两两比较,以说明是否任意两组之间的差别都有统计学意义。(2)如果要做两变量之间的相关性,可采用 Spearson 相关分析。2.4 配对分类资料的统计分析 2.4.1 四格表配对资料(1)bc40,则用 McNemar 配对检验。(2)bc40,则用校正的配对检验。2.4.1 CC 资料(1)配对比较:用 McNemar 配对检验。(2)一致性检验,用 Kappa 检验。资料 3 在研究设计时,统计方法的选择需考虑以下6个方面的问题:(1)看反应变量是单变量、双变量
20、还是多变量;(2)看单变量资料属于 3 种资料类型(计量、计数及等级资料)中的哪一种;(3)看影响因素是单因素还是多因素;(4)看单样本、两样本或多样本;(5)看是否是配对或配伍设计;(6)看是否满足检验方法所需的前提条件,必要时可进行变量变换,应用参数方法进行假设检验往往要求数据满足某些前提条件,如两个独立样本比较 t 检验或多个独立样本比较的方差分析,均要求方差齐性,因此需要做方差齐性检验。如果要用正态分布法估计参考值围,首先要检验资料是否服从正态分布。在建立各种多重回归方程时,常需检验变量间的多重共线性和残差分布的正态性。表 1-1 连续因变量 分类因变量 连 续 自 变量 回归分析 L
21、ogistic 回归 分类自变量 方差分析(ANOVA)表格检验(比如卡方检验)不同的统计分析方法都有其各自的应用条件和适用围。实际应用时,必须根据研究目的、资料的性质以及所要分析的具体容等选择适当的统计分析方法,切忌只关心 p 值的大小(是否0.05),而忽略统计分析方法的应用条件和适用围。一、两个变量之间的关联性分析 1.两个变量均为连续型变量 1)小样本并且两个变量服从双正态分布,则用 Pearson 相关系数做统计分析 2)大样本或两个变量不服从双正态分布,则用 Spearman 相关系数进行统计分析 2.两个变量均为有序分类变量,可以用 Spearman 相关系数进行统计分析 3.一
22、个变量为有序分类变量,另一个变量为连续型变量,可以用 Spearman 相关系数进行统计分析 二、回归分析 1.直线回归:如果回归分析中的残差服从正态分布(大样本时无需正态性),残差与自变量无趋势变化,则直线回归(单个自变量的线性回归,称为简单回归),否则应作适当的变换,使其满足上述条件。2.多重线性回归:应变量(Y)为连续型变量(即计量资料),自变量(X1,X2,Xp)可以为连续型变量、有序分类变量或二分类变量。如果回归分析中的残差服从正态分布(大样本时无需正态性),残差与自变量无趋势变化,可以作多重线性回归。1)观察性研究:可以用逐步线性回归寻找(拟)主要的影响因素 2)实验性研究:在保持
23、主要研究因素变量(干预变量)外,可以适当地引入一些其它可能的混杂因素变量,以校正这些混杂因素对结果的混杂作用 3.二分类的 Logistic 回归:应变量为二分类变量,自变量(X1,X2,Xp)可以为连续型变量、有序分类变量或二分类变量。1)非配对的情况:用非条件 Logistic 回归(1)观察性研究:可以用逐步线性回归寻找(拟)主要的影响因素(2)实验性研究:在保持主要研究因素变量(干预变量)外,可以适当地引入一些其它可能的混杂因素变量,以校正这些混杂因素对结果的混杂作用 2)配对的情况:用条件 Logistic 回归(1)观察性研究:可以用逐步线性回归寻找(拟)主要的影响因素(2)实验性
24、研究:在保持主要研究因素变量(干预变量)外,可以适当地引入一些其它可能的混杂因素变量,以校正这些混杂因素对结果的混杂作用 4.有序多分类有序的 Logistic 回归:应变量为有序多分类变量,自变量(X1,X2,Xp)可以为连续型变量、有序分类变量或二分类变量。1)观察性研究:可以用逐步线性回归寻找(拟)主要的影响因素 2)实验性研究:在保持主要研究因素变量(干预变量)外,可以适当地引入一些其它可能的混杂因素变量,以校正这些混杂因素对结果的混杂作用 5.无序多分类有序的 Logistic 回归:应变量为无序多分类变量,自变量(X1,X2,Xp)可以为连续型变量、有序分类变量或二分类变量。1)观
25、察性研究:可以用逐步线性回归寻找(拟)主要的影响因素 2)实验性研究:在保持主要研究因素变量(干预变量)外,可以适当地引入一些其它可能的混杂因素变量,以校正这些混杂因素对结果的混杂作用。资料 4 一统计方法抉择的条件 在临床科研工作中,正确地抉择统计分析方法,应充分考虑科研工作者的分析目的、临床科研设计方法、搜集到的数据资料类型、数据资料的分布特征与所涉及的数理统计条件等。其中任何一个问题没考虑到或考虑有误,都有可能导致统计分析方法的抉择失误。此外,统计分析方法的抉择应在科研的设计阶段来完成,而不应该在临床试验结束或在数据的收集工作已完成之后。对临床科研数据进行统计分析和进行统计方法抉择时,应
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- SPSS 数据 分析 医学 统计 方法 选择
限制150内