《统计方法卡方精品文稿.ppt》由会员分享,可在线阅读,更多相关《统计方法卡方精品文稿.ppt(30页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、统计方法卡方第1页,本讲稿共30页第一节第一节 流行病学数据分析前的准备工作流行病学数据分析前的准备工作第2页,本讲稿共30页一、原始数据的检查在数据分析前需要对原始的流行病学调查研究数据进行一次审查,发现可能存在的错误、遗漏的研究变量取值和其他问题,并采取相应的措施进行处理。第3页,本讲稿共30页二、选择合适的数据管理和数据分析软件 常用的数据管理软件有:Epi-info,Epidata,Microsoft FoxPro、Microsoft Access、Microsoft Excel 应用广泛的数据分析软件有:SAS 和 SPSS 第4页,本讲稿共30页三、数据的计算机录入录入数据之前有要
2、做:一是给每一个调查表或调查对象一个编号以识别录入的数据与调查表或调查对象的对应关系二是给输入的变量定义名称 三是需要对变量的调查结果进行数量化 四是检查数据的结构 第5页,本讲稿共30页四、数据的检查与核对在原始数据输入计算机后,还应对数据作进一步的检查与核对。主要包括:数据库样本数(观测数)的检查核对各变量取值情况的检查核对第6页,本讲稿共30页五、数据的整理(一)数据的分组分类变量,可按其原有的分类进行分组;数值变量可以按照其实际的生理、病理或临床意义进行分组。(二)数据的转换第7页,本讲稿共30页数据的转换非正态数据的变量转换数据变量转换的方法很多,可以根据数据的分布特征,选择合适的数
3、据转换方法。常用的方法有对数变换,平方根变换或倒数变换等。分类变量转换成哑变量 第8页,本讲稿共30页六、确定拟分析的因变量和自变量因变量是指反映疾病的发生或健康状况分布的变量,是结果变量,即因变量是在自变量的作用下产生反应的变量。那些影响疾病或健康状况的变量则称为自变量,是原因变量,即自变量是导致因变量变化的变量。第9页,本讲稿共30页七、缺失数据的处理缺失数据是指其测量结果缺失,例如在问卷调查时遗漏出生日期和年龄,调查结束后又无法补救而使个别研究对象的年龄成为缺失数据;血脂或血糖因为血清量不足或研究对象拒绝采血而导致某些研究对象实验室的检测结果成为缺失数据。第10页,本讲稿共30页第二节第
4、二节 流行病学数据分析方法的选择指南流行病学数据分析方法的选择指南第11页,本讲稿共30页一、流行病学数据的分析程序在进行流行病学数据分析之前,首先需要根据数据的性质了解数据分析的程序,作为数据分析的指导。具体的分析程序见图。第12页,本讲稿共30页数值变量的分析程序 数值变量 正态性检验 正态 非正态 参数检验 非参数检验 第13页,本讲稿共30页分类变量的分析程序 分类变量单因素分析 多因素分析 卡方检验 分层分析 logistic回归分析 Cox回归分析 其它分析方法 第14页,本讲稿共30页二、根据研究设计类型选择(一)成组比较的设计(二)配对设计(三)重复测量的设计(四)多因素设计第
5、15页,本讲稿共30页三、根据变量的类型选择因变量自变量数值变量分类变量有序变量数值变量相关分析,多元回归分析t检验,方差分析,协方差分析,多元回归分析相关分析,多元回归分析分类变量t检验,方差分析,logistic回归分析,判别分析,聚类分析c2检验,logistic回归分析c2检验有序变量方差分析,logistic回归分析,判别分析,聚类分析c2检验,logistic回归分析相关分析,c2检验生存时间生存分析第16页,本讲稿共30页不同研究设计和数据类型的数据分析方法选择 变量类型研究设计类型两组比较两组以上比较实验前后比较重复测量两变量间的联系数值变量t检验方差分析配对t检验重复测量的方
6、差分析线性回归,Pearson相关系数分类变量c2检验c2检验配对c2检验列联表相关系数有序变量Mann-Whitney秩和检验Kruskal-Wallis分析Wilcoxon符号秩和检验Spearman相关系数生存时间生存分析第17页,本讲稿共30页第三节第三节 不同流行病学研究类型不同流行病学研究类型的数据分析方法的数据分析方法第18页,本讲稿共30页一、描述性研究的数据分析方法(一)现况研究在现况研究中通常描述研究人群的患病率、危险因素的流行率及数值变量的分布情况,可以使用相关或回归分析、c2检验、t检验及方差分析等方法分析数据。在现况研究中根据数据的情况也可以使用多因素分析方法,还可以
7、应用现况研究的数据估计人群归因危险度等。(二)生态学研究(三)筛检第19页,本讲稿共30页二、分析性研究的数据分析方法(一)病例对照研究(二)队列研究第20页,本讲稿共30页病例对照研究数据的分析程序 病例对照研究数据成组设计 粗OR分级OR剂量反应关系分析 趋势卡方检验 分层OR 混杂与效应修饰分析 配比设计 分层OR 分级OR 剂量反应关系分析趋势卡方检验 混杂与效应修饰分析 第21页,本讲稿共30页 队列研究数据的分析程序 队列研究数据 人时、发病密度/累积发病率的计算 粗RR、AR、AR%、PAR及PAR%的计算 分层RR、AR、AR%、PAR及PAR%的计算 分级RR、AR、AR%、
8、PAR及PAR%的计算 第22页,本讲稿共30页三、实验研究的数据分析方法实验研究的数据分析方法可以分析效果指数、保护率或干预组与对照组某疾病的发病率、危险因素的暴露率及数值变量均值水平的差异,可能的显著性检验方法有卡方检验、t检验及方差分析等。第23页,本讲稿共30页第四节第四节 流行病学数据的表达与报告方法流行病学数据的表达与报告方法第24页,本讲稿共30页一、数据的报告顺序首先应该报告研究对象的人口学数据及描述统计量的数据,其次报告单因素的分析结果,最后报告多因素的分析结果。也可按照研究变量的特点依一定的逻辑顺序进行报告,或按照个人生活方式因素、家族遗传因素、社会心理因素、实验室及体格检
9、查结果等顺序进行报告。第25页,本讲稿共30页二、非正态数据的表达与报告对于非正态数据有不同的报告策略,可以报告中位数、最小值及最大值,也可以报告中位数、25%分位数、75%分位数、最小值及最大值,也可以报告均值、中位数再配合以上的变异指标。对于进行变量转换的数据,可以报告原始值,也可以报告其转换值。第26页,本讲稿共30页三、数据表达与报告中图、表及文字的使用在数据表达与报告中要合理地使用图、表和文字,以使报告的数据生动活泼、简洁明了,易于让读者看懂并理解,但要协调好三者间的关系。第27页,本讲稿共30页第五节第五节 流行病学数据分析中存在的问题流行病学数据分析中存在的问题第28页,本讲稿共30页不重视人口学数据及描述性统计量的分析忽视分析方法的应用条件数据的分组方法不合理 在多因素分析中分类变量未转换为哑变量 第29页,本讲稿共30页多因素分析中未进行模型拟合度的检验 需要分析的数据未进行统计学分析 缺失数据的处理 相对数的误用 忽视对协变量效应的控制第30页,本讲稿共30页
限制150内