试验数据统计分析步骤.docx
《试验数据统计分析步骤.docx》由会员分享,可在线阅读,更多相关《试验数据统计分析步骤.docx(29页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、试验数据统计分析教程则要求两个变量均为随机变量且服从正态分布,也就是说只有H型回归分析资料才能进行直线相关分析(Spearman 秩相关分析可分析定量资料与定性资料的相关性)。统计量量纲单位不同相关系数是无量纲的统计量,而斜率却是有量纲的统计量,其量纲为“响应变量量纲自变量量纲”,截距的量纲与响应变量量纲 相同史。2,相关和回归分析的相同点方向一致对某资料同时计算直线相关系数和直线回归系数,可发现它们的正负号一致。假设检验等价对同一样本,对其直线相关系数和直线回归系数进行假设检验所得到的值是相同 的。3, 直线相关与回归分析的关键点(绘制散布图)将(X, Y)的n对数值绘在直角坐标系内, 得到
2、X与Y变化趋势的散布图,如果n个点形成的散布图呈一条明显的曲线趋势时,宜拟合一条曲线回归方程;如果n个点在一条不太宽的长带内随机地分布着,此“长带”不与X轴平行,也不与Y轴垂直,10/29且各散点的分布情况不存在明显的曲线趋势,可考虑进行直线相关和回归分析;如果n个点形成的散布图近似于一个圆盘,则说明X与Y之间无确定的变化趋势, 几乎是互相独立的,不能硬把他们捏合在一起分析。4,直线相关与回归分析要点总结必须有专业知识为依据;必须绘制散布图,并正确分析散布图;计算关键的统计量(如r、a、b),并进行假设检验;结合专业和统计学知识判断所作的统计分析是否有实用价值。若是直线相关分析,就是要结合s的
3、数值大小(一般应20.5),给出较为明确的专业结论;若是直线回归分析,就是要看所拟合的直线回归方程与全部散点的吻合程度,对直线回归方程中的2个参数(总体截距、总体斜率)的假设检验是否都具有统计学意义,其正负号是否符合专业上的含义,整个直线回归方程的剩余标准差是否较小,将各X值代入直线回归方程后,其对应的Y的预测值在专业上是否都成立。二、一元多因素回归分析方法当结果变量(常称为应变量)依赖于原因变量(常称为自变量)变化时,研究应变量随多个自变量变化的规律所对应的统计分析11 /29方法,称为多重回归分析。进行多重回归分析时应把握的要领如下当应变量为近似服从正态分布的随机变量时,常选用多重线性回归
4、 分析。当应变量分别为二值变量、多值有序变量或多值名义变量时,应分 别采用一般的多重logistic回归分析、有序变量的多重logistic 回归分析和扩展的多重logistic回归分析。备注:可用Grubbs法检验某些“可疑值”是否为异常值。1-6 :定性资料的统计分析一、定性资料与列联表定性资料(如治愈、未愈),一般不以个体为计量单位,而是以 处理组为计量单位,换句话说,资料以分组且用表格的形式呈现出 来,这种表通称为“列联表一般来说,一个列联表中只有一个结果变量,其他都是原因变 量,但也有少数列联表中的变量不包含结果变量,此时只能考察全 部定性变量全部水平组合下的频数分布情况。定性资料有
5、些属于原因、有些属于结果,若将定性变量的具体 取值一一列出,则不便看出资料之间内在的联系,故人们常以表格 的形式对资料进行整理或归纳,这种表格被称为列联表。只含有两 个定性变量,因而叫做二维列联表,表中的原始频数只有两行两列12/29,简称为2x2表或四格表;而表中的原始频数占3行4列,故简称为3x4表,一般被简称为RxC表;表中含有3个定性变量,故被称为三维列联表,当列联表中定性 变量的个数大于等于3时,一般被统称为高维列联表。二、定性资料分析步骤正确地实现定性资料的统计分析,关键是三点。其一,给定性资料所对应的列联表命名;其二,弄清统计分析的目的;其三,检查定性资料是否具备某些特定分析方法
6、所要求的前提条件。每次只分析两个定性变量时,可将资料整理为2x2表、2xk和RxX表的形式。常用的统计分析方法有Pearson次检验、校正%2检验、配对计数资料的MxNemarx%2检验、Fisher 的精确检验、秩和检验、Rid让分析、等级相关分析、典型相关分析、 一般趋势和线性趋势检验、Kappa检验等;若需要同时分析的定性 变量的个数N3时,常用的统计分析方法有加权%2检验、Mantel- haenszel总检验、logisMx回归模型和对数线性模型等。一般浮检验与变量的有序性没有联系,用一般浮检验进行分析 ,得到的结论是两组的频数分布是否相同,而不能得出两组疗效之 间的差别是否具有显著
7、意义的结论。一般%2检验只能用来考察列联 表资料的行变量与列变量之间是否独立。分析定性资料的相关分析 方法,如:Spearman秩相关分析,Kendall 秩相关分析或典型相关分析。13/29三、2x2表资料的分析方法1, 2x2表资料分析方法概述关于2 x2表资料的统计分析方法的合理选择:2x2表资料的统计分析方法取决于其设计类型,即横断面研究设计、队列研究设计、病例对照研究设计和配对设计四种类型,每种类型 又需考虑一些具体情况,方可选择较为合适的统计分析方法处理资 料。常用的方法有:一般总检验、校正%2检验、Fisher的精确检验;计算相对危险度(RR) 、计算比数比(OR)、检验总体RR
8、(或OR)与1之间的差别是否具有统计学意义的%2MH检验;配对设计 定性资料的McNemar为2检验。一般认为,2x2表资料采用Fisher精确检验法结果比较可靠,若用统计软件实现统计计算,均可选用F isher精确检验计算的结果。对于二维列联表而言,一般可分为以下4类:第1类:双向无序的二维列联表。当表中小于5的理论频数的个 数小于总格子数的1 /5时,需要选用Fisher的精确检验,否则,可以选用建检验。若是2x2表(或称四格表),应根据实验设计类型,选择相应的统计分析方 法:若属横断面研究设计,当缺乏统计软件进行Fisher精确计算时, 还可考虑用校正的%2检验;若属队列研究设计或病例对
9、照研究设计,先将其视为横断面14/29研究设计资料处理,当得到Pv0.05时,在求出相对危险度RR(队列研究设计时用)或比数比OR(病例2对照研究设计时用)后,用%2MH计算公式检验RR(或OR)是否等于1。第2类:结果变量为有序变量的二维列联表。此时,所选用的统 计分析方法必须与结果变量的有序性有联系,可供选用的统计分析 方法有“秩和检验Ridt分析呜“有序变量的Logistic回归分析”。第3类:双向有序且属性不同的二维列联表。此时,根据实际情 况可能提出四个不同的分析目的,将对应四套分析方法:目的一: 仅关心结果变量的有序性,可将其视为前面介绍的“第2类列联表”, 选择相应的统计分析方法
10、;目的二:希望研究两有序变量之间的相 关性的高低,此时宜选用定性资料的相关分析,如Spearman秩相关 分析或典型相关分析;目的三:希望研究两有序变量之间是否存在 线性变化趋势,可以选用线性趋势检验;目的四:希望研究各实验 分组中的频数分布是否相同,此时可选用一般水检验或Fisher精确检验(注意:此时的结论不应该是“行变量与列变量 之间呈正相关或负相关关系o第4类:双向有序且属性相同的二维列联表。这种表一般都是考 察用两种类似的检测方法检测同-一批样品,看检测结果是否一致, 故需要做一致性检验或称Kappa检验。若是2x2表时,通常称为配对设计的四格表,此时,常检验不一致部分相 差是否具有
11、统计学意义,用McNemar%215/29检验;当然,也可做一致性检验。但这两种检验的目的和对检验结 果的解释是不同的。2, 3种分析2x2表资料的方法的注意事项一般的%2检验;连续性校正的浮检验;Fisher的精确检验。选择条件:当总样本含量n 240,且理论频数T均大于5时,选用方法;当总样本含量n40,但有理论频数满足仁Tv5时,选用方法;当总样本含量n40或有理论频数小于1时,选用方法。样本较小的定性资料的统计分析,一般不宜采用工 2检验,而应选用Fisher的精确检验来处理。配对研究设计的2x2表资料,对于隐含金标准和特设金标准的 2x2表资料,可有2种统计分析方法:检验2种方法检测
12、结果不一致 部分差异是否具有统计学意义,可用McNemar%2检验公式计算;检验2种检测方法检测结果是否具有一致性,可 用Kappa检验(即一致性检验)法。比较两种检测方法的检测结果是否一致,原本属于配对设计问 题,但人们在收集资料时常按成组设计形式列表,这样就将配对设 计问题人为地转化为成组设计的问题了,通常都会降低检验的功效16/29不:格,靴长?修改行的形式)1720-IS2J0合格4、公路frit21198什格13不介解c417一 H建120袅i anttm力处理前篇检鹿第唳( & 修改后的形式)去3饵坟甘祈3处理花行疗介知T (& I戒3,理论频数的计算方法 1两一为WRMW/制现告
13、累一;2敷/泊一-itffW AM =V.两者取值均在0至1之间. 其值越大,表示关联悴越怪口 Lambda:减少预测误差率,取值在。乍I之间,】表小弦测效果最好,0表示雄 差. Uncertainly coetllcieni:不定系虬25/29o Ordinal:两忏序分类变里(等级变城)的X联度测量.Gamma:测量两个等级变垃之间关联度的统计殳.Y MP-Q)/(P4 Q),这里,P 为和谐对f数(Concordant pairs). Q为非和谐时子数 Discordant pairs). 丫取值在一】 干+1之间,+1我小完全正关联(Perfect positive relations
14、hip)* I表示完全女美联 (Perfect negative relationship). U 表示无关联. Somersd:该统计量为Gamma统“星的非对称形式的扩展,与Gamma统计呈恪 一小同的是,分母部分加I.中性对子数(Tied pairs).其取值危困及母义与Gamma相同.二Kendalls tau-b:计算式为:】/(P - Q V(P+Q- Tx)X(P+Q+Ty).这里. Tx为第1个变量的中性数.丁丫为第2个变量的中性数.门Kendalls tau-c:匹算式为:tc=2nMP-Q)/(N?m-I),这里,m为打数和列数中 较小的数,N为样本总例数.O Nomina
15、l by Interval:一个定性变域和个定量变量间的关联度。口 EU:关联度统计纪. Kappa:k系数,为吻合度测量(Measure of agreement)系数.用以测俄两观测 者或两观测设得之间的吻合程度,取值一I至+12何,其值越大,说明吻合程度越高. Risk:危险度分析,只适于四格衣资料,可纶出相对危险度和比数比(Odds皿沁) McNcman配对计数灸科的x ?检验. Cochrans and Mantel-Haenszel statistics: Mamel-Haenszd 公共 OR 值检验,用以 检验在协变依(分层变量)存在条件卜,两个二分类变量是否独立选此项后,Te
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 试验 数据 统计分析 步骤
限制150内