《卫生统计学考试复习资料:统计修改.docx》由会员分享,可在线阅读,更多相关《卫生统计学考试复习资料:统计修改.docx(18页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、卫生统计学考试复习资料:统计修改一、 多重线性回来 1、绘制散点图:脂联素空腹血糖瘦素 病程体重指数体重指数病程瘦素空腹血糖脂联素 散点图提示瘦素、体重指数与脂联素存在线性关系 2、正态性检验:K-S 值=0.100,P=0.200>0.10,认为 Y 值(脂联素)听从正态分布 Tests of Normality.100 30 .200* .960 30 .319 脂联素Statistic df Sig. Statistic df Sig.Kolmogorov -SmirnovaShapiro-WilkThis is a lower bound of the true signific
2、ance.*. Lilliefors Significance Correctiona.3、方差齐性检验:P>0.10,方差齐性。(可用残差图检验正态性和方差齐性)综上可知,资料满意线性,样本中各个体之间相互独立,因变量听从正态分布,方差齐性,故可进行多重线性回来分析。4、构建多重线性回来方程:Ý=b0+b1X1+b2X2+b3X3+b4X4 5、回来方程的假设检验 建立假设检验,确立检验水准: H0:β1=β2=β3=β4=0 H1:β1,β2,β3,β4 不全为 0 α=0.05
3、 方差分析结果如下:ANOVAb1773.346 4 443.336 17.000 .000 a651.955 25 26.0782425.301 29RegressionResidualTotalModel1Sum ofSquares df Mean Square F Sig.Predictors: (C onstant ), 空腹血糖, 体重指数, 病程, 瘦素a. Dependent Variable: 脂联素b. F=17.000,P<0.001,差异有统计学意义,故拒绝 H0,接受 H1,认为见相关系数 βi 不全为零,该回来模型有统计学意义,用这四个自变量构成的回来
4、方程说明脂联素的改变有意义。6、计算确定系数 Model Summaryb.855 a .731 .688 5.10668Model1R R SquareAdjustedR SquareStd. Error ofthe EstimatePredictors: (Constant), 空腹血糖, 体重指数, 病程, 瘦素a. Dependent Variable: 脂联素b. 确定系数 R2=0.731,说明利用体重指数、病程、空腹血糖、瘦素等四个因素可以说明脂联素的约 73.1%的变异,可以认为回来效果较好。调整的确定系数 R2ad=0.688<0.731,说明在回来方程中存在一些对反应
5、变量贡献很小或没有贡献的自变量。7、各偏回来系数的假设检验: 建立假设检验,确立检验水准 H0:βi=0;H1:βi≠0;α=0.05 t 检验结果如下 Coefficientsa58.199 11.575 5.028 .000 34.359 82.039-1.030 .530 -.343 -1.942 .063 -2.122 .062-.131 .211 -.067 -.621 .540 -.566 .304-.811 .253 -.566 -3.211 .004 -1.332 -.291-.579 .447 -.139 -1.293 .208 -1.5
6、00 .343(Constant)体重指数病程瘦素空腹血糖Model1B Std. ErrorUnstandardizedCoefficientsBetaStandardizedCoefficientst Sig. Lower Bound Upper Bound95% Confidence Interval for BDependent Variable: 脂联素a. 体重指数:t1=-1.942,P=0.63>0.05,故不拒绝 H0,认为 β1=0.即体重指数对脂联素的影响无统计学意义。病程:t2=-0.621,P=0.054>0.05,故不拒绝 H0,认为 &bet
7、a;2=0.即病程对脂联素的影响无统计学意义。瘦素:t3=-3.211,P=0.005<0.005,故拒绝 H0,接受 H1,认为 β3≠0.即瘦素对脂联素的影响有统计学意义。空腹血糖:t4=-1.293,P=0.208>0.05,故不拒绝 H0,认为 β4=0.即病程对脂联素的影响无统计学意义。综上,估计回来方程为 Ý=58.199-0.811X(瘦素) 8、绘制残差图 30.00000 20.00000 10.00000 0.00000Uns ta nda rdize d P re dicte d Va lue2.000001.00000
8、0.00000-1.00000-2.00000Standardized Predicted Value 由残差图可知,X 值(瘦素)变动时,相应的 Y 值(脂联素)有相应的变动,两变量间有线性关系,两变量满意方差齐性。 二,c Logistic 回来分析因为因变量为二分类变量,取值只有 0 和 1,故采纳 Logistic 回来分析。1、Logistic 回来模型的基本结构:Ln(p/1-p)=β0+β1X1+β2X2+β3X3 2、Logistic 回来方程的假设检验 建立假设检验,确立检验水准: H0:β1=β2=β3=
9、β4=0 ,模型无统计学意义 H1:β1,β2,β3,β4 不全为 0,模型有统计学意义 α=0.05 卡方检验结果如下:Omnibus Tests of Model Coefficients21.730 3 .00021.730 3 .00021.730 3 .000StepBlockModelStep 1Chi-square df Sig.由上表可知:卡方值 X2=21.730, P<0.001,故在 α=0.05 水准下拒绝 H0,接受 H1,认为模型有统计学意义。3、Logistic 回来的参数估计及假设检
10、验 建立假设,确立检验水准:H0:βi=0;H1:βi≠0 α=0.05 统计结果如下:Variables in the Equation1.110 .348 10.142 1 .001 3.034 1.532 6.007.703 .329 4.559 1 .033 2.019 1.059 3.850.975 .344 8.036 1 .005 2.651 1.351 5.203-2.086 .351 35.263 1 .000 .124X1X2X3ConstantStep1aB S.E. Wald df Sig. Exp(B) Lower Upper95
11、.0% C.I.for EXP(B)Variable(s) entered on step 1: X1, X2, X3.a. 由上表可知:X1:Wald X2=10.142,P=0.001<0.05,故在 α=0.05 检验水准下 拒绝 H0,接受 H1,认为抢救前是否有休克对抢救结果有影响。β1>0,Exp(B)=3.034,说明休克是增加死亡优势的危急因素,当其他变量取固定值时,抢救前已休克的死亡风险是抢救前无休克的死亡风险的 3.034 倍。X2:Wald X2=4.559,P=0.33<0.05,故在 α=0.05 检验水准下 拒绝
12、H0,接受 H1,认为抢救前是否有心衰对抢救结果有影响。β2>0,Exp(B)=2.019,说明心衰是增加死亡优势的危急因素,当其他变量取固定值时,抢救前发生心衰的死亡风险是未发生心衰死亡风险的 2.019 倍。X3:Wald X2=8.036,P=0.005<0.05,故在 α=0.05 检验水准下 拒绝 H0,接受 H1,认为能否刚好送往医院对抢救结果有影响。β3>0,Exp(B)=2.651,表明未能刚好送往医院是增加死亡优势危急因素,当其他变量取固定值时,未能刚好送往医院的死亡风险是刚好送往医院的死亡风险的 2.65 倍。综上所述,得出
13、 Logistic 回来方程:Ln(p/1-p)=-2.086+ 1.110 X1+ 0.703 X 2+ 0.975 X 3三、卡方检验:该资料为计数资料,故采纳非参数检验:卡方检验。建立假设检验,确立检验标准 H0:两种药物疗效相同; H1:两种药物疗效不同。α=0.05 结果如下:Chi-Square Tests1.086 b 1 .297.611 1 .4341.090 1 .297.435 .2171.068 1 .30160Pearson Chi-SquareContinuity CorrectionaLikelihood RatioFishers Exact Test
14、Linear-by-LinearAssociationN of Valid CasesValue dfAsymp. Sig.(2-sided)Exact Sig.(2-sided)Exact Sig.(1-sided)Computed only for a 2x2 tablea. 0 cells (.0%) have expected count less than 5. The minimum expected count is 13.00.b. 卡方值 X2=1.086,自由度 v=1,P=0.297>0.05,差异无统计学意义,故不拒绝 H0,不能认为两种药物疗效不相同。四、 简洁
15、线性相关与回来1、绘制散点图 15.0 12.0 9.0 6.0 3.0 0.0距离(km)距离(km)40302010就 就诊 诊率 率( (% % )由散点图可知两变量存在线性关系,就诊率随距离的增加呈直线下降趋势。2、正态性检验 Tests of Normality.127 16 .200* .953 16 .532 距离(km)Statistic df Sig. Statistic df Sig.Kolmogorov -SmirnovaShapiro-WilkThis is a lower bound of the true significance.*. Lilliefors Sig
16、nificance Correctiona.Tests of Normality.104 16 .200* .944 16 .403 就诊率(%)Statistic df Sig. Statistic df Sig.Kolmogorov -SmirnovaShapiro-WilkThis is a lower bound of the true significance.*. Lilliefors Significance Correctiona. 由上表可知距离与就诊率的 K-S 分别为 0.127 和 0.104,P 值均为 0.200>0.10,两变量均来自正态分布总体。因两变量为
17、随机变量且各样本相互独立,两变量存在线性关系均听从正态分布,故可进行Pearson 相关分析。(假如不满意双变量正态分布,则用 Spearman 秩相关,要对原始数据进行编秩再分析)3、计算相关系数,对相关系数进行假设检验:建立假设检验,确立检验水准:H0:ρ=0; H1:ρ≠0;α=0.05 Correlations1 -.989*.00016 16-.989* 1.00016 16Pearson CorrelationSig. (2-tailed)NPearson CorrelationSig. (2-tailed)N就诊率距离就诊率 距离Correlat
18、ion is significant at the 0.01 lev el(2-tailed).*.由上表可知 pearson 相关系数 r=-0.989,P<0.001,按 =0.05 水准故拒绝 H0,接受 H1,认为ρ≠0,两变量间线性相关有统计学意义。r=-0.994<0,说明两变量间存在很强的负相关。4、方差齐性检验:残差图中散点分布围绕 e=0 为中心分布,故可推断方差齐性。0.16000 0.14000 0.12000 0.10000 0.08000 0.06000 0.04000 0.02000 0.00000 -0.02000Uns ta nda r
19、dize d P re dicte d Va lue Uns ta nda rdize d P re dicte d Va lue4.000002.000000.00000-2.00000-4.00000Standardized Residual Standardized Residual4、综上可知,变量间满意线性、独立、正态及等方差的前提,可进行线性回来分析。5、建立回来模型,估计线性回来方程:Y=α+βX 6、线性回来方程的假设检验:建立假设检验,确立检验水准:H0:总体回来方程不成立或总体中自变量 X 对因变量 Y 没有贡献。H1:总体回来方程成立或总体中自变量
20、X 对因变量 Y 有贡献。=0.05 方差分析结果如下:ANOVAb1970.787 1 1970.787 624.935 .000 a44.150 14 3.1542014.938 15RegressionResidualTotalModel1Sum ofSquares df Mean Square F Sig.Predictors: (C onstant ), 距离(km)a. Dependent Variable: 就诊率(%)b.F=624.935,P<0.001,按 =0.05 水准拒绝 H0,接受 H1,可认为距离与就诊率之间的回来方程具有统计学意义。7、回来系数假设检验:建
21、立假设检验,确立检验水准:H0:β=0; H1:β≠0;α=0.05 Coefficientsa47.779 .945 50.584 .000 45.753 49.805-3.529 .141 -.989 -24.999 .000 -3.832 -3.226(Constant)距离(km)Model1B Std. ErrorUnstandardizedCoefficientsBetaStandardizedCoefficientst Sig. Lower Bound Upper Bound95% Conf idence Interval for BDepe
22、ndent Variable: 就诊率(%)a.t=-24.999,P<0.001,按 α=0.05 水准拒绝 H0,接受 H1,认为该回来系数具有统计学意义。总体回来系数估计值 b=-3.529,双侧 95%置信区间为(-3.832,-3.226). 综上所述,得出线性回来方程为:Ý=47.779-3.529 X,说明距离每增加 1 公里,就诊率平均可能下降 3.529%。Model Summaryb.989 a .978 .977 1.79034Model1R R SquareAdjustedR SquareStd. Error ofthe Estimate
23、Predictors: (C onstant), 距离a. Dependent Variable: 就诊率b. 确定系数 R2=0.978,说明就诊率总变异的 97.%与距离有关。 五、t 检验 1、 两独立样本 t 检验 该例属完全随机设计,两样本各自独立。(1)正态性性检验Tests of Normality.163 10 .200* .955 10 .731.150 10 .200* .951 10 .683group正常窒息SDStatistic df Sig. Statistic df Sig.Kolmogorov-SmirnovaShapiro-WilkThis is a lowe
24、r bound of the true significance.*. Lilliefors Significance Correctiona. K-S 正态性检验:P 均为 0.200>0.10,故两变量均听从正态分布。(2)方差齐性检验 Test of Homogeneity of VariancesSD.104 1 18 .751LeveneStatistic df1 df2 Sig.Levene 方差齐性检验得 F=0.104,P=0.751>0.05,故方差齐性。综上,该试验属完全随机设计试验,样本相互独立、均来自正态分布总体且方差齐性,故可进行两独立样本的 t 检验。(
25、3)两独立样本的 t 检验 建立假设检验,确立检验水准:H0:μ1= μ2,即正常新生儿和窒息新生儿血液中的 SOD 总体平均水平相等。H1:μ1≠μ2,即正常新生儿和窒息新生儿血液中的 SOD 总体平均水平不相等。=0.05 Group Statistics10 141.1470 7.52181 2.3786110 126.2400 7.54533 2.38604group正常窒息SDN Mean Std. DeviationStd. ErrorMean Independent Samples Test.104 .751 4.425 18 .000 14.907
26、00 3.36912 7.82874 21.985264.425 18.000 .000 14.90700 3.36912 7.82874 21.98526Equal variancesassumedEqual variancesnot assumedSDF Sig.Levenes Test forEquality of Variancest df Sig. (2-tailed)MeanDifferenceStd. ErrorDifference Lower Upper95% ConfidenceInterval of theDifferencet-test for Equality of M
27、eans因方差齐性,故 t=4.425,P<0.001,差异有统计学意义,按 =0.05 水准拒绝 H0,接受 H1,认为正常新生儿和窒息新生儿血液中的 SOD 总体平均水平不相等,窒息新生儿血液中的 SOD平均比正常新生儿的高。 配对资料 t 检验:该资料属配对设计定量资料,且只有两个变量,故用配对资料 t 检验。1、计算差值 d 2、检验差值 d 的正态性 Tests of Normality.216 10 .200* .907 10 .258 dStatistic df Sig. Statistic df Sig.Kolmogorov-SmirnovaShapiro-WilkThi
28、s is a lower bound of the true significance.*. Lilliefors Significance Correctiona. K-S 正态性检验:P=0.200>0.10,表明 d 来自正态分布总体。3、t 检验 建立假设检验,确立检验水准:H0:μd=0,即新药与比照组平均瘤重相等 H1:μd≠0,即新药与比照组平均瘤重不相等 =0.05 Paired Samples Statistics.6060 10 .16854 .05330.4350 10 .10491 .03317比照组新药组Pair1Mean N Std. Dev
29、iationStd. ErrorMean Paired Samples Test.17100 .16576 .05242 .05242 .28958 3.262 9 .010 比照组 - 新药组 Pair 1Mean Std. DeviationStd. ErrorMean Lower Upper95% ConfidenceInterval of theDifferencePaired Diff erencest df Sig. (2-tailed)t=3.262,P=0.010<0.05,差异有统计学意义,按 =0.05 检验水准拒绝 H0,接受 H1,认为新药与比照组平均瘤重不相等,
30、运用新药治疗后平均瘤重较低。 六,方差分析1、完全随机设计方差分析:由资料可知该试验设计为完全随机设计,变量值为计量资料,各样本是相互独立的随机样本。(1)正态性检验 Tests of Normality.128 10 .200* .958 10 .757.174 10 .200* .913 10 .300.169 10 .200* .922 10 .378.129 10 .200* .925 10 .400group比照组低剂量组中剂量组高剂量组耐氧时间Statistic df Sig. Statistic df Sig.Kolmogorov -SmirnovaShapiro-WilkThi
31、s is a lower bound of the true significance.*. Lilliefors Significance Correctiona. 由上表 K-S 检验知各个样本均来自正态分布总体。(2)方差齐性检验 Test of Homogeneity of Variances耐氧时间.954 3 36 .425LeveneStatistic df1 df2 Sig.F=0.425>0.10,方差齐性。综上,该试验设计为完全随机设计,各样本是相互独立的随机样本;各样本都来自正态总体;各总体方差相等,故采纳完全随机设计方差分析比较各样本均数。(3)方差分析 建立假设
32、,确立检验水准 H0:μ1=μ2=μ3=μ4,即四组小鼠平均耐氧存活时间相等; H1:μ1、μ2、μ3、μ4 不全相等,即四组小鼠平均耐氧存活时间不全相等; α=0.05 计算检验统计量如下:ANOVA耐氧时间767.346 3 255.782 17.528 .000525.349 36 14.5931292.695 39Between GroupsWithin GroupsTotalSum ofSquares df Mean Square F Sig.F=17.528,P<0.001,按 α=0.05 水准,拒绝
33、H0,接受 H1,认为不同剂量的茶多酚保健饮料对延长小白鼠的平均耐氧存活时间有差别。(4)对各个样本进行两两比较Multiple ComparisonsDependent Variable: 耐氧时间-.95100 1.70839 .581 -4.4158 2.5138-6.01700* 1.70839 .001 -9.4818 -2.5522-10.94900* 1.70839 .000 -14.4138 -7.4842.95100 1.70839 .581 -2.5138 4.4158-5.06600* 1.70839 .005 -8.5308 -1.6012-9.99800* 1.708
34、39 .000 -13.4628 -6.53326.01700* 1.70839 .001 2.5522 9.48185.06600* 1.70839 .005 1.6012 8.5308-4.93200* 1.70839 .007 -8.3968 -1.467210.94900* 1.70839 .000 7.4842 14.41389.99800* 1.70839 .000 6.5332 13.46284.93200* 1.70839 .007 1.4672 8.3968-.95100 1.70839 1.000 -5.7208 3.8188-6.01700* 1.70839 .007 -
35、10.7868 -1.2472-10.94900* 1.70839 .000 -15.7188 -6.1792.95100 1.70839 1.000 -3.8188 5.7208-5.06600* 1.70839 .032 -9.8358 -.2962-9.99800* 1.70839 .000 -14.7678 -5.22826.01700* 1.70839 .007 1.2472 10.78685.06600* 1.70839 .032 .2962 9.8358-4.93200* 1.70839 .039 -9.7018 -.162210.94900* 1.70839 .000 6.17
36、92 15.71889.99800* 1.70839 .000 5.2282 14.76784.93200* 1.70839 .039 .1622 9.7018(J) group低剂量组中剂量组高剂量组比照组中剂量组高剂量组比照组低剂量组高剂量组比照组低剂量组中剂量组低剂量组中剂量组高剂量组比照组中剂量组高剂量组比照组低剂量组高剂量组比照组低剂量组中剂量组(I) group比照组低剂量组中剂量组高剂量组比照组低剂量组中剂量组高剂量组LSDBonf erroniMeanDif f erence(I-J) Std. Error Sig. Lower Bound Upper Bound95% Con
37、f idence Interv alThe mean dif f erence is signif icant at the .05 lev el.*. 耐 氧 时 间10 21.889010 22.840010 27.906010 32.8380.581 1.000 1.000group比照组低剂量组中剂量组高剂量组Sig.Student-Newman-KeulsaN 1 2 3Subset for alpha = .05Means for groups in homogeneous subsets are displayed.Uses Harmonic Mean Sample Size =
38、 10.000.a. 由以上两表可知 LSD,Bonferroni,S-N-K 法均表明比照组与低剂量组的平均耐氧存活时间无差异,中剂量组与其他三组的平均耐氧存活时间均有差异,高剂量组与其他三组的平均耐氧存活时间均有差异。高剂量组的平均耐氧存活时间最长,其次是中剂量组,低剂量组与比照组的平均耐氧存活时间无明显差别。 2 2 、 随机区组设计由资料可知该试验设计为随机区组设计,资料为计量资料,样本量大于 2,由残差图可直观推断随机区组随机区设计资料满意方差齐性,故采纳随机区组随机区组方差分析对各样本均数进行比较。(1)方差分析建立假设,确立检验水准 H0:三种不同药物作用后小鼠肉瘤重量的总体均数
39、相等; H1:三种不同药物作用后小鼠肉瘤重量的总体均数不全相等。H0:各区组的总体效应相等; H1:各区组的总体效应不全相等。均取 α=0.05Tests of Between-Subjects EffectsDependent Variable: 瘤重.456 a 6 .076 7.964 .0053.092 1 3.092 323.742 .000.228 4 .057 5.978 .016.228 2 .114 11.937 .004.076 8 .0103.625 15.533 14SourceCorrected ModelInterceptgroupdrugErrorTo
40、talCorrected TotalType III Sumof Squares df Mean Square F Sig.R Squared = .857 (Adjusted R Squared = .749)a. 处理组(drug):F=11.9378,P=0.004<0.05,按 α=0.05 水准拒绝 H0,接受 H1,认为三种不同药物作用后小鼠肉瘤重量的总体均数不全相等。区间组(group):F=5.978,P=0.16>0.05,按 α=0.05 水准接受 H0,认为各区组的小鼠平均肉瘤重的差异无统计学意义。(2)处理组间多重比较 瘤 重Stud
41、ent-Newman-Keulsa,b5 .31405 .43405 .6140.088 1.000drugC药B药A药Sig.N 1 2SubsetMeans for groups in homogeneous subsets are displayed.Based on Type III Sum of SquaresThe error term is Mean Square(Error) = .010.Uses Harmonic Mean Sample Size = 5.000.a. Alpha = .05.b. S-N-K 法两两比较结果如上,B 药组与 C 药组间无差异,A 药组与 B 药组、C 药组均有差异,故认为 A 药作用后小鼠的平均肉瘤重量比 B、C 药作用后的重,而 B、C 药作用后小鼠的平均肉瘤重量无差异。
限制150内