书签分享收藏举报版权申诉 / 89

立即下载

当前位置：首页 > 教育专区 > 教案示例 > 医学科学研究论文材料中统计方法的正确应用.doc

医学科学研究论文材料中统计方法的正确应用.doc

上传人：一***

文档编号：2777622

上传时间：2020-05-05

格式：DOC

页数：89

大小：935.72KB

( 4.5 )

《医学科学研究论文材料中统计方法的正确应用.doc》由会员分享，可在线阅读，更多相关《医学科学研究论文材料中统计方法的正确应用.doc（89页珍藏版）》请在淘文阁 - 分享文档赚钱的网站上搜索。

1、医学科学研究论文中统计方法的正确应用一、统计方法正确应用的重要性医学统计方法很多,各适用于不同的数据。临床试验中所用统计方法必须根据数据情况认真选用。这是因为,数理统计是根据一定的数据分布推导出一定的统计方法,它仅适用于一定的数据。例如,检验及方差分析是由正态分布数据以及各组方差相同推导出来的,因而要求数据为正态分布(至少接近正态分布)且方差齐性。但是,在论文的统计方法部分常有如下阐述:一般资料进行2检验,其余资料进行检验,这种不管数据分布是否很偏态,就一概使用某种统计方法不正确。此外,分类数据与计量数据的统计方法也不同,分类数据中对于名义变量和顺序变量的统计方法也不同。统计方法应用的错误会

2、使整个精心进行的研究得出错误的结论。在这一讲中我们将结合目前文献中常见的一些统计方法的错误应用,对如何根据数据的情况来正确地选择统计方法进行讨论。二、统计方法上常见的一些问题1.检验和方差分析要求数据服从正态分布:在医学研究中大量的数据并不服从正态分布。有时可以从报告中的数据看出。例如,在文献中体温降至正常的平均日数在两组分别为3 .01 .7及2 .42 .0。由数据可以看到标准差是平均数的1/2以上,甚至接近平均数。这就提示数据严重偏离了正态分布。因为,当数据不可能为负值(如日数),且样本不是过小时,按正态分布规律,平均数减3个标准差仍应是正数。这里平均数减3个标准差已经是-2.1和-3

3、.6了。因为日数不可能是负数,这就说明数据偏离了正态分布规律。又如,文献2关于统计分析方法方面写道:“测量参数以表示。根据性别及骨密度(2.5为界)分组,用两样本均数检验对组间各形态计量参数进行统计分析(SPSS8.0软件)。样本均数与总体均数用检验比较形态计量学参数与正常参考值之间的差异”。由文内表格(表1)可以看到有不少标准差大于均数。数据很可能是很偏态,不宜使用检验。事实上,检验和方差分析是一种所谓“稳建的”(robust)统计方法。就是说,当分布偏离正态分布不大时,对其结果的影响不大。但对于计量数据还是应当先做正态性检验。如果正态性检验结果认为数据不服从正态,可以进行数据转换,但比较麻

4、烦。简单的方法是用非参数统计。过去一般认为非参数统计效率较差,但这是指当数据为正态分布时。如果数据是非正态分布时其效率比参数法高,甚至可以高出很多。常用的有秩和检验和符号秩和检验等。2.关于多组计量资料的一揽子比较:在多组计量资料的组间两两比较时不可以用“一揽子比较”。所谓“一揽子比较”是进行多组比较时进行所有的两两比较。这是因为,在进行两组间比较时我们确定了第类错误的概率。一般我们用=0.05。如果做一揽子比较,就会扩大,也即,第类错误的概率扩大了。我们就会得到过多的假阳性结果。这时对第类错误的概率进行调整的方法很多。一般先做方差分析,然后再用各种多重比较的方法,如Student Newma

5、n Keuls法等,做各组间的两两比较。文献2是一个用错了的例子。文献4的表中(表2),原作者对A、B、C3组做了一揽子比较。正确的做法应当是先做总的检验,然后再做多重比较。本例还有各组间方差不齐的问题。不宜用方差分析而需用非参数统计方法来处理。3.顺序变量的2检验:(1)临床疗效的比较:2组有效率的比较,用四格表2检验或Fisher精确检验法是可以的。但是,如按疗效分成多个等级,如痊愈、显效、进步、无效4个疗效等级,则目前常用的2(Peason2)不能说明疗效的好坏。因为Peason2只检验结构是否均衡而不能检验2组疗效是否有差别。在表3这个假设的例子中, Peason2检验得到差别有高度统

6、计意义的结果。而实际上很难说哪一组疗效更好。如果我们对表3中任何两列进行对换。Peason2的数值也不会有变化。表1老年股骨颈骨折患者骨密度、骨形态计量学参数与形态计量学正常值比较(%,)组别例数 TBV OV TOS PRS正常值 15.36 1.07 13.21 4.76骨密度降低2.5 10 8.683.18 7.7813.54 6.557.07 6.798.68骨密度降低2.5 7 7.922.58 4.357.40 5.946.27 2.432 .9与正常值比较: 0.05, 0.001表2 燃煤型砷中毒患者皮肤组织中p53mt阳性表达分析组别例数阳性细胞密度() 阳性率(%)

7、组 18 38.0729.00 88.89组 11 17.1615.00 72.73组 39 4.058.24 25.64对照 12 0 0各组与对照比较:0.01;与比较0.01;与比较0.01;与比较0.05表3一个假设的顺序变量2检验的例子(例数)组别痊愈显效进步无效药 100 50 50 100药 50 100 100 502=56.556,=3,=0.001表4是克霉唑与对照治疗阴道炎的实例。原作者并未对此进行统计分析。对于这种顺序分类变量资料可以用Wilcoxon秩和检验、Ridit分析或Cochran Mantel Haensze行平均分差检验(Test of row m

8、ean scores difference)。这三者都是合理的方法,只是评分方法有所不同而已。因为其检验的假设有所不同,其结果也会有些差别,其中以用“行平均分差检验”较好。因为可以计算出平均得分显示两者之差值。如表4,若用4个等级以0,1,2,3来评分,2组平均分分别为2 728及2 632分,十分接近,=1,=0 324。本例得出差别无统计意义的结论,但这并不能说2种药的疗效相等或相近(见本讲第三节)。表4克霉唑与对照治疗阴道炎的疗效比较(例数)组别痊愈显效进步无效平均分克霉唑 92 17 1 4 311/114=2.728对照药 65 14 6 2 229/87=2.632(2)

9、时间作为顺序变量:如上所述,Pearson2检验只能说明构成比例的不同。对于顺序变量,需要用行平均分差的检验。Ridit检验或者Wilcoxon秩和检验。文献7是以时间作为顺序变量的例子(表5)。这一Pearson2检验的结果只能得出新生儿黄疸消退时间不同的结论,而不能得出观察组消退较晚的结论。如果我们把任何各列交换。Pearson2检验的结果完全不变。如果我们以0、1、2、3 来代表7、9、11等依次各列,可以计算对照组和观察组的平均分为:对照组:(08+116+236 )/(8+16+36 )=446/150=2.973。观察组:(00+16+218 )/(0+6+18+ )=826/19

10、6=4.214。行平均分检验结果为2=94 593,=1,=0.001说明观察组黄疸消退延长。本例为计量资料的频数表形式。也可计算均数和标准差,用检验比较均数的差别。4.把行列表合并成四格表:比较疗效时,把疗效合并成四格表而用卡方检验有效率,在方法上似无不可,但损失了信息。而且,合并的方法对于疗效的判断会有影响(表6)。表5 肉眼观察新生儿黄疸消退时间(例数)出生后时间()组别 7 9 11 13 15 17 19 21 23 24对照组 8 16 36 68 16 6 0 0 0观察组 0 6 18 34 59 45 19 13 2Peason2=113 9(作者为114 06),0

11、 01表6治疗组与对照组的疗效比较显效好转无效总有效组别例数例数 (%) 例数 (%) 例数 (%) 例数 (%)治疗组 20 16 80.0 3 15.0 1 5.0 19 95.0对照组 27 4 14.8 20 74.1 3 11.1 24 88.9作者由表6得出结论:治疗组显效率明显高于对照组,统计学上差异有极显著性(0.05)。由此可见,不同的合并方法对结果有很大的影响。这种情况还是用对顺序变量作分析的统计方法来分析为好。本例用秩和检验结果=4.088,=0.000。说明2组差别有高度统计意义。从数据可见治疗组疗效较好。在临床试验中有人把无效和改善合并为无效,显效和控制合并

12、为有效来计算有效率。由于病情轻的病人原来病情为1级,治愈了为0级,降低了1级,只能算改善,不可能达到显效或控制。因而,有效率的统计就会受到入组病人病情严重程度差异的影响。比较各组病人病情的不同也会影响有效率的比较。这只有采用在病人入组时,按病情分层随机化的方法来解决。对于分层的数据应当把层作为一个因素进行分析。如用方差分析和多元回归。对于生存数据用COX回归分析等。这时把层作为协变量进行分析。5.一般2检验只用于分析计数资料:2分布原本由连续变量导出。但目前我们大量应用的2检验是应用于计数资料。计数是指清点的数目。对于分类数据是清点人数、阳性数文献7是一个应用错误的例子。表7的数据是计量数据,

13、这样算出来的2什么也不是。表7新生儿接种乙肝疫苗后不同时间平均胆红素浓度血胆红素平均值(mol/L)出生后时间() 观察组(44例) 对照组(21例)0 18.0 17.53 110.0 108.06 151.2 148.29 177.0 130.312 168.0 66.015 159.3 31.018 126.0 20.121 76.3 15.024 36.427 16.02=164 04,0 05的结果。但作者并未作出两药疗效相同或相近的结论。这是正确的。然而,这样设计的目的却常常是为了说明两种药的疗效相近。这是应该用等效性检验的方法。四、科研论文中应写明所用统计分析方法的具体名称统计

14、方法的误用在杂志上屡见不鲜。通常,在文章的材料与方法部分应当有一段专门阐明所用统计方法的内容。在发表文章时写明所用的统计方法,这样才能供审稿者或读者来判断结论是否正确可靠。例如,配对数据与成组数据的统计方法就不同。如果笼统地说用了检验,就很难判断其正确性。可是,有些研究报告中却完全没有提到所用的是什么统计方法。例如,在文献12中,列出了许多值,下了许多结论,竟完全没有提及所用的统计方法。这样怎么让读者来判断结论是否正确呢?五、统计检验结论的表达1.差别有统计意义的表达:统计分析的结果是推翻无效假设或是不能推翻无效假设。无效假设在一般的统计检验为2组总体参数相等。推翻无效假设只能说2组总体参数

15、不相等而并不能说2组相差很大。2组相差如何要对可信区间进行研究观察后得出。由于统计检验不能得出差别的大小,因而结论不能说“有明显差异”或“有显著差异”,也不能说“差异非常显著”,更不能说“差异明显”。在国外的统计书籍上的英语表达为“significant”,它的正确意义应当是“有意义的、有重要性的”。俄语为和日语中的“有意”也是这个意思。国内只有极个别的英汉词典把“significant”误译为“显著的”。正确的说法应当是“差异有统计意义”或“差异有高度统计意义”等。在中华医学会系列杂志对来稿中统计学处理的有关要求中对此也有说明。文献15中有这样一段说明:“丙酸倍氯米松组患者吸入糖皮质激素后,

16、其气道反应性有显著降低(0.05);对照组治疗前后气道反应性无明显变化(0.05,)。这显然是把统计意义和差别的大小混为一谈了。文献16总结了1984年6月至1998年12月手术治疗的肝内胆管结石640例。文中有一段说明为:“肝切除术后残石率(7.8%)明显低于胆道探查组(69.3%),差异有非常显著意义(0.005),左肝管术后残石率明显低于右肝管或左右肝管,差异有非常显著意义(0.005)。516例获0.55年随访,优良率为87 4%,397例获612年随访,术后优良率为82.1%。结论:肝切除术和自体组织修复术明显优于其他术式,左肝管结石的手术效果明显优于右肝管和左右肝管结石。”2.值的

17、表达:中华医学会系列杂志对来稿中统计学处理的有关要求中对统计结果的解释和表达要求之一为:“应尽可能给出具体的值(如:=0.0238)”,但目前大多数的文献中都只用0 (单侧)或 H0:Md(d)=0, H1:Md(d)50时，正态近似有效对子数n=11, , 查附表10，双侧临界值=11，T*双侧临界值故不能拒绝H0。结论：可以认为孪生兄弟间的差异尚无统计学意义。或尚不能认为孪生兄弟间的差异具有统计学意义。当研究例数较大时(n50)，秩和T的分布近似正态分布，可以用正态分布理论作假设检验。这时正态分布的均数和标准差分别等于：mTn(n1)/4 检验的公式为：表 7.2 Wilcoxon 符号

18、秩检验的判断原则双侧检验单侧检验(1)单侧检验(2)检验假设H0：Md(d)0H0：Md(d)0H0：Md(d)0H1：Md(d)0H1：Md(d)0H1：Md(d)0统计决策：小样本查表法若T*Ta/2(n)则拒绝H0若T-Ta(n)则拒绝H0若T+Ta(n)则拒绝H0大样本正态近似法若ZZa/2 则拒绝H0若ZZa 则拒绝H0若ZZa 则拒绝H0l 符号秩检验的分布理论：假定有4个差值，如果H0成立时，这4个差值有同等的概率取正值或负值，即每个值取正值的概率等于1/2。4个差值每种组合发生的可能性就是：所有可能的秩和情况和T*的分布见表7.1。表7.1 n4时所有可能秩和情况和T*的分布正

19、差数的秩次负差值的秩次正秩和T+负秩和T-检验统计量T*概率P1,2,3,4-10000.06252,3,419110.06251,3,428220.06251,2,437330.12503,41,27331,2,346440.12502,41,36441,42,35550.12502,31,45551,32,44640.125041,2,34641,23,43730.125031,2,437321,3,42820.062512,3,41910.0625-1,2,3,401000.0625如果零假设成立，观察的结果应该服从这分布，即出现极端情形的可能性很小。如果小概率事件真的出现了，那么我们对

20、零假设的真实性产生怀疑，拒绝零假设。7.2 两独立样本的秩和检验(Wilcoxon rank sum test) 例7.2 在缺氧条件下，观察4只猫与12只兔的生存时间(分)，结果见表7.5。试判断猫、兔在缺氧条件下生存时间的差异是否具有统计学意义。表7.5 缺氧条件下猫与兔的生存时间(分)比较猫兔生存时间秩次生存时间秩次生存时间秩次生存时间秩次259.5151216281234151522172813441716323830144618174259.5351646191952711n1=5R1=78.5n2=14R2=111.5这是生存时间资料，一般不服从正态分布，样本也较小，需考虑用非参数

21、检验-秩和检验。秩和检验的基本思想：两组观察值共有n例，设例数较少的组有n1例，按观察值大小顺序分别编秩为1,2,n。如果零假设成立，两组的秩和不会太大，也不会太小；如果极端的结果出现，则可能零假设不成立，就拒绝零假设。具体计算步骤：（1）建立检验假设：H0：Md1Md2，即两总体分布位置相同;H1：Md1Md2，即两总体分布位置不同；=0.05（2）排秩次、计算秩和：两组混合排秩次，有相同值求平均秩（仅有同组相同值可忽略）。（3）当n1n2时，取较小样本的秩和为检验统计量T*R1；当n1n2时，取秩和较小者为检验统计量T*min(R1，R2)。本例，求例数较少组的秩和T*=78.5。（4）决

22、策T值在表中两界值之间时，不拒绝H0 (p值大于相应界值)反之, T值在表中两界值之外时，拒绝H0 (p值小于相应界值)。本例， n15，n214，n2-n19，查附表11，TL0.0122，TU0.0178，T*TU0.01，P0.01，故拒绝H0，可认为猫、兔在缺氧条件下的生存时间的中位数不相等。当样本较大时，秩和的分布近似正态分布，可以用正态分布理论作假设检验。这时正态分布的均数和标准差分别等于： mT*n1(n1)/2 检验公式为： 7.3 多个样本分布位置相同的假设检验1. 完全随机化设计资料分布位置的假设检验(Kruskal- Wallis test)例7.2 14名新生儿出生体重

23、。母亲吸烟习惯分组：A组：多于1包/天； B组：少于1包/天； C组：现已戒烟； D组：从不吸烟表7.7不同吸烟习惯母亲的新生儿体重（kg）出生体重xij相应秩次rijABCDABCD2.72.93.33.5347112.43.23.63.625.512.512.52.23.23.43.715.59143.43.499ni4343Ri151537.537.5计算步骤：（1）检验假设： H0：k个总体中位数相等；H1：k个总体中位数不等；=0.05。（2）计算统计量：各组混合编秩，如不同组间出现相同值，求平均秩；（3）计算各组的秩和。如果H0成立，第i组秩和的期望（总体均数）与方差分别为：在

24、此基础上建立检验统计量：当H0成立时，该检验统计量近似服从自由度为(k-1)的c2分布。为简化运算，由上式推导出如下公式：校正：（3）决策：自由度 df=4-1=3，查2值表得2 0.05(3) =7.815，p0.05，故拒绝零假设，可以认为不同吸烟习惯对新生儿体重有影响。 3. k组秩平均值的多重比较无论是用K-W检验，还是用Friedman检验，当拒绝零假设时，并不能直接判断k组中哪些组间差异具有统计学意义，为此需进行组间的多重比较(multiple comparison)。对于完全随机设计资料，令和分别为欲比较的第i组与第j组样本的平均秩。平均秩差数的绝对值用表示，则其平均秩差数的

25、方差为式中n为k组的总样本含量，ni，nj分别为第i组与第j组样本含量。其检验假设为 H0：第i组与第j组中位数相等； H1：第i组与第j组中位数不等。用正态近似法，其检验统计量为然后将Zij值与标准正态分布的界值比较。设共有c个Zij，即总共进行c次比较。则用a/c作检验水准。例7.5 仍以例7.3出生体重数据(见表7.7)为例，四个吸烟组平均秩分别为: 15/43.75，15/35.0，37.5/49.375，37.5/312.50本例主要考虑不吸烟组的平均秩与另外三组平均秩的比较，共有三个比较对，即 c3若a0.05,则限定每一个Z检验第I类错误概率不超过0.05/30.0167由标

26、准正态分布获得该多重检验的界值为Z0.01672.12当所求得的Zij2.12时，判断第i和j两组处理差异有统计学意义。用(7.24)式分别求得三个比较对的Zij值为，因为Z1，4与Z2，4均大于Z0.0167，可认为当前尚在吸烟的母亲与从不吸烟母亲相比，他们的新生儿的出生体重差异具有统计学意义。补充：1临界值表的构造原理设有两组,n=6，随机分成两组，n1=3，n2=3，则 H0成立时，20种可能的组合情况及秩和R1：秩号1,2,31,2,41,2,51,2,61,3,41,3,51,3,61,4,51,4,61,5,6R167898910101112秩号2,3,42,3,52,3,

27、62,4,52,4,62,5,63,4,53,4,63,5,64,5,6R19101111121312131415以上每一种组合出现的机会都是1/20。R16789101112131415P(R1)0.050.050.100.150.150.150.100.100.050.05H0成立时，R1的分布中，下侧尾部面积为0.05的临界值=6上侧尾部面积为0.05的临界值=15查表: 单侧0.05或双侧0.10所对应的临界区间为(6,15)2秩和检验与t检验之间的比较表1 秩和检验的效率（正态）.10.20.30.40.50.60.70.80.90功效.03.08.18.32.50.68.83.9

28、3.9822.622.121.721.521.621.822.222.923.9效率.91.88.87.85.86.87.89.92.96表2 秩和检验的效率（正态）.51.01.52.02.53.03.54.0功效.072.210.431.674.858.953.988.998效率.968.978.961.956.960.960.964.976表3 秩和检验的效率(m，n 均趋于无穷大)分布类型LogisticDonble ExponentialRectangularExponential效率1.513 一般说，与t检验相比，秩和检验的效率.864 小结：（1）检验水平秩和检验的检验水平

29、不依赖于真实的分布，并且完全知道。分布接近正态时，t检验的检验水平接近名义上指定的水平。（2）功效 l 正态时，t检验的功效略高于秩和检验（不多，约5%）；l 分布接近正态，两检验差别不大（秩和检验并不很差）；分布与正态分布很不相同时，秩和检验远优于t检验。卫生统计学第一章绪论教学内容一、卫生统计学的定义二、卫生统计资料类型三、统计学基本概念四、统计工作的基本步骤教学目标1. 知道卫生统计工作的基本步骤2. 熟悉资料的统计分类，理解不同类型的资料应采用不同的统计分析方法3. 掌握以下基本概念：同质与变异、总体与样本、总体研究与抽样研究、误差、概率与小概率事件一、卫生统计学

30、的定义随机现象随机现象是指在一次试验或观察时，其结果不确定，而在相同条件下，大量试验或观察其结果呈现某种规律性的现象。数理统计是研究随机现象规律性的一门数学学科。卫生统计学（health statistics）是运用数理统计的基本原理和方法，通过数据的收集，整理和分析，研究预防医学和卫生事业管理中随机现象规律性的一门应用科学。二、卫生统计资料类型计量资料：用度量衡的方法测定每个观察单位的某项指标，表现为数值的大小，通常是有度量衡单位，属于连续性资料。计数资料：将全体观察单位按照某种性质或类别进行分类，然后分别清点各类别的例数，这样得到的数据称为计数资料，也称分类资料。二分类资料：例如，对某医

31、院做人力资源调查。以每个工作人员作为一个观察单位，按技术人员和非技术人员分为两类。多分类资料：如，观察人群的血型，以人为单位，结果分为A型、B型、AB型、O型，为互不相容的多个类别。等级资料：将全体观察单位按照某种性质或类别分类，各类别之间有程度的差别，分别清点各类中观察单位的个数，这种数据资料称为等级资料。三、统计学基本概念（一）总体总体是根据研究目的确定的同质观察单位的全体，更确切地说，是同质的所有观察单位某种变量值的集合。（二）样本与随机抽样从总体中随机抽取部分个体，其实测值的集合称为样本。随机抽样，就是按照随机的原则获得样本，保证总体中每个个体都有同等机会被抽取，使样本对总体有较好的

32、代表性。（三）抽样研究从所研究的总体中随机抽取一部分有代表性的样本进行研究称为抽样研究。抽样研究的目的是通过样本信息推论总体特征。（四）误差误差通常指测量值与真值之差。包括系统误差、随机测量误差和抽样误差。1系统误差：又称偏倚不是偶然机遇造成的，而是某种必然因素所致，具有一定的倾向性。观察结果一惯性的往一边偏，要高都高，偏低都低。系统误差一旦发生，统计学是无能为力的，因此要尽可能避免。而大多数系统误差可以通过周密的研究设计得到解决。2随机测量误差：这种误差是偶然因素所致，故无方向性，如对同一样品多次测定，结果有高有低，不完全一致。随机测量误差是不可避免的。3抽样误差：抽样研究所抽取的样本，只包

33、含总体中的部分个体，由于存在个体变异，样本指标往往不等于总体参数，这种差异是由抽样造成的，称为抽样误差。（五）概率概率是描述随机事件发生的可能性大小的指标，用P来表示。随机事件的概率在0与1之间，常用小数或百分数表示。P越接近1，表明某事件发生的可能性越大，P越接近0，表明某事件发生的可能性越小。小概率事件：随机事件P0.05或 P0.01，分别表示事件发生的可能性等于或小于0.05(5%)和可能性等于或小于0.01(1%)，在一次试验或观察时发生的可能性很小，习惯上称为小概率事件。（六）频率若随机事件在n次重复中出现m次，则n/m比值成为随机事件出现的频率。当n充分大时，随机事件的频率接近

34、概率。四、统计工作的基本步骤统计工作包括设计、收集资料、整理资料、分析资料四个基本步骤。这四个步骤之间紧密联系，环环相扣。一定不要只在分析结果时才想到统计。大家在今后的学习中会发现，统计分析方法是建立在研究设计和分析目的基础上的。（一）设计研究分析的总设想。包括专业设计和统计设计，也就是除了专业方面的研究目的技术路线外，还包括抽样方法、样本含量等。需要强调的是良好的设计是统计分析的基础。（二）收集资料资料必须完整、正确和及时。要有足够的数量。注意资料的代表性和可比性。代表性是指样本能很好的代表总体。应遵循随机化原则抽取样本。可比性是指在统计比较时，对比的各组之间，除观察问题或实验因素不同外，其

35、它条件都要求尽量一致。（三）整理资料原始资料的检查与核对资料的分组设计和归纳汇总（四）分析资料统计描述：用一些统计指标，统计图表等方法对资料的数量特征和分布规律进行测定和描述。统计推断：用样本信息推断总体特征，包括参数的估计和假设检验。本章为大家介绍了卫生统计学的定义、卫生统计资料类型、统计学基本概念和统计工作的基本步骤。第二章计量资料的统计描述教学内容第一节计量资料的频数表第二节描述集中趋势的指标第三节描述离散趋势的指标第四节正态分布及其应用第五节实例解析教学目标1. 会编制频数分布表, 并据此描述资料的频数分布特征2. 掌握各种平均数指标的计算及其适用条件，尤其是均数3. 掌

36、握各种离散趋势指标的计算及其适用条件，尤其是标准差，熟悉标准差的意义及应用4. 了解正态分布及标准正态分布的概念和特征5. 熟悉标准正态变换公式6. 掌握标准正态分布曲线下的面积规律，并会正确应用 7. 掌握正态分布理论的重要应用：医学参考值范围的估计第一节计量资料的频数表一、频数表计量资料需编制频数分布表，频数表编制的步骤参见实用卫生统计学第二章第一节中的内容，频数表包括一些有序的组段及落在各或组段内的观察值的个数即频数。从而了解资料的特征和分布类型。二、频数分布两个特征：集中趋势和离散趋势。三、频数分布类型1对称分布：是指集中位置在正中，左右两侧频数分布大体对称的分布。2偏态分布：偏态分布是指集中位置偏向一侧，两侧频数分布不对称。如果集中位置偏向数值小的一侧，称为正偏态分布；若集中位置偏向数值大的一侧，则称为负偏态分布。3对数正态分布：有些偏态分布的资料，其原始数据经过对数转换后（如用原始数据的对数值lgX代替X）服从正态分布，称为对数正态分布。第二节描述集中趋势的指标描述计量资料集中趋势常用的指标有均数，几何均数，中位数。一.算术均数（arithmetic mean）简称均数。常用表示总体均数，用表示样本均数。均

文档加载中……请稍候！
如果长时间未打开，您也可以点击刷新试试。

下载文档到电脑，查找使用更方便

14 金币

版权申诉 word格式文档无特别注明外均可编辑修改；预览文档经过压缩，下载后原文更清晰！ 立即下载

配套讲稿：: 如PPT文件的首页显示word图标，表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
特殊限制：: 部分文档作品中含有的国旗、国徽等图片，仅作为作品整体效果示例展示，禁止商用。设计者仅对作品中独创性部分享有著作权。
关键词：: 医学科学研究论文材料中统方法法子正确应用利用运用

淘文阁 - 分享文档赚钱的网站所有资源均是用户自行上传分享，仅供网友学习交流，未经上传用户书面授权，请勿作他用。

限制150内

关于本文

本文标题：医学科学研究论文材料中统计方法的正确应用.doc
链接地址：https://www.taowenge.com/p-2777622.html