《数值变量资料的统计分析之统计描述.pptx》由会员分享,可在线阅读,更多相关《数值变量资料的统计分析之统计描述.pptx(103页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、学习目的和要求掌握:1.集中趋势指标的计算与应用意义2.离散趋势指标的计算与应用意义3.数值变量资料的t检验熟悉:1.总体均数的区间估计2.假设检验的意义和步骤了解:数值变量资料的统计描述中频数表的制作第1页/共103页第一节 数值变量资料的统计描述一、编制频数表(了解)120名12岁男孩身高(cm)资料142.3 156.6 142.7 145.7 138.2 141.6 142.5 130.5 142.3 156.6 142.7 145.7 138.2 141.6 142.5 130.5 132.1 135.5132.1 135.5134.5 148.8 134.4 148.8 137.9
2、 151.3 140.8 149.8 134.5 148.8 134.4 148.8 137.9 151.3 140.8 149.8 143.6 149.0143.6 149.0145.2 141.8 146.8 135.1 150.3 133.1 142.7 143.9 145.2 141.8 146.8 135.1 150.3 133.1 142.7 143.9 142.4 139.6142.4 139.6151.1 144.0 145.4 146.2 143.3 156.3 141.9 140.7 151.1 144.0 145.4 146.2 143.3 156.3 141.9 140
3、.7 145.9 144.4145.9 144.4141.2 141.5 148.8 140.1 150.6 139.5 146.4 143.8 141.2 141.5 148.8 140.1 150.6 139.5 146.4 143.8 150.0 142.1150.0 142.1143.5 139.2 144.7 139.3 141.9 147.8 140.5 138.9 143.5 139.2 144.7 139.3 141.9 147.8 140.5 138.9 148.9 142.4148.9 142.4134.7 147.3 138.1 140.2 137.4 145.1 145
4、.8 147.9 134.7 147.3 138.1 140.2 137.4 145.1 145.8 147.9 146.7 143.4146.7 143.4150.8 144.5 137.1 147.1 142.9 134.9 143.6 142.3 150.8 144.5 137.1 147.1 142.9 134.9 143.6 142.3 143.3 140.2143.3 140.2125.9 132.7 152.9 147.9 141.8 141.4 140.9 141.4 125.9 132.7 152.9 147.9 141.8 141.4 140.9 141.4 146.7 1
5、38.7146.7 138.7160.9 154.2 137.9 139.9 149.7 147.5 136.9 148.1 160.9 154.2 137.9 139.9 149.7 147.5 136.9 148.1 144.0 137.4144.0 137.4134.7 138.5 138.9 137.7 138.5 139.6 143.5 142.9 134.7 138.5 138.9 137.7 138.5 139.6 143.5 142.9 146.5 145.4146.5 145.4129.4 142.5 141.2 148.9 154.0 147.7 152.3 146.6 1
6、29.4 142.5 141.2 148.9 154.0 147.7 152.3 146.6 139.2 139.9139.2 139.9第2页/共103页1.计算全距(极差)R=最大值-最小值 2.确定组距 确定组段数:815组确定组距:组距i=全距/组段数 3.划分组段 4.统计频数第3页/共103页组段 划记 频数f(1)(2)(3)125 一 1129 止 4133 正止 9137 正正正正正下 28141 正正正正正正正 35145 正正正正正丁 27149 正正一 11153 止 4157161 1 合计 =120120名12岁男孩身高(cm)资料的频数分布第4页/共103页二、集
7、中趋势指标(掌握)数值变量资料的集中趋势指标用平均数来描述。常用的平均数有算数均数、几何均数、中位数第5页/共103页(一)算数均数将各观察值相将各观察值相加后除以观察加后除以观察值个数所得的值个数所得的商即为算术均商即为算术均数。数。1、定义、定义总体均数用希总体均数用希腊字母腊字母表表示示样本均数用样本均数用表示表示第6页/共103页2.应用条件 适用于呈对称分布或近似对称分布的资料。第7页/共103页3.计算方法 直接法:变量值个数不多变量值个数不多 公式为第8页/共103页加权法:n 100 公式为 第9页/共103页例 某年某市120名12岁健康男孩身高(cm)资料如下表,求其平均数
8、。第10页/共103页142.3 156.6 142.7 145.7 138.2 141.6 142.5 130.5 142.3 156.6 142.7 145.7 138.2 141.6 142.5 130.5 132.1 135.5132.1 135.5134.5 148.8 134.4 148.8 137.9 151.3 140.8 149.8 134.5 148.8 134.4 148.8 137.9 151.3 140.8 149.8 143.6 149.0143.6 149.0145.2 141.8 146.8 135.1 150.3 133.1 142.7 143.9 145.2
9、 141.8 146.8 135.1 150.3 133.1 142.7 143.9 142.4 139.6142.4 139.6151.1 144.0 145.4 146.2 143.3 156.3 141.9 140.7 151.1 144.0 145.4 146.2 143.3 156.3 141.9 140.7 145.9 144.4145.9 144.4141.2 141.5 148.8 140.1 150.6 139.5 146.4 143.8 141.2 141.5 148.8 140.1 150.6 139.5 146.4 143.8 150.0 142.1150.0 142.
10、1143.5 139.2 144.7 139.3 141.9 147.8 140.5 138.9 143.5 139.2 144.7 139.3 141.9 147.8 140.5 138.9 148.9 142.4148.9 142.4134.7 147.3 138.1 140.2 137.4 145.1 145.8 147.9 134.7 147.3 138.1 140.2 137.4 145.1 145.8 147.9 146.7 143.4146.7 143.4150.8 144.5 137.1 147.1 142.9 134.9 143.6 142.3 150.8 144.5 137
11、.1 147.1 142.9 134.9 143.6 142.3 143.3 140.2143.3 140.2125.9 132.7 152.9 147.9 141.8 141.4 140.9 141.4 125.9 132.7 152.9 147.9 141.8 141.4 140.9 141.4 146.7 138.7146.7 138.7160.9 154.2 137.9 139.9 149.7 147.5 136.9 148.1 160.9 154.2 137.9 139.9 149.7 147.5 136.9 148.1 144.0 137.4144.0 137.4134.7 138
12、.5 138.9 137.7 138.5 139.6 143.5 142.9 134.7 138.5 138.9 137.7 138.5 139.6 143.5 142.9 146.5 145.4146.5 145.4129.4 142.5 141.2 148.9 154.0 147.7 152.3 146.6 129.4 142.5 141.2 148.9 154.0 147.7 152.3 146.6 139.2 139.9139.2 139.9120名12岁男孩身高(cm)资料第11页/共103页组段 划记 频数f(1)(2)(3)125 一 1129 止 4133 正止 9137 正正
13、正正正下 28141 正正正正正正正 35145 正正正正正丁 27149 正正一 11153 止 4157161 1 合计 =120120名12岁男孩身高(cm)资料的频数分布第12页/共103页 组段 组中值x 频数 f fx(1)(2)(3)(4)(2)(3)125 127 1 127129 131 4 524133 135 9 1215137 139 28 3892141 143 35 5005145 147 27 3969149 151 11 1661153 155 4 620157161 159 1 159 合计 -=120 =17172 120名12岁健康男孩身高(cm)均数的加
14、权法计算 第13页/共103页第14页/共103页(二)几何均数1定义 将n个变量值的乘积开n次方所得的根即为几何均数。符号 用G表示 第15页/共103页2.适用条件:数值变量呈倍数关系或呈对数正态分布,如抗体效价、抗体滴定度、疾病潜伏期第16页/共103页3.计算第17页/共103页例5人的血清滴度分别为1:2、1:4、1:8、1:16、1:32,求平均滴度。第18页/共103页第19页/共103页加权法:变量值个数较多或变量值为频数表资料 二、几何均数(几何平均数)第20页/共103页例2-4 某年某市100名儿童接种某种疫苗后,测定抗体滴度的资料如第(1)、(2)列所示,求该疫苗的抗体
15、平均滴度。第21页/共103页第22页/共103页第23页/共103页(三)中位数和百分位数中位数1.定义 将一组变量值按大小顺序排列,位次居中的变量值即为中位数。符号 用M表示 第24页/共103页2.适用条件变量值中出现特小或特大的数值资料的分布呈明显偏态变量值分布一端或两端无确定数值,只有小于或大于某个数值资料的分布类型不清第25页/共103页3.计算方法直接法当变量值个数为奇数时计算公式为 M=第26页/共103页当变量值个数为偶数时计算公式为 第27页/共103页例某地11例某传染病患者,其潜伏期(天)分别为2,2,4,3,5,6,3,8,9,11,15,求其平均潜伏期。第28页/共
16、103页第29页/共103页例如上例资料在第21天又发生1例该传染病患者,其平均潜伏期又为多少?先将变量值按从小到大的顺序排列:2,2,3,3,4,5,6,8,9,11,15,21。第30页/共103页第31页/共103页 编制频数表计算步骤4计算步骤3计算步骤2计算步骤1频数表法频数表法编制中位数计算表确定中位数所在的组段计算中位数第32页/共103页计算公式 第33页/共103页例现有145例食物中毒病人,其潜伏期分布如下表的第(1)(2)栏,求中位数。第34页/共103页潜伏期(小时)潜伏期(小时)频数频数f f 累计频数累计频数 累计频率(累计频率(%)(1)(2)(3)(1)(2)(
17、3)(4 4)0 0 17 17 11.717 17 11.76 6 46 63 43.446 63 43.41212 38 101 69.638 101 69.61818 32 133 91.732 133 91.72424 6 139 95.96 139 95.93030 0 139 95.90 139 95.93636 4 143 98.64 143 98.64242 2 145 100.02 145 100.0 合计合计 145 145 145例食物中毒病人潜伏期分布表 第35页/共103页可确定中位数所在组段是12,故L12,i6,fm38,n145,63。代入公式,得 M=12+(
18、6/38)(145 50%63)=13.5(小时)第36页/共103页百分位数1定义 指将n个观察值从小到大依次排列,再把它分成100等份,对应于 x%位的数值即为第x百分位数。中位数是第50百分位数,用P50表示。第25,第75,第95百分位数记为P25,P75 P95是统计学上常用的指标。第37页/共103页 PX X%(100-X)%第38页/共103页2计算方法L L:Px Px 所在组段下限所在组段下限i i:组距组距 n:n:总例数总例数f f:PxPx所在组段频数所在组段频数 f fL L:小于小于L L的各组段累计频数的各组段累计频数第39页/共103页潜伏期(小时)潜伏期(小
19、时)频数频数f f 累计频数累计频数 累计频率(累计频率(%)(1)(2)(3)(1)(2)(3)(4 4)0 0 17 17 11.717 17 11.76 6 46 63 43.446 63 43.41212 38 101 69.638 101 69.61818 32 133 91.732 133 91.72424 6 139 95.96 139 95.93030 0 139 95.90 139 95.93636 4 143 98.64 143 98.64242 2 145 100.02 145 100.0 合计合计 145 145 145例食物中毒病人潜伏期分布表 求P25和P75第40
20、页/共103页P25=6+(6/46)(14525%17)=8.51(小时)P75=18+(6/32)(14575%101)=19.45(小时)第41页/共103页练习题1.适用于对称分布或近似对称分布的资料的平均数为A.算数均数B.几何均数C.中位数D.百分位数答案:A第42页/共103页描述正态分布资料集中趋势的指标是()A.中位数 B.几何均数C.算术平均数 D.标准差答案:C(全国2011年4月高等教育自学考试预防医学(二)试题)第43页/共103页2.描述一组偏态分布资料的平均水平,下列哪个指标较好 A算术均数 B几何均数 C百分位数 D中位数答案:D第44页/共103页3.计算某抗
21、体滴度的平均水平,一般宜选择 A算术均数 B几何均数 C中位数 D百分位数 答案:B第45页/共103页描述呈倍数关系的数值变量的指标是 A算术均数 B几何均数 C中位数 D百分位数 答案:B第46页/共103页三、离散趋势指标(掌握)第47页/共103页第48页/共103页第49页/共103页离散趋势指标(掌握)三组同龄男孩体重(三组同龄男孩体重(kgkg)如下:)如下:甲组甲组 90 95 100 105 110 90 95 100 105 110 均数均数=100=100(cmcm)乙组乙组 96 98 100 102 104 96 98 100 102 104 均数均数=100=100
22、(cmcm)丙组丙组 96 99 100 101 104 96 99 100 101 104 均数均数=100=100(kgkg)平平均均水水平平指指标标仅仅描描述述一一组组数数据据的的集集中中趋趋势势,可可作作为为总总体体均均数数的的一一个个估估计计值值。由由于于变变异异的的客客观观存存在在,需需要要一一类类指指标标描描述资料的离散趋势述资料的离散趋势。常用指标:常用指标:全距,四分位数间距,方差,全距,四分位数间距,方差,标准差标准差,变异系数,变异系数第50页/共103页科学出版社卫生职业教育出版分社科学出版社卫生职业教育出版分社概念概念是一组变量值中最大值与最小值之是一组变量值中最大值
23、与最小值之差,反映一组变量值的变异范围。差,反映一组变量值的变异范围。符号符号以符号以符号R表示表示公式公式R=最大值最大值-最小值最小值极差极差(又称全距)(又称全距)第51页/共103页R甲=11090=20(cm)R乙=10496=8(cm)R丙=10496=8(cm)甲组甲组 90 95 100 105 110 90 95 100 105 110 均数均数=100=100(cmcm)乙组乙组 96 98 100 102 104 96 98 100 102 104 均数均数=100=100(cmcm)丙组丙组 96 99 100 101 104 96 99 100 101 104 均数均
24、数=100=100(kgkg)第52页/共103页缺点:只用到最大、最小值,样本信息没能充分利用,不能反映所有数据的变异程度。受样本含量影响较大,样本例数越多,R可能越大,2组观察值例数悬殊时不用R比较。样本含量不变时,每次抽样得到的极差值相差较大,R稳定性较差。优点:优点:表示变异范围,简单明了;表示变异范围,简单明了;各种分布类型的资料均可用。各种分布类型的资料均可用。第53页/共103页练习题关于极差的描述错误的是A.极差值大,离散度就大B.极差可以反映所有数据的变异大小C.极差受样本含量的影响较大D.极差只能粗略的说明变量值的变动范围答案:B第54页/共103页四分位数间距 四分位数间
25、距,用Q表示:Q=四分位数间距越大,说明变异度越大;反之,说明变异度越小。第55页/共103页方差方差也称均方差,反映一组数据的平均离散水平。方差愈小,说明变量值的变异程度愈小;方差愈大,说明变异程度愈大。第56页/共103页样本方差用表示第57页/共103页概念概念把方差开平方,恢复了原来的单位,把方差开平方,恢复了原来的单位,这就是标准差。这就是标准差。优点优点由于克服了方差的不足因而最常用。由于克服了方差的不足因而最常用。符号符号s表示样本标准差,表示样本标准差,表示总体标准差表示总体标准差。标准差 第58页/共103页公式:样本标准差用 表示 公式:第59页/共103页说明变说明变量值
26、的量值的变异程变异程度。度。2.标准差的意义标准差的意义标准差愈小,标准差愈小,说明变量值的说明变量值的变异程度愈小变异程度愈小;标准差愈大;标准差愈大,说明变异程,说明变异程度愈大。度愈大。第60页/共103页 标准差的公式还可以写成:利用频数表计算标准差的公式为第61页/共103页测定了5名健康人第一小时末红细胞沉降率,分别是6、3、2、9、10mm,求标准差。第62页/共103页例 某年某市120名12岁健康男孩身高(cm)资料如下表,求其标准差。第63页/共103页142.3 156.6 142.7 145.7 138.2 141.6 142.5 130.5 132.1 135.514
27、2.3 156.6 142.7 145.7 138.2 141.6 142.5 130.5 132.1 135.5134.5 148.8 134.4 148.8 137.9 151.3 140.8 149.8 143.6 149.0134.5 148.8 134.4 148.8 137.9 151.3 140.8 149.8 143.6 149.0145.2 141.8 146.8 135.1 150.3 133.1 142.7 143.9 142.4 139.6145.2 141.8 146.8 135.1 150.3 133.1 142.7 143.9 142.4 139.6151.1 1
28、44.0 145.4 146.2 143.3 156.3 141.9 140.7 145.9 144.4151.1 144.0 145.4 146.2 143.3 156.3 141.9 140.7 145.9 144.4141.2 141.5 148.8 140.1 150.6 139.5 146.4 143.8 150.0 142.1141.2 141.5 148.8 140.1 150.6 139.5 146.4 143.8 150.0 142.1143.5 139.2 144.7 139.3 141.9 147.8 140.5 138.9 148.9 142.4143.5 139.2
29、144.7 139.3 141.9 147.8 140.5 138.9 148.9 142.4134.7 147.3 138.1 140.2 137.4 145.1 145.8 147.9 146.7 143.4134.7 147.3 138.1 140.2 137.4 145.1 145.8 147.9 146.7 143.4150.8 144.5 137.1 147.1 142.9 134.9 143.6 142.3 143.3 140.2150.8 144.5 137.1 147.1 142.9 134.9 143.6 142.3 143.3 140.2125.9 132.7 152.9
30、 147.9 141.8 141.4 140.9 141.4 146.7 138.7125.9 132.7 152.9 147.9 141.8 141.4 140.9 141.4 146.7 138.7160.9 154.2 137.9 139.9 149.7 147.5 136.9 148.1 144.0 137.4160.9 154.2 137.9 139.9 149.7 147.5 136.9 148.1 144.0 137.4134.7 138.5 138.9 137.7 138.5 139.6 143.5 142.9 146.5 145.4134.7 138.5 138.9 137.
31、7 138.5 139.6 143.5 142.9 146.5 145.4129.4 142.5 141.2 148.9 154.0 147.7 152.3 146.6 139.2 139.9129.4 142.5 141.2 148.9 154.0 147.7 152.3 146.6 139.2 139.9第64页/共103页第65页/共103页第66页/共103页练习题描述离散趋势的指标是A.标准差 B.中位数C.几何均数 D.算术均数 答案:A(全国2014年4月高等教育自学考试预防医学(二)试题)第67页/共103页关于样本标准差的描述正确的是A.样本标准差就是总体标准差B.样本方差是
32、样本标准差的正平方根C.标准差有量纲,其量纲与原变量值相同D.标准差可能为负值答案:C第68页/共103页均数和标准差的关系是 A均数愈大,s愈大 B均数愈大,s愈小 Cs愈大,均数对各变量值的代表性愈好 Ds愈小,均数对各变量值的代表性愈好答案:D第69页/共103页各观察值均加(或减)同一个不等于零的数后 A均数不变,标准差改变 B均数改变,标准差不变 C两者均不变 D均数不变,标准差不一定改变答案:B第70页/共103页 变异系数变异系数(coefficient of variation)记为CV,多用于观察指标单位不同时,如身高与体重的变异程度的比较;或均数相差较大时,如儿童身高与成人
33、身高变异程度的比较。第71页/共103页例某地20岁男子160人,身高均数为166.06cm,标准差为4.95cm;体重均数为53.72kg,标准差为4.96kg。试比较身高与体重的变异程度。第72页/共103页第73页/共103页例某地130名10岁女生体重均数为26.96kg,标准差为3.9 kg;150名17岁女生体重均数为49.18kg,标准差为5.3 kg,试比较两个年龄别女生体重的离散程度。第74页/共103页第75页/共103页练习题关于变异系数下列描述错误的是A.变异系数可以反映变量值的绝对值离散程度B.变异系数是无量纲单位C.变异系数可以用来比较不同单位指标间的变异度D.变异
34、系数消除了均数的大小对标准差的影响答案:A第76页/共103页比较血压和脉搏两组数据变异度大小宜采用 A变异系数 B方差 C极差 D标准差答案:A第77页/共103页设同一组7岁男童身高的均数是110cm,标准差是5cm,体重的均数是25kg,标准差是3kg,则比较二者变异程度的结论为 A身高的变异程度小于体重的变异程度 B身高的变异程度等于体重的变异程度 C身高的变异程度大于体重的变异程度 D单位不同,无法比较答案:A第78页/共103页正态分布正态分布(normaldistribution)又称高斯分布(Gaussiandistribution),是一种重要的连续型分布,应用甚广,是许多统
35、计方法的理论基础。第79页/共103页 正态分布曲线第80页/共103页正态分布的特征第81页/共103页第82页/共103页(4)正态曲线下的面积分布有一定的规律。1范围内的面积占68.27。1.96范围内的面积占95.00。2.58范围内的面积占99.00。第83页/共103页标准正态分布第84页/共103页练习题正态曲线的位置参数是指A.均数B.标准正态变量uC.标准差D.样本标准差s答案:A第85页/共103页正态分布N(,2),当恒定时,越大,则 A曲线沿横轴越向右移动 B曲线沿横轴越向左移动 C曲线形状和位置都不变 D观察值变异程度越大,曲线越“胖”答案:D第86页/共103页对于
36、均数为标准差为正态分布,95的变量值分布范围为 A-+B-196+196 C-258+258 D-+196答案:B第87页/共103页正态曲线下、横轴上,从均数到+196的面积为 A95 B45 C975 D475 答案:D第88页/共103页关于标准正态分布的描述错误的是A.标准正态分布可以表示为N(0,12)B.标准正态分布的均数等于0C.标准正态分布的标准差等于1D.标准正态分布(-11)的区间面积占总面积的95%答案:D第89页/共103页 医学参考值范围涉及到采用单侧界值还是双侧界值的问题,这通常依据医学专业知识而定。双侧:血清总胆固醇无论过低或过高均属异常白细胞数无论过低或过高均属
37、异常单侧:1、血清转氨酶仅过高异常 2、肺活量仅过低异常 第90页/共103页 医学参考值范围有 、等,最常用的为 。计算医学参考值范围的常用方法:1、正态分布法 2、百分位数法第91页/共103页1、正态分布法:许多生物医学数据服从或近似服从正态分布,如同年龄同性别儿童的身高值、体重值,同性别健康成人的红细胞数等;第92页/共103页 公式:第93页/共103页第94页/共103页第95页/共103页即即不低于不低于3.3L。第96页/共103页2、百分位数法适用:各种分布资料特别是偏态分布资料 第97页/共103页 公式:第98页/共103页 例2-17 测得某年某地名正常人的尿汞值如下表,试制定正常人尿汞值的参考值范围。第99页/共103页正常人的尿汞值为偏态分布,且过高为异常 应计算第95百分位数第100页/共103页练习题医学中确定参考值范围时应注意 A正态分布资料不能用均数标准差法 B正态分布资料不能用百分位数法 C偏态分布资料不能用均数标准差法 D偏态分布资料不能用百分位数法答案:C第101页/共103页第102页/共103页感谢您的观看!第103页/共103页
限制150内