定量数据的统计描述讲稿.ppt
关于定量数据的统关于定量数据的统计描述计描述第一页,讲稿共五十五页哦第一节第一节频数分布频数分布 一、频数分布表一、频数分布表简称频数表(简称频数表(frequency table)frequency table)4例例2-1 2-1 从从某某单单位位19991999年年的的职职工工体体检检资资料料中中获获得得101101名名正正常常成成年年女女子子的的血血清清总总胆胆固固醇醇(mmol/Lmmol/L)的的测量结果如下,试编制频数分布表。测量结果如下,试编制频数分布表。第二页,讲稿共五十五页哦2.352.35 4.21 3.32 5.35 4.17 4.13 2.78 4.26 3.58 4.34 4.84 4.41 4.21 3.32 5.35 4.17 4.13 2.78 4.26 3.58 4.34 4.84 4.414.78 3.95 3.924.78 3.95 3.92 3.58 3.66 4.28 3.26 3.50 2.70 4.61 4.75 2.913.58 3.66 4.28 3.26 3.50 2.70 4.61 4.75 2.913.91 4.59 4.193.91 4.59 4.19 2.68 4.52 4.91 3.18 3.68 4.83 3.87 3.95 3.912.68 4.52 4.91 3.18 3.68 4.83 3.87 3.95 3.914.15 4.55 4.804.15 4.55 4.80 3.41 4.12 3.95 5.08 4.53 3.92 3.58 5.35 3.843.41 4.12 3.95 5.08 4.53 3.92 3.58 5.35 3.843.60 3.51 4.063.60 3.51 4.063.07 3.55 4.23 3.57 4.83 3.52 3.84 4.50 3.963.07 3.55 4.23 3.57 4.83 3.52 3.84 4.50 3.964.50 3.27 4.524.50 3.27 4.523.19 4.59 3.75 3.98 4.13 4.26 3.63 3.87 3.19 4.59 3.75 3.98 4.13 4.26 3.63 3.87 5.715.713.30 4.73 4.173.30 4.73 4.17 5.13 3.78 4.57 3.80 3.93 3.78 3.99 4.48 4.285.13 3.78 4.57 3.80 3.93 3.78 3.99 4.48 4.284.06 5.26 5.254.06 5.26 5.253.98 5.03 3.51 3.86 3.02 3.70 4.33 3.29 3.253.98 5.03 3.51 3.86 3.02 3.70 4.33 3.29 3.254.15 4.36 4.954.15 4.36 4.953.00 3.263.00 3.26试编制频数分布表。试编制频数分布表。第三页,讲稿共五十五页哦1、频数表的编制、频数表的编制4找全距找全距(range)4定组距定组距(class interval):一般分为一般分为1015组,如组距约为全距组,如组距约为全距/104写组段:写组段:8每个组段的起点称为下限,每个组段的起点称为下限,lower limit;8每个组段的终点称为上限,每个组段的终点称为上限,upper limit;8下限下限X50,或或 10)4资料的分布不清。资料的分布不清。4注意:在完全对称的单峰曲线分布中,同一组注意:在完全对称的单峰曲线分布中,同一组资料的均数与中位数相同,资料的均数与中位数相同,Mean=Median第二十八页,讲稿共五十五页哦中位数的优缺点中位数的优缺点优点:点:8不受个不受个别特大或特小的特大或特小的观察察值影响;影响;8其它平均数不宜使用其它平均数不宜使用时,中位数就,中位数就显示示出它的出它的优越性。越性。缺点:缺点:8掉失了大量信息,其敏感性不掉失了大量信息,其敏感性不够。第二十九页,讲稿共五十五页哦百分位数百分位数(Percentile,Px)百分位数百分位数4位置指标;界值;位置指标;界值;4分布数列的百等份分割值。分布数列的百等份分割值。4有有x%的比的比Px小小,有有(100-x)%的比的比Px大。大。4中位数是一个特定的百分位数中位数是一个特定的百分位数P50。第三十页,讲稿共五十五页哦百分位数的计算百分位数的计算fX 为为PX所在组段的频数,所在组段的频数,i 为该组段的组距,为该组段的组距,L 为该组段的下限,为该组段的下限,fL 为小于为小于L各组段的累计频数。各组段的累计频数。第三十一页,讲稿共五十五页哦某传染性疾病的潜伏期(天)如下表,求其某传染性疾病的潜伏期(天)如下表,求其 中位数和百分位数中位数和百分位数P P9595潜伏期(天)人数f累计频数f累计频率%4 262624.048 487468.5212259991.6716 610597.2220 3108100.00第三十二页,讲稿共五十五页哦百分位数的应用百分位数的应用4描述一描述一组观察察值在某百分位置上的水在某百分位置上的水平。平。4用于确定医学正常用于确定医学正常值范范围。4用一用一组百分位数描述一百分位数描述一组观察察值的的变异度,如四分位数。异度,如四分位数。第三十三页,讲稿共五十五页哦应用平均数时的注意事项应用平均数时的注意事项4同同质的的变量量值才能求平均数;才能求平均数;4根据根据资料的分布特点,料的分布特点,选用适用适应的平均数指的平均数指标。第三十四页,讲稿共五十五页哦平均水平平均水平SPSS统计描述命令统计描述命令4Analyze Descriptive Statistics Frequencies Descriptives4注意:频数表资料要用注意:频数表资料要用weight命令命令第三十五页,讲稿共五十五页哦使用频数表资料时使用频数表资料时SPSSSPSS操作中应注操作中应注意的事项意的事项4频数表资料要用频数表资料要用weight命令;命令;4进行数据输入时要使用组中值;并且进行数据输入时要使用组中值;并且在在Frequencies命令中要选择命令中要选择 Values are group midpoints:根据分根据分组资料计算百分位数。组资料计算百分位数。第三十六页,讲稿共五十五页哦SPSS操作操作求几何均数时有三种方法:求几何均数时有三种方法:1.是先计算对数的均数,然后求其反对数,得是先计算对数的均数,然后求其反对数,得出几何均数;出几何均数;2.直接用直接用Report Case Summaries 命令;命令;3.用用Compare Means 命令,但要个增加分组变量。命令,但要个增加分组变量。第三十七页,讲稿共五十五页哦第三节第三节 变异程度的统计指标变异程度的统计指标例例 有有3组同龄男孩体重(组同龄男孩体重(kg)如下,其体)如下,其体重均数重均数 都是都是30(kg),试分析离散),试分析离散程度。程度。甲组甲组 26 28 30 32 34乙组乙组 24 27 30 33 36丙组丙组 26 29 30 31 34第三十八页,讲稿共五十五页哦离散程度(或变异程度)离散程度(或变异程度)4指数据参差不指数据参差不齐的程度,反映的程度,反映资料的料的离散离散趋势。4将反映平均水平与离散程度的指将反映平均水平与离散程度的指标结合起来使用,可全面地描述数据的分合起来使用,可全面地描述数据的分布布规律。律。第三十九页,讲稿共五十五页哦一、一、全距全距(或极差(或极差,Range)4 全距全距=最大值最大值 最小值最小值4优点:简单明了优点:简单明了4缺点:不能反映组内其他数据的变缺点:不能反映组内其他数据的变异,样本含量相差较大时,不宜用异,样本含量相差较大时,不宜用极差比较分布的离散程度。极差比较分布的离散程度。第四十页,讲稿共五十五页哦二、二、四分位数间距四分位数间距(inter-quartile range)4百分位数:指把数据从小到大排列后处于第百分位数:指把数据从小到大排列后处于第X百分位置的数值。它将全部数据分为两部分,百分位置的数值。它将全部数据分为两部分,在不包括在不包括PX的全部数据中有的全部数据中有X%数据小于数据小于PX,有有1-X%的数据大于的数据大于PX%。中位数是一个特定的。中位数是一个特定的百分位数百分位数P50。4四分位数:四分位数:下四分位数下四分位数P25;上四分位数;上四分位数P75 P0 P25 P50 P75 P100 4四分位数间距:四分位数间距:P75-P25 或或 QU-QL 比极差稳定,但仍未考虑每个数据的大小。常比极差稳定,但仍未考虑每个数据的大小。常和中位数结合使用描述数据的分布规律。和中位数结合使用描述数据的分布规律。第四十一页,讲稿共五十五页哦三、三、离均差平方和离均差平方和(sun of square)、方差方差(variance)和和标准差标准差(standard deviation)4平均偏差(平均偏差(mean difference):4离均差平方和离均差平方和(sun of square,SS)第四十二页,讲稿共五十五页哦方差方差和和标准差标准差4离均差平方和离均差平方和:8考虑每个观察值,但受考虑每个观察值,但受N的影响。的影响。4对离均差平方和求均数,得对离均差平方和求均数,得总体方总体方差差 2,开根号开根号得得标准差标准差 。第四十三页,讲稿共五十五页哦一般一般 未知,常常用未知,常常用来估计之,来估计之,4数理统计证明,如用样本的变量个数数理统计证明,如用样本的变量个数n来代替来代替N,计算出的样本方差比实际计算出的样本方差比实际 2低,需要用低,需要用n-1校正,得校正,得样本方差样本方差S2。开根号得样本开根号得样本标准差标准差s。第四十四页,讲稿共五十五页哦自由度,自由度,degree of freedom4方差计算公式中的方差计算公式中的n-1被称为自由度,它描述被称为自由度,它描述了当了当 选定时,选定时,n个个X中能自由变动的中能自由变动的X(变(变量值)的个数。量值)的个数。4例:某样本含有例:某样本含有3个数据,要求个数据,要求X=10。则在自由确。则在自由确定了定了2个数据后,第个数据后,第3个数据只能是个数据只能是10-(x1+x2)。即有即有2个数据可以自由变动个数据可以自由变动,其自由度其自由度=2。4推而广之,任何统计量的自由度推而广之,任何统计量的自由度 n-k,k为限为限制条件的个数。制条件的个数。4自由度:是随机变量可以自由度:是随机变量可以“自由自由”取值的个取值的个数。数。第四十五页,讲稿共五十五页哦4总体体标准差准差4样本本标准差准差标准差标准差standard deviation4应用于用于频数表数表资料:料:第四十六页,讲稿共五十五页哦标准差的计算标准差的计算甲组甲组 26 28 30 32 34 标准差标准差 3.16乙组乙组 24 27 30 33 36 4.74丙组丙组 26 29 30 31 34 2.92甲组:甲组:X=26+28+30+32+34=150X=26+28+30+32+34=150XX2 2=26=262 2+28+282 2+30+302 2+32+322 2+34+342 2=4540=4540第四十七页,讲稿共五十五页哦用频数表法计算标准差用频数表法计算标准差4见下表下表计算算第四十八页,讲稿共五十五页哦组段频数f 组中值Xf Xf X22.3012.452.456.002.6032.758.2522.692.9063.0518.3055.823.2083.3526.8089.783.50 173.6562.05226.483.80 203.9579.00312.054.10 174.2572.25307.064.40 124.5554.60248.434.70 94.8543.65211.705.00 55.1525.75132.615.3025.4510.9059.415.605.901 5.755.7533.06合计101409.751705.09第四十九页,讲稿共五十五页哦标准差的用途:标准差的用途:4反映一反映一组观察察值的离散程度;的离散程度;4计算算变异系数;异系数;4计算算标准准误;4估估计参考参考值范范围。第五十页,讲稿共五十五页哦4标准差与算术均数之比,标准差与算术均数之比,4反映了相对离散程度反映了相对离散程度4常用于比较常用于比较8度量衡单位不同的多组资料的变异度度量衡单位不同的多组资料的变异度8均数相差悬殊的多组资料的变异度均数相差悬殊的多组资料的变异度四、四、变异系数变异系数 CV(coefficient of variation)第五十一页,讲稿共五十五页哦例:度量衡单位不同的变异度例:度量衡单位不同的变异度4某地某地20岁男子岁男子110名名8身高身高 =172.73cm,s4.09cm;8体重体重 55.04kg,s4.10kg,4试比较两组资料的变异程试比较两组资料的变异程度,即身高、体重的变异度,即身高、体重的变异程度哪个大?程度哪个大?第五十二页,讲稿共五十五页哦例:均数相差悬殊的变异度例:均数相差悬殊的变异度某地成年人舒张压和收缩压的变异程度均数标准差变异系数(%)舒张压77.510.713.8收缩压122.917.113.9第五十三页,讲稿共五十五页哦54第二章作业第二章作业 P17P17二、计算与分析题:题1、题2、题3、题4作业要求:作业要求:(1)能用SPSS计算的必须用SPSS计算;(2)用A4单页,不要用作业簿;(3)spss要求写出主要命令与主要结果;(4)注明学院、专业、姓名与学号;(5)不必抄题目,只写明题号第五十四页,讲稿共五十五页哦感谢大家观看第五十五页,讲稿共五十五页哦