《spss计量资料的统计描述.ppt》由会员分享,可在线阅读,更多相关《spss计量资料的统计描述.ppt(31页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、第二章集中趋势和离散趋势(计量资料的统计描述)1主要内容l频数表l集中趋势l离散趋势l正态分布l正常值范围估计2原始资料3一.频 数 表 频数:当汇总大量的原始数据时,把数据按类型分组,其中每个组的数据个数,称为该组的频数。频数表(频数分布):表示各组及它们对应的组频数的表格称为频数表或频数分布。419981998年年年年100100名名名名1818岁健康女大学生身高的频数分布岁健康女大学生身高的频数分布岁健康女大学生身高的频数分布岁健康女大学生身高的频数分布身高组段身高组段(1)划记划记频数频数 f (2)1541121561111415811111,11111,11116011111,11
2、111,1111316211111,11111,11111,11111,112216411111,11111,11111,11111916611111,11111,111111516811111,111191701111417217411合合 计计1005频数表的编制 1.求全距(R):R=最大值 最小值 =173.6 154.7=18.9(cm)2.确定组数:通常815组 计算组距(i)i=R/组数 i=18.9/10=1.89 cm 取整数 2 cm 所以,i=2 cm3.确定组段:第一组段包括最小值,如本例为154 最后组段包括最大值,如本例1721744.列表划记6频数分布的两个特征:
3、集中趋势与离散趋势频数分布的类型:对称分布与偏态分布(集中位置偏向小的一侧叫正偏态,反之叫负偏态)频数表的主要用途:1.揭示分布类型 2.发现特大值和特小值 3.计算集中趋势指标与离散趋势指标78910二、集中位置的描述常用几种平均值:1.算术均数2.几何均数3.中位数常用平均值平均值来描述。平均值是一组数据典型或有代表性的值。由于这样典型的值趋向于落在根据数据大小排列的数据的中心,因此可以用于度量集中位置(位置指标)111.算术均数(均数)l意义:一组性质相同的观察值在数量上的平均水平。l表示(总体)X(样本)l计算:直接法、间接法、计算机l特征:(X-X)=0 估计误差之和为0。l应用:正
4、态分布或近似正态分布l注意:合理分组,才能求均数,否则没有意义。12100100名名1818岁女大学生身高均数的计算(加权法)岁女大学生身高均数的计算(加权法)身高组段(1)频数 f (2)组中值 X(3)fX(4)154215531015641576281581115917491601316120931622216335861641916531351661516725051689169152117041716841721741173173合 计f=100f X=1638132.几何均数l意义:N个数值的乘积开N次方即为这N 个数的几何均数。l表示:G l计算:l应用:原始数据分布不对称,经对
5、数转换后呈对称分布的资料。例如抗体滴度。143.中位数、百份位数l意义:将一组观察值从小到大排序后,居于中间位置的那个值或两个中间值的平均值。将N个观察值从小到大依次排列,再分成100等份,对应于X%位的数值即为第X百分位数。中位数是百分位的特殊形式。同样的例子还有四分位数、十分位数等。l表示:M、PXl计算:l应用:偏态资料,开口资料15三、离散程度的描述描述一组数据参差不齐的程度描述一组数据参差不齐的程度l全距l四分位数间距l方差l标准差l变异系数 161.全距、四分位数间距R:见上。Q:上四分位数(P7575)Qu u与下四分位数Ql l(P2525)之差,包含了全部观察值的一半。172
6、.标准差l相关概念:离均差、离均差平方和、方差(2 S2)l 标准差的符号:S l 标准差的意义:全面反映了一组观察值的变异程度.(越大说明围绕均数越离散,反之说明较集中在均数周围,均数代表性越好)l 标准差的计算(公式):l标准差的应用:描述变异程度、计算标准误、计算变异 系数、描述正态分布、估计正常值范围183.变异系数l意义:标准差与均数之比用百分数表示。l符号:CVl计算:CV=(S/X)100%l无单位l应用:单位不同的多组数据比较l 均数相差悬殊的多组资料19四、正态分布l1、图形l2、特征l3、面积201、正态分布的图形21正态分布正态分布222、正态分布的特征l均数处最高;l均
7、数为中心对称;l2个参数 N(u,)l正态分布的特殊形式:标准正态分布N(0,1);标准正态变换(变换公式);例题:一次统计测验的平均分是72,标准差是15,求60分、93分、72分的标准分数。l曲线下的面积有一定规律。233 3、曲线下面积、曲线下面积24正态曲线下的面积特点lP117 为标准正态分布下的面积l横轴上曲线下的面积为1l曲线下,横轴上对称于0的面积相等l从-到;lu,已知时,进行标准正态变换再查表lu,未知时,用样本的均数和标准差代替l95%,99%的面积公式:25 定义:又称参考值范围,是指特定健康人群定义:又称参考值范围,是指特定健康人群定义:又称参考值范围,是指特定健康人
8、群定义:又称参考值范围,是指特定健康人群的解剖、生理、生化等各种数据的波动范围。的解剖、生理、生化等各种数据的波动范围。的解剖、生理、生化等各种数据的波动范围。的解剖、生理、生化等各种数据的波动范围。习惯上是确定包括习惯上是确定包括习惯上是确定包括习惯上是确定包括95%95%95%95%的人的界值。的人的界值。的人的界值。的人的界值。单双侧:单双侧:单双侧:单双侧:根据指标的实际用途,有的指标有根据指标的实际用途,有的指标有根据指标的实际用途,有的指标有根据指标的实际用途,有的指标有上下界值,过高过低均属异常;某些指标过高上下界值,过高过低均属异常;某些指标过高上下界值,过高过低均属异常;某些
9、指标过高上下界值,过高过低均属异常;某些指标过高为异常,只需确定上限;某些指标过低为异常,为异常,只需确定上限;某些指标过低为异常,为异常,只需确定上限;某些指标过低为异常,为异常,只需确定上限;某些指标过低为异常,只需确定下限。只需确定下限。只需确定下限。只需确定下限。估计的方法:估计的方法:估计的方法:估计的方法:1 1 1 1、正态分布法、正态分布法、正态分布法、正态分布法2 2 2 2、百分位数法、百分位数法、百分位数法、百分位数法五、医学正常值范围的估计五、医学正常值范围的估计261.1.正态分布法正态分布法应用条件应用条件:正态分布或近似正态分布资料正态分布或近似正态分布资料 计算
10、计算 (双侧)(双侧)95%95%正常值正常值(医学参考值)范围公式:医学参考值)范围公式:(x x 1.96 1.96 S S,x x 1.96 1.96 S S)即即(x x1.96 1.96 S S)上例:上例:(163.84163.84 1.96 1.96 3.79 3.79,163.84163.84 1.96 1.96 3.79 3.79)即(即(156.41 cm,171.27 cm)156.41 cm,171.27 cm)27已知:已知:x=119.95cm,s=4.72cm.x=119.95cm,s=4.72cm.试问试问:(1):(1)估计该地估计该地7 7岁男童身高在岁男童
11、身高在110cm110cm以下者以下者 占该地占该地7 7岁男童的百分比。岁男童的百分比。(2)(2)估计该地估计该地7 7岁男童身高在岁男童身高在130cm130cm 以上者占该地以上者占该地7 7岁男童的百分比。岁男童的百分比。(3)(3)估计该地估计该地7 7岁男童身高在岁男童身高在107.77cm107.77cm到到 132.13cm132.13cm之间的占该地之间的占该地7 7岁男童的百分岁男童的百分 比。比。例题:某市例题:某市1982年年110名名7岁男童的身高岁男童的身高282.百分位数法lP19例题 应用条件:偏态分布资料 计算公式:双侧界值:P 2.5 P 97.5 单侧 上界:P 95 单侧 下界:P 5 29l小结l习题:1.各观察值加同一数后:A.均数不变,标准差改变 B.均数改变,标准差不变C.二者均不变 D.均改变2.用均数和标准差可全面描述:A.正偏态资料 B.负偏态资料 C.正态分布和近似正态分布 D.任何分布3.正态分布曲线下,从均数u 到u+1.96的面积为;A.95%B.45%C.97.5%D.47.5%30lP22 1976年美国8岁男孩的平均身高为146厘米,标准差为8厘米,估计在该研究中有%多少的男孩平均身高在138与154之间?又有多少在130到162之间?31
限制150内