资料统计分析——单变量描述统计ppt课件.ppt
![资源得分’ title=](/images/score_1.gif)
![资源得分’ title=](/images/score_1.gif)
![资源得分’ title=](/images/score_1.gif)
![资源得分’ title=](/images/score_1.gif)
![资源得分’ title=](/images/score_05.gif)
《资料统计分析——单变量描述统计ppt课件.ppt》由会员分享,可在线阅读,更多相关《资料统计分析——单变量描述统计ppt课件.ppt(56页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、项目八:调查资料的统计与分析项目八:调查资料的统计与分析 任务一任务一 单变量描述统计单变量描述统计任务二任务二 单变量推论统计单变量推论统计任务三任务三 双变量相关关系分析双变量相关关系分析众 值中 位 数均 值集集 中中 趋趋 势势异 众 比 率四 分 位 差方 差 与 标 准 差离离 散散 程程 度度数数 据据 的的 简简 化化任务一任务一 单变量描述统计单变量描述统计(一)频数分布(一)频数分布n所谓频数分布(所谓频数分布(frequency distributionfrequency distribution),就是指),就是指一组数据中取不同值的个案的次数分布情况,它一般一组数据中
2、取不同值的个案的次数分布情况,它一般以频数分布表的形式表达。以频数分布表的形式表达。n频数分布表的作用有两方面,一是简化资料,即将调频数分布表的作用有两方面,一是简化资料,即将调查所得到的一长串原始数据,以一个十分简洁的统计查所得到的一长串原始数据,以一个十分简洁的统计表反映出来。二是从频数分布表中,可以更清楚的了表反映出来。二是从频数分布表中,可以更清楚的了解调查数据的众多信息。解调查数据的众多信息。一、频数分布与频率分布一、频数分布与频率分布(二)频率分布(二)频率分布n所谓频率分布所谓频率分布(percentages distributionpercentages distributio
3、n),就是),就是指一组数据中不同取值的频数相对于总数的比率分布指一组数据中不同取值的频数相对于总数的比率分布情况,这种比率在社会调查中经常是以百分比的形式情况,这种比率在社会调查中经常是以百分比的形式来表达。来表达。n频率分布表除了频数分布表的优点之外,还有一个重频率分布表除了频数分布表的优点之外,还有一个重要的优点就是十分方便地用于不同总体或不同类别之要的优点就是十分方便地用于不同总体或不同类别之间的比较。间的比较。频数分布表和频率分布表实例频数分布表和频率分布表实例n注意的是注意的是,对于一项有一定规模的调查样,对于一项有一定规模的调查样本来说,一般不宜对如年龄、收入、时间本来说,一般不
4、宜对如年龄、收入、时间等等定比定比变量做频数分布表或频率分布表。变量做频数分布表或频率分布表。因为,此时类别很多,而每一类别中个案因为,此时类别很多,而每一类别中个案数不多,所得结果繁杂不适用。数不多,所得结果繁杂不适用。二、集中趋势分析二、集中趋势分析n集中趋势测量:集中趋势测量:用某一个典型的变量值或特用某一个典型的变量值或特征值来代表全体变量的问题,这个典型的变征值来代表全体变量的问题,这个典型的变量值或特征值就称作集中值或集中趋势。量值或特征值就称作集中值或集中趋势。 众值(众值(Mode)Mode)定类层次定类层次 中位值(中位值(Median)Median)定序层次定序层次 均值(
5、均值(Mean)Mean)定距层次定距层次(一)众数(一)众数(modemode)1 1、出现频次最多的变量值;、出现频次最多的变量值;2 2、众数的不唯一性;、众数的不唯一性;n原始数据:原始数据:4 4、5 5、7 7、8 8、1919(无众值)(无众值)n原始数据:原始数据:4 4、5 5、7 7、5 5、5 5、1616(一个众值)(一个众值)n原始数据:原始数据:4 4、4 4、5 5、7 7、7 7、9 9(两个众值)(两个众值)3 3、主要应用于定类变量,当然也可以应用于定序、主要应用于定类变量,当然也可以应用于定序和定距变量和定距变量1.1.单值分组资料(非连续取值)求众数单值
6、分组资料(非连续取值)求众数2.2.组距分组(连续取值)资料求众数组距分组(连续取值)资料求众数n先找出众数组,代入公式先找出众数组,代入公式n组距分组资料众数求值公式:组距分组资料众数求值公式:解:解: 找出众数组为找出众数组为222.5227.5222.5227.5 代入组距分组资料众数求值公式:代入组距分组资料众数求值公式:练习:求下表众数练习:求下表众数收入收入( (元元) )f fc cf f c cf f 500-699500-69910101010550550700-899700-89965657575540540900-1099900-109912612621121147547
7、51100-12991100-12991581583693693393391300-14991300-14991411415105101811811500-16991500-169940405505504040总数总数 550550表表X-X X-X 某人群月收入频数分布表某人群月收入频数分布表n从分布来看,众数是具有明显集中趋势点的数从分布来看,众数是具有明显集中趋势点的数值,一组数据分布的最高峰点所对应的数值及值,一组数据分布的最高峰点所对应的数值及为众数。为众数。(二)中位数(二)中位数(MedianMedian)n把一组数据把一组数据按顺序排列按顺序排列,处于,处于中间位置中间位置的那
8、个数的那个数值就是中位值。值就是中位值。n主要应用于定序变量,也可用于定距变量,但不主要应用于定序变量,也可用于定距变量,但不可用于定类变量。可用于定类变量。Mdn将各个个案将各个个案由低至高排列由低至高排列起来,居序列中央位置起来,居序列中央位置的个案值就是中位的个案值就是中位数数。 MdMd位置位置= = n中位数中位数= =中间位置的值中间位置的值注意:先找位置,再找中位数注意:先找位置,再找中位数12n1.1.原始资料求中位数原始资料求中位数个案数为奇数个案数为奇数【例【例3 3】:甲地的】:甲地的5 5户人家的人数为:户人家的人数为:2 2,4 4,3 3,6 6,8 8,求中位值。
9、求中位值。 解:Md的位置 321n215排序排序2,3,4,6,8Md=4个案数为偶数个案数为偶数【例例4 4】:乙地的:乙地的6 6户人家的人数为:户人家的人数为:2 2,4 4,3 3,6 6,8 8,5 5求中位值。求中位值。 解:Md的位置 3.521n216排序排序2 2,3 3,4 4, 5, 65, 6,8 8Md= =4.5254【例5】根据下表求中位值。解:Md位置 250.5 中位值Md乙21n21500先计算累计频数,然后求中间位置,中间位置最先先计算累计频数,然后求中间位置,中间位置最先落入的累计频数所对于的标志值即为中位数。落入的累计频数所对于的标志值即为中位数。2
10、.2.单值分组资料(非连续取值)求中位数单值分组资料(非连续取值)求中位数练习练习1 1:计算表:计算表9-79-7的中位数的中位数先找出中位数所在组,利用公式先找出中位数所在组,利用公式374.253 3、组距分组(连续取值)资料求中位数、组距分组(连续取值)资料求中位数练习:计算下表中位数练习:计算下表中位数练习:计算下表中位数练习:计算下表中位数(三)平均数(三)平均数(meanmean) 1 1、原始资料求均值、原始资料求均值xXn【例6】某班10名学生年龄分别为20、21、19、19、20、20、21、22、18、20岁,求他们的平均年龄。解:根据平均数的计算公式有:岁2010200
11、NXX29n某个变项值重复出现多次,可以先统计每个值(某个变项值重复出现多次,可以先统计每个值(x x)的次数(的次数(f f),再求次数与相应变量值的乘积),再求次数与相应变量值的乘积(fxfx),利用各乘积之和求出均值),利用各乘积之和求出均值。(。(f f也称为权也称为权数数, ,f/nf/n称为权重)称为权重) 公式:fxXn2 2、单值分组资料求平均数、单值分组资料求平均数 【例例7】调查某年调查某年120名学名学生的年龄,结果如下表,求生的年龄,结果如下表,求平均年龄。平均年龄。解:根据公式得18.9岁nxfnXX120202120173 3、组距分组资料求均值、组距分组资料求均值
12、n先求出组中值先求出组中值组中值组中值=(上限(上限+下限)下限)/2n计算组中值的和计算组中值的和n计算分组数据的均值计算分组数据的均值1599.417mfxXn组中值组中值例8众数、中位数和平均数的比较众数、中位数和平均数的比较1 1数数据据类类型型和和所所适适用用的的集集中中趋趋势势测测量量值值 数数据据类类型型 定定类类 定定序序 定定距距 众众值值 众众值值 众众值值 中中位位值值 中中位位值值 测测度度值值 均均值值 注:注: 表示该数据类型最适合用的测度值表示该数据类型最适合用的测度值众数、中位数和平均数的比较众数、中位数和平均数的比较2 2n平均数比中位数利用了更多的数据信息,
13、对总平均数比中位数利用了更多的数据信息,对总体的描述更全面和准确。体的描述更全面和准确。n平均数很容易受到极端值变化的影响,而中位平均数很容易受到极端值变化的影响,而中位值不会受到这种影响。值不会受到这种影响。n对于抽样调查来说,平均数是一种比中位数更对于抽样调查来说,平均数是一种比中位数更为稳定的量度,它随样本的变化比较小。为稳定的量度,它随样本的变化比较小。众数、中位数和均值的关系众数、中位数和均值的关系练习: 求下表求下表(单项数列单项数列)所示数据的算术平均数所示数据的算术平均数。人口数(人口数(X)户数户数(f)频率频率(P)23456785816106410.100.160.320
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 资料 统计分析 变量 描述 统计 ppt 课件
![提示](https://www.taowenge.com/images/bang_tan.gif)
限制150内