《统计资料收集》PPT课件.ppt
![资源得分’ title=](/images/score_1.gif)
![资源得分’ title=](/images/score_1.gif)
![资源得分’ title=](/images/score_1.gif)
![资源得分’ title=](/images/score_1.gif)
![资源得分’ title=](/images/score_05.gif)
《《统计资料收集》PPT课件.ppt》由会员分享,可在线阅读,更多相关《《统计资料收集》PPT课件.ppt(50页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、第二章(四)第四节 统计图制作统计图制作 数据显示包括了统计表与统计图两种主要形式,本节数据显示包括了统计表与统计图两种主要形式,本节主要讲述图与表的配合使用及其制作。主要讲述图与表的配合使用及其制作。本节重点掌握:本节重点掌握:一、常用统计图及其适用的数据类型一、常用统计图及其适用的数据类型二、不同类统计图的计算机制作方法二、不同类统计图的计算机制作方法一、条形图(bar charts)1 1、图例:以各组代表值为、图例:以各组代表值为X X轴,以测量值为轴,以测量值为Y Y轴(柱状图);或轴(柱状图);或以各组代表值为以各组代表值为Y Y轴,以测量值为轴,以测量值为X X轴(条形图);轴(
2、条形图);2 2、适用资料类型:、适用资料类型:(1 1)同一总体,不同测量指)同一总体,不同测量指标值(标准分数)的比较;标值(标准分数)的比较;例:同班同学不同课程考例:同班同学不同课程考试成绩比较。试成绩比较。(2 2)不同总体,同质性测量)不同总体,同质性测量指标值间的比较。指标值间的比较。例:不同班级同一门课程例:不同班级同一门课程考试成绩的比较。考试成绩的比较。二、饼图(pie)1 1、图例:以各组数据值构成饼图各扇形面积,总面积、图例:以各组数据值构成饼图各扇形面积,总面积之和为之和为100%100%。2 2、适用资料类型:、适用资料类型:(1 1)同一总体,不同部)同一总体,不
3、同部分所占比例的比较,用饼图;分所占比例的比较,用饼图;(2 2)不同总体,同质性)不同总体,同质性部分所占比例的比较,用环形图。部分所占比例的比较,用环形图。例:两个调查小组抽样例:两个调查小组抽样学生所占比例的相互比较。学生所占比例的相互比较。三、线图(line)1 1、图例:、图例:以时间段为以时间段为X X轴,以测轴,以测量值为量值为Y Y轴。轴。2 2、适用资料类型:随、适用资料类型:随时间变化的数据,发展趋势时间变化的数据,发展趋势分析。分析。四、散点图(scatter plots)1 1、图例:、图例:以第一变量为以第一变量为X X轴,第轴,第二变量为二变量为Y Y轴。轴。2 2
4、、适用资料类型:两、适用资料类型:两个变量相关关系趋势分析。个变量相关关系趋势分析。第二章(五)第五节 数据分布集中趋势测量数据分布集中趋势测量*意义:指计算一组数据的一般水平或中心值。意义:指计算一组数据的一般水平或中心值。*常用指标:包括算术平均数、中位数、众数、常用指标:包括算术平均数、中位数、众数、加权平均数、调和平均数、几何平均数等等。加权平均数、调和平均数、几何平均数等等。本节重点掌握本节重点掌握一、不同类数据集中趋势测量所使用的方法一、不同类数据集中趋势测量所使用的方法二、计算机常用集中趋势测量操作方法二、计算机常用集中趋势测量操作方法一、算术平均数算术平均数(算术平均数(ari
5、thmetic average )一般简)一般简称为平均数(称为平均数(average)或均数、均值)或均数、均值(mean)。)。一般用一般用,或者用表示。,或者用表示。算术平均数是最常用平均指标算术平均数是最常用平均指标1算术平均数的计算公式原始数据计算公式(计算机编程公式)(P32 23)Xi每个样本单位的原始测量值每个样本单位的原始测量值n样本量样本量例:例:1010位同学英语考试分数为位同学英语考试分数为8989、9090、6767、8080、7575、8989、9999、8888、4545、6868则平均成绩则平均成绩=(89+90+67+80+75+89+99+88+45+688
6、9+90+67+80+75+89+99+88+45+68)/10/10次数分布表计算公式(二手资料)(P32 2.4)Xi每组的组中值每组的组中值f每组的频数每组的频数用于从网上或期刊上查询到的二手分组资料,无法得到原始数据的情况。用于从网上或期刊上查询到的二手分组资料,无法得到原始数据的情况。表表1 521 52名学生数学成绩平均数计算表名学生数学成绩平均数计算表成绩成绩(1)Xif(2)f*Xi计计 算算959597.52 2195909092.52 2185858587.53 3262.5808082.55 5412.5757577.58 8620707072.51111797.5656
7、567.59 9607.5606062.55 5312.5555557.54 4230505052.52 2105454547.51 147.5合计合计523775.02、算术平均数的意义算术平均数是应用最普遍的一种平均指标。它是算术平均数是应用最普遍的一种平均指标。它是“真值真值”(true score)的最佳估计值。)的最佳估计值。真值是反映某种现象的真实水平的分数。由于测真值是反映某种现象的真实水平的分数。由于测量过程中的各种偶然因素的影响,真值往往很难得量过程中的各种偶然因素的影响,真值往往很难得到。到。在实际测量中,往往采用在实际测量中,往往采用“多次测量,取平均数多次测量,取平均数
8、”的方法,用平均数去估计真值。的方法,用平均数去估计真值。3、算术平均数的优缺点 算术平均数具备一个良好的平均指标所算术平均数具备一个良好的平均指标所应具备的一些特点:反应灵敏、有公式严密应具备的一些特点:反应灵敏、有公式严密确定、简明易懂、适合代数运算等等。确定、简明易懂、适合代数运算等等。主要不足:容易受两极端数值的影响;主要不足:容易受两极端数值的影响;一组数据中有模糊不清的数值时无法计算。一组数据中有模糊不清的数值时无法计算。4、计算和应用算术平均数的原则(1 1)同质性原则:算术平均数只能用于表示同类数)同质性原则:算术平均数只能用于表示同类数据的集中趋势。据的集中趋势。(2 2)平
9、均数与个体数值相结合的原则:在解释个体)平均数与个体数值相结合的原则:在解释个体特征时,既要看平均数,也要结合个体的数据。特征时,既要看平均数,也要结合个体的数据。(3 3)平均数与标准差、方差相结合原则:描述一组)平均数与标准差、方差相结合原则:描述一组数据时既要分析其集中趋势,也要分析离散程度。数据时既要分析其集中趋势,也要分析离散程度。(4 4)一般用于表示正态分布数据的集中趋势。)一般用于表示正态分布数据的集中趋势。二、中位数中位数(中位数(median)又称为中数,)又称为中数,是按顺序排列的一组数据中位于是按顺序排列的一组数据中位于中间位置的数。中间位置的数。一般用一般用Md或或M
10、dn、Me表示。表示。1、中位数的计算方法原始数据计算法(计算机编程公式)首先将一组数据按顺序排列首先将一组数据按顺序排列(5个数据的算例)原始数据:原始数据:24 22 21 26 20排排 序序:20 21 22 24 26位位 置置:1 2 3 3 4 5 中位数中位数 22位置位置N+125+123(6个数据的算例)原始数据原始数据:10 5 9 12 6 8排排 序序:5 6 8 9 10 12位位 置置:1 2 3 3 4 4 5 6位置位置N+126+123.5中位数中位数 8+928.5次数分布表计算法(二手资料)由次数分布表计算中位由次数分布表计算中位数需要用到累积次数分布表
11、。数需要用到累积次数分布表。当表中数据的累积方向当表中数据的累积方向不同时,计算公式也不同。不同时,计算公式也不同。由最低组至最高组(向下)累积频数计算公式由最低组至最高组(向下)累积频数计算公式公式中公式中:L:L为中位数所在组的下限为中位数所在组的下限 S Sm-1m-1为小于中位数所在组下限各组的累积频数为小于中位数所在组下限各组的累积频数 n n为数据总和为数据总和 fmfm为中位数所在组的频数为中位数所在组的频数 i i为中位数组的组距为中位数组的组距中位数组:指由最低组向最高组累积,达到次数半值的组中位数组:指由最低组向最高组累积,达到次数半值的组(P31 2.2)表表2 302
12、30名工人日加工零件中位数计算表名工人日加工零件中位数计算表组别组别f f向下向下累积频数累积频数80803 3390907 7101001001313231101105 5281201202 230 合计合计30计算计算表示:表示:30名工人中,中等水平工人名工人中,中等水平工人日加工零件数约为日加工零件数约为104件件表表3 523 52名学生数学成绩中位数计算表名学生数学成绩中位数计算表成绩成绩频数频数f f累积累积频数频数计计 算算95952 25290902 25085853 34880805 54575758 840707011113265659 92160605 51255554
13、 4750502 2345451 11合计合计522中位数的特点及应用中位数不受两端极端数据的影响。一般用于下列情况:中位数不受两端极端数据的影响。一般用于下列情况:(1 1)数值数据型数据的有极端数据时,即数据明显为偏态分布,)数值数据型数据的有极端数据时,即数据明显为偏态分布,极差较大(偏峰分布)极差较大(偏峰分布);(2 2)一组数据中有个别数据不确切、不清楚时;)一组数据中有个别数据不确切、不清楚时;(3 3)用定序尺度测量的组距式数据,即资料属于等级性质时。)用定序尺度测量的组距式数据,即资料属于等级性质时。例:家庭人月均收入:(例:家庭人月均收入:(1 1)200-400200-4
14、00;(;(2 2)400-600400-600;(;(3 3)600-800600-800;(4 4)800800以上以上计算:当地中等水平家庭的人均月收入水平计算:当地中等水平家庭的人均月收入水平 三众数众数(众数(mode)用)用MoMo表示,有两种定义:表示,有两种定义:理论众数理论众数理论众数理论众数是指与频数分布曲线最高点相对应的是指与频数分布曲线最高点相对应的横坐标上的一点;横坐标上的一点;粗略众数粗略众数粗略众数粗略众数是一组数据中出现次数最多的那个数。是一组数据中出现次数最多的那个数。众数也是一种平均指标,也可用来表示一组数众数也是一种平均指标,也可用来表示一组数据的集中趋势
15、。据的集中趋势。众数的计算方法(1 1)观察法寻找粗略众数)观察法寻找粗略众数 未分组数据:未分组数据:出现次数最多的数即为众数。出现次数最多的数即为众数。已分组(次数分布表)数据:已分组(次数分布表)数据:频数最多那一组频数最多那一组数据的组中值,即为众数。数据的组中值,即为众数。(2 2)用次数分布数据精确计算众数)用次数分布数据精确计算众数由最低组至最高组(向下)累积频数计算公式 d1d1Mo=L+Mo=L+i i (P29 2.1P29 2.1)d1+d2 d1+d2公式中:公式中:LL众数组下限众数组下限 d1 d1众数组频数与其下限相邻一组频数之差众数组频数与其下限相邻一组频数之差
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 统计资料收集 统计资料 收集 PPT 课件
![提示](https://www.taowenge.com/images/bang_tan.gif)
限制150内