描述统计:课件.ppt
《描述统计:课件.ppt》由会员分享,可在线阅读,更多相关《描述统计:课件.ppt(62页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、描述统计:描述统计:第1页,此课件共62页哦学学习目目标 学学学学习习本章后本章后本章后本章后,您您您您应该应该做到:做到:做到:做到:1.1.1.1.了解数据了解数据了解数据了解数据预处预处理的内容和要求;理的内容和要求;理的内容和要求;理的内容和要求;2.2.2.2.明确明确明确明确频频数分布、数据分数分布、数据分数分布、数据分数分布、数据分组组的概念及基本内容;的概念及基本内容;的概念及基本内容;的概念及基本内容;3.3.3.3.掌握定性数据、定量数据的相掌握定性数据、定量数据的相掌握定性数据、定量数据的相掌握定性数据、定量数据的相应频应频数分布表的数分布表的数分布表的数分布表的编编制;
2、制;制;制;4.4.4.4.理解并掌握各种理解并掌握各种理解并掌握各种理解并掌握各种统计图统计图形的特点与适用范形的特点与适用范形的特点与适用范形的特点与适用范围围;5.5.5.5.熟悉各种表格、熟悉各种表格、熟悉各种表格、熟悉各种表格、图图形的形的形的形的计计算机算机算机算机软软件(主要是件(主要是件(主要是件(主要是ExcelExcel软软件)件)件)件)应应用;用;用;用;6.6.6.6.描述描述描述描述统计统计数据表格与数据表格与数据表格与数据表格与图图形形形形显显示的示的示的示的现实应现实应用用用用问题问题。第2页,此课件共62页哦第一节第一节 数据的预处理数据的预处理一、数据审核一
3、、数据审核二、数据筛选二、数据筛选三、数据排序三、数据排序第3页,此课件共62页哦一、数据审核一、数据审核1.1.准确性准确性审核核n n审核的对象就是登记性误差(非抽样误差)n n采取的方法是逻辑检查和计算检查 n n逻辑检查,主要看调查数据的内容是否合理,项逻辑检查,主要看调查数据的内容是否合理,项目之间是否有矛盾的地方,以及与有关数据进行目之间是否有矛盾的地方,以及与有关数据进行对照,或者检查数据的平衡关系,以暴露逻辑上对照,或者检查数据的平衡关系,以暴露逻辑上的矛盾的矛盾n n计算检查,这主要是从数字上检查,如各分项之计算检查,这主要是从数字上检查,如各分项之和是否等于总计,计量单位是
4、否合适,计算方法和是否等于总计,计量单位是否合适,计算方法上是否合理等等上是否合理等等 第4页,此课件共62页哦2.2.全面性全面性审核核 就是要核对应调查的单位是否有遗漏,应调查的内容是否齐全3.3.及及时性性审核核 即是否按规定的时间获取数据资料 第5页,此课件共62页哦二、数据筛选二、数据筛选(data filter)1.1.当当数数据据中中的的错错误误不不能能予予以以纠纠正正,或或者者有有些些数数据据不不符符合合调调查查的的要要求求而而又又无无法法弥弥补补时时,需要对数据进行筛选需要对数据进行筛选2.2.数据筛选的内容数据筛选的内容将将某某些些不不符符合合要要求求的的数数据据或或有有明
5、明显显错错误误的的数数据予以剔除据予以剔除将将符符合合某某种种特特定定条条件件的的数数据据筛筛选选出出来来,而而不不符合特定条件的数据予以剔除符合特定条件的数据予以剔除3.数据筛选可借助计算机完成数据筛选可借助计算机完成数据筛选可借助计算机完成数据筛选可借助计算机完成第6页,此课件共62页哦三、数据排序三、数据排序1.1.按一定顺序将数据排列,以发现一些明显按一定顺序将数据排列,以发现一些明显的特征或趋势,找到解决问题的线索的特征或趋势,找到解决问题的线索2.2.排序有助于对数据检查纠错,以及为重新排序有助于对数据检查纠错,以及为重新归类或分组等提供依据归类或分组等提供依据3.3.在某些场合,
6、排序本身就是分析的目的之在某些场合,排序本身就是分析的目的之一一4.4.排序可借助于计算机完成排序可借助于计算机完成第7页,此课件共62页哦第二节第二节 定性数据的定性数据的 图表分析图表分析 一、频数分布一、频数分布二、定性数据的图形表示二、定性数据的图形表示第8页,此课件共62页哦一、频数分布一、频数分布(Frequency distribution)1.1.将统计数据分组后,各组数据出现的次数被称为将统计数据分组后,各组数据出现的次数被称为将统计数据分组后,各组数据出现的次数被称为将统计数据分组后,各组数据出现的次数被称为频数频数频数频数(Frequency)(Frequency),亦称
7、为次数,亦称为次数,亦称为次数,亦称为次数2.2.频率频率频率频率(relative frequencyrelative frequency):某一类别数据个数占全部:某一类别数据个数占全部:某一类别数据个数占全部:某一类别数据个数占全部数据个数的比值数据个数的比值数据个数的比值数据个数的比值3.3.把各个组以及相应的频数依一定的次序全部列出来,就把各个组以及相应的频数依一定的次序全部列出来,就把各个组以及相应的频数依一定的次序全部列出来,就把各个组以及相应的频数依一定的次序全部列出来,就形成了频数分布亦称为形成了频数分布亦称为形成了频数分布亦称为形成了频数分布亦称为次数分布次数分布次数分布次
8、数分布4.4.对于定性数据本身就是对事物的一种分类,因此对于定性数据本身就是对事物的一种分类,因此对于定性数据本身就是对事物的一种分类,因此对于定性数据本身就是对事物的一种分类,因此在列出所分的类别的同时,再列出对应的频数或在列出所分的类别的同时,再列出对应的频数或在列出所分的类别的同时,再列出对应的频数或在列出所分的类别的同时,再列出对应的频数或频率,就形成了名类数据的频数分布。频率,就形成了名类数据的频数分布。频率,就形成了名类数据的频数分布。频率,就形成了名类数据的频数分布。第9页,此课件共62页哦(一)生成频数分布表(一)生成频数分布表分类数据频数分布表分类数据频数分布表第10页,此课
9、件共62页哦顺序数据的频数分布表顺序数据的频数分布表甲城市家庭对住房状况评价的频数分布甲城市家庭对住房状况评价的频数分布甲城市家庭对住房状况评价的频数分布甲城市家庭对住房状况评价的频数分布回答类别回答类别回答类别回答类别甲城市甲城市甲城市甲城市户数户数户数户数(户户户户)百分比百分比百分比百分比(%)(%)向上累积向上累积向上累积向上累积 向下累积向下累积向下累积向下累积 户数户数户数户数(户户户户)百分比百分比百分比百分比(%)(%)户数户数户数户数(户户户户)百分比百分比百分比百分比(%)(%)非常不满意非常不满意非常不满意非常不满意 不满意不满意不满意不满意 一般一般一般一般 满意满意满
10、意满意 非常满意非常满意非常满意非常满意 24 24108108 93 93 45 45 30 30 8 83636313115151010 24 24132132225225270270300300 8.0 8.0 44.0 44.0 75.0 75.0 90.0 90.0100.0100.0300300276276168168 75 75 30 30100.0100.09292565625251010合计合计合计合计300300100.0100.0第11页,此课件共62页哦顺序数据的整理顺序数据的整理(可计算的统计量可计算的统计量可计算的统计量可计算的统计量)1.累累积积频频数数(cumu
11、lative frequencies):各类别频数的逐级累加。包括向上累积和向下累积两类。2.累累积积频频率率(cumulative percentages):各类别频率(百分比)的逐级累加。包括向上累积和向下累积两类。第12页,此课件共62页哦列联表(交叉频数表)列联表(交叉频数表)n n作用作用:在实际分析中,除了需要对单个变量的数据分布情在实际分析中,除了需要对单个变量的数据分布情况进行分析外,还需要掌握多个变量在不同取值情况下的况进行分析外,还需要掌握多个变量在不同取值情况下的数据分布情况,从而进一步深入分析变量之间的相互影响数据分布情况,从而进一步深入分析变量之间的相互影响和关系,这
12、种分析就称为交叉列联表分析。和关系,这种分析就称为交叉列联表分析。n n概念:概念:以列表方式表示两个以列表方式表示两个(或多个或多个)变量或属性共同变量或属性共同出现的频率。出现的频率。或者是将两个属性变量的不同取值置或者是将两个属性变量的不同取值置于行和列的位置,在表格中填入变量组合取值的频于行和列的位置,在表格中填入变量组合取值的频数的表格数的表格 第13页,此课件共62页哦列联表(交叉频数表)列联表(交叉频数表)5050名大学生性名大学生性名大学生性名大学生性别别和持有手机品牌交叉和持有手机品牌交叉和持有手机品牌交叉和持有手机品牌交叉频频数分布表数分布表数分布表数分布表第14页,此课件
13、共62页哦(二)相对频数分布和百分数频数分布(二)相对频数分布和百分数频数分布1.1.1.1.比例(比例(proportionproportion)也称构成比)也称构成比,它是一个样,它是一个样本(或总体)中各类别的频数与全部频数本(或总体)中各类别的频数与全部频数之比,通常用于反映样本(或总体)的构之比,通常用于反映样本(或总体)的构成或结构。成或结构。2.2.将比例乘以将比例乘以100得到的数值称为得到的数值称为百分比百分比(percentage),用),用%表示。表示。3.3.由比例和百分比我们可以编制由比例和百分比我们可以编制相对频数分相对频数分布表和百分数频数分布表。布表和百分数频数
14、分布表。第15页,此课件共62页哦 5050名大学生持有手机品牌名大学生持有手机品牌名大学生持有手机品牌名大学生持有手机品牌频频数、数、数、数、相相相相对对数数数数频频数和百分数数和百分数数和百分数数和百分数频频数分布表数分布表数分布表数分布表 利用利用excel软件不能直接生成相对频数分布和百分数频数分布,软件不能直接生成相对频数分布和百分数频数分布,需要在频数分布表的基础上单独计算并列示需要在频数分布表的基础上单独计算并列示 第16页,此课件共62页哦二、定性数据的图形表示二、定性数据的图形表示 比较适用于定性数据的图形主要有:条形图、饼图、环形图条形图、饼图、环形图等。第17页,此课件共
15、62页哦统计图统计图条形图条形图(bar Chart)1.1.用宽度相同的条形的高度或长短来表示各类别数据的图形2.2.有单式条形图、复式条形图单式条形图、复式条形图等形式3.3.主要用于反映分类数据的频数分布4.4.绘制时,各类别可以放在纵轴,称为条条形图形图,也可以放在横轴,称为柱形图柱形图第18页,此课件共62页哦单式条形图单式条形图 学生持有手机品牌的单式条形图 第19页,此课件共62页哦复式条形图复式条形图 学生持有手机品牌的复式条形图学生持有手机品牌的复式条形图 第20页,此课件共62页哦分类数据的图示分类数据的图示饼图饼图(pie Chart)1.1.也称圆形图,是用圆形及圆内扇
16、形的面积来表示数值大小的图形2.2.主要用于表示总体或样本中各组成部分所占的比例,对于研究结构性问题十分有用3.3.绘制圆形图时,总体中各部分所占的百分比用圆内的各个扇形面积表示,这些扇形的中心角度,是按各部分数据百分比占3600的相应比例确定的第21页,此课件共62页哦饼图示例饼图示例50名大学生持有手机品牌的饼图名大学生持有手机品牌的饼图 第22页,此课件共62页哦饼图饼图-分离型三维图分离型三维图 50名大学生持有手机品牌的饼图名大学生持有手机品牌的饼图 第23页,此课件共62页哦环形图环形图(annular chart)1.1.环形图中间有一个“空洞”,总体中的每一部分数据用环中的一段
17、表示2.2.环形图与圆形图类似,但又有区别n n圆形图只能显示一个总体各部分所占的比例圆形图只能显示一个总体各部分所占的比例n n环环形形图图则则可可以以同同时时绘绘制制多多个个总总体体的的数数据据系系列列,每每一一个总体的数据系列为一个环个总体的数据系列为一个环3.3.环形图可用于结构比较研究环形图可用于结构比较研究 4.4.环形图主要用于展示分类和顺序数据第24页,此课件共62页哦环形图示例环形图示例 图中里图中里面的圆面的圆环是持环是持有手机有手机品牌,品牌,外面的外面的圆环是圆环是喜爱手喜爱手机品牌机品牌 第25页,此课件共62页哦第三节第三节 定量数据的定量数据的 图表分析图表分析
18、一、频数分布一、频数分布二、定量数据的图形表示二、定量数据的图形表示第26页,此课件共62页哦等距分组等距分组异距分组异距分组一、频数分布一、频数分布第27页,此课件共62页哦单变量值分组单变量值分组(要点要点)1.将一个变量值作为一组将一个变量值作为一组2.适合于离散变量适合于离散变量3.适合于变量值较少的情况适合于变量值较少的情况第28页,此课件共62页哦单变量值分组单变量值分组(实例实例)例例例例2.72.7某车间某车间A A生产小组生产小组2020名工人日加工零件数如下(单名工人日加工零件数如下(单位:件):试采用单变量值分组法编制频数分布表。位:件):试采用单变量值分组法编制频数分布
19、表。16 13 18 15 19 14 17 13 15 1716 13 18 15 19 14 17 13 15 1718 15 16 18 14 16 15 16 17 1618 15 16 18 14 16 15 16 17 16采用单变量值分组法编制频数分布数列表采用单变量值分组法编制频数分布数列表为了便于分组,要先对原始数据排序。排序结果如下:为了便于分组,要先对原始数据排序。排序结果如下:为了便于分组,要先对原始数据排序。排序结果如下:为了便于分组,要先对原始数据排序。排序结果如下:13 13 14 14 15 15 15 15 16 16 13 13 14 14 15 15 15
20、 15 16 16 16 16 16 17 17 17 18 18 18 1916 16 16 17 17 17 18 18 18 19第29页,此课件共62页哦20名工人日加工零件数频数分布表 日产量(件)频数(人)频率(%)13 14 15 16 17 18 19 2 2 4 5 3 3 1 10 10 20 25 15 15 5 合计 20 100第30页,此课件共62页哦组距分组组距分组 (要点要点)1.1.将变量值的一个区间作为一组将变量值的一个区间作为一组(有等距和异距之分)(有等距和异距之分)(有等距和异距之分)(有等距和异距之分)1.1.适合于连续变量适合于连续变量2.2.适合
21、于变量值较多的离散变量适合于变量值较多的离散变量 第31页,此课件共62页哦组距分组组距分组(几个概念几个概念)1.1.下限下限下限下限(low limit)low limit):一个组的最小值一个组的最小值2.2.上限上限上限上限(upper limit)upper limit):一个组的最大值一个组的最大值3.3.组距组距组距组距(class width)class width):上限与下限之差上限与下限之差4.4.组中值组中值组中值组中值(class midpoint)class midpoint):下限与上限之间的中点值,它下限与上限之间的中点值,它代表该组变量值的一般水平,它的前提条
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 描述 统计 课件
限制150内