贾俊平统计学第三章 数据的整理与显示.ppt
《贾俊平统计学第三章 数据的整理与显示.ppt》由会员分享,可在线阅读,更多相关《贾俊平统计学第三章 数据的整理与显示.ppt(97页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、3-1第第 3 章章 数据的整理与显示数据的整理与显示3-2第第 3 章章 数据的整理与显示数据的整理与显示3.1 数据的预处理数据的预处理 3.2 分布数列分布数列3.3 统计报表表3-3学习目标学习目标1.了解数据预处理的内容和目的了解数据预处理的内容和目的2.掌握分配数列的整理与显示方法掌握分配数列的整理与显示方法3.用用SPSS作作频数分布表和形频数分布表和形图图3-43.1 数据的预处理数据的预处理一一.数据审核数据审核二二.数据筛选数据筛选三三.数据排序数据排序3-5数据的预处理数据的预处理1.数据的审核数据的审核检查数据中的错误检查数据中的错误检查数据中的错误检查数据中的错误2.
2、数据的筛选数据的筛选找出符合条件的数据找出符合条件的数据找出符合条件的数据找出符合条件的数据3.数据排序数据排序升序和降序升序和降序升序和降序升序和降序寻找数据的基本特征寻找数据的基本特征寻找数据的基本特征寻找数据的基本特征3-6数据审核数据审核原始数据原始数据(raw data)审核的内容审核的内容1.1.完整性审核完整性审核n n检查应调查的单位或个体是否有遗漏检查应调查的单位或个体是否有遗漏检查应调查的单位或个体是否有遗漏检查应调查的单位或个体是否有遗漏n n所有的调查项目或指标是否填写齐全所有的调查项目或指标是否填写齐全所有的调查项目或指标是否填写齐全所有的调查项目或指标是否填写齐全2
3、.2.准确性审核准确性审核n n检检检检查查查查数数数数据据据据是是是是否否否否真真真真实实实实反反反反映映映映客客客客观观观观实实实实际际际际情情情情况况况况,内内内内容是否符合实际容是否符合实际容是否符合实际容是否符合实际n n检查数据是否有错误,计算是否正确等检查数据是否有错误,计算是否正确等检查数据是否有错误,计算是否正确等检查数据是否有错误,计算是否正确等3-7数据的审核数据的审核原始数据原始数据(raw data)(raw data)审核数据准确性的方法审核数据准确性的方法1.1.逻辑检查逻辑检查n n从从从从定定定定性性性性角角角角度度度度,审审审审核核核核数数数数据据据据是是是
4、是否否否否符符符符合合合合逻逻逻逻辑辑辑辑,内内内内容容容容是是是是否否否否合理,各项目或数字之间有无相互矛盾的现象合理,各项目或数字之间有无相互矛盾的现象合理,各项目或数字之间有无相互矛盾的现象合理,各项目或数字之间有无相互矛盾的现象n n主要用于对分类和顺序据的审核主要用于对分类和顺序据的审核主要用于对分类和顺序据的审核主要用于对分类和顺序据的审核2.2.计算检查计算检查n n检检检检查查查查调调调调查查查查表表表表中中中中的的的的各各各各项项项项数数数数据据据据在在在在计计计计算算算算结结结结果果果果和和和和计计计计算算算算方方方方法法法法上有无错误上有无错误上有无错误上有无错误n n主
5、要用于对数值型数据的审核主要用于对数值型数据的审核主要用于对数值型数据的审核主要用于对数值型数据的审核3-8数据的审核数据的审核二手数据二手数据(second hand data)(second hand data)1.适用性审核适用性审核n n弄弄弄弄清清清清楚楚楚楚数数数数据据据据的的的的来来来来源源源源、数数数数据据据据的的的的口口口口径径径径以以以以及及及及有有有有关关关关的的的的背景材料背景材料背景材料背景材料n n确定数据是否符合自己分析研究的需要确定数据是否符合自己分析研究的需要确定数据是否符合自己分析研究的需要确定数据是否符合自己分析研究的需要2.时效性审核时效性审核n n尽可
6、能使用最新的数据尽可能使用最新的数据尽可能使用最新的数据尽可能使用最新的数据3.确认是否必要做进一步的加工整理确认是否必要做进一步的加工整理3-9数据筛选数据筛选(data filter)1.当当数数据据中中的的错错误误不不能能予予以以纠纠正正,或或者者有有些些数数据据不不符符合合调调查查的的要要求求而而又又无无法法弥弥补补时时,需要对数据进行筛选需要对数据进行筛选2.数据筛选的内容包括数据筛选的内容包括将将将将某某某某些些些些不不不不符符符符合合合合要要要要求求求求的的的的数数数数据据据据或或或或有有有有明明明明显显显显错错错错误误误误的的的的数数数数据予以剔除据予以剔除据予以剔除据予以剔除
7、将将将将符符符符合合合合某某某某种种种种特特特特定定定定条条条条件件件件的的的的数数数数据据据据筛筛筛筛选选选选出出出出来来来来,而而而而不不不不符合特定条件的数据予以剔符合特定条件的数据予以剔符合特定条件的数据予以剔符合特定条件的数据予以剔3-10用用SPSS进行数据筛选进行数据筛选 8 8名学生的考试成绩数据名学生的考试成绩数据名学生的考试成绩数据名学生的考试成绩数据 数据筛选数据筛选(data filter)3-11数据排序数据排序(data rank)1.按按一一定定顺顺序序将将数数据据排排列列,以以发发现现一一些些明明显显的特征或趋势,找到解决问题的线索的特征或趋势,找到解决问题的线
8、索2.排排序序有有助助于于对对数数据据检检查查纠纠错错,以以及及为为重重新新归类或分组等提供依据归类或分组等提供依据3.在在某某些些场场合合,排排序序本本身身就就是是分分析析的的目目的的之之一一4.排序可借助于计算机完成排序可借助于计算机完成3-12数据排序数据排序(方法方法)1.1.分类数据的排序分类数据的排序字字字字母母母母型型型型数数数数据据据据,排排排排序序序序有有有有升升升升序序序序降降降降序序序序之之之之分分分分,但但但但习习习习惯惯惯惯上上上上用升序用升序用升序用升序汉汉汉汉字字字字型型型型数数数数据据据据,可可可可按按按按汉汉汉汉字字字字的的的的首首首首位位位位拼拼拼拼音音音音
9、字字字字母母母母排排排排列列列列,也也也也可可可可按按按按笔笔笔笔画画画画排排排排序序序序,其其其其中中中中也也也也有有有有笔笔笔笔画画画画多多多多少少少少的的的的升升升升序序序序降降降降序之分序之分序之分序之分2.2.数值型数据的排序数值型数据的排序n n递递递递增增增增排排排排序序序序:设设设设一一一一组组组组数数数数据据据据为为为为x x x x1 1 1 1,x x x x2 2 2 2,x x x xn n n n,递递递递增增增增排序后可表示为:排序后可表示为:排序后可表示为:排序后可表示为:x x x x(1)(1)(1)(1)x x x x(2)2)2)2)x x x x(2)
10、(2)(2)(2)x x x x(n)(n)(n)(n)3-133.2 3.2 分布数列分布数列一、分布数列的概念和种类一、分布数列的概念和种类二、品质数列的整理和显示二、品质数列的整理和显示三、变量数列的整理和显示三、变量数列的整理和显示四、频数分布的类型四、频数分布的类型3-14分布数列的概念分布数列的概念在统计分组的基础上,将总体的所有在统计分组的基础上,将总体的所有单位按组归类整理,并按一定顺序排单位按组归类整理,并按一定顺序排列,形成总体中各个单位在各组简的列,形成总体中各个单位在各组简的分布,又称次数分配或分布数列。分布,又称次数分配或分布数列。n n频数频数(frequency)
11、frequency):又叫次数,又叫次数,又叫次数,又叫次数,落在各落在各类别中的数据(单位)个数,类别中的数据(单位)个数,记作记作记作记作 Fi。n n频率频率(ratio)ratio):又叫比率,各组次数又叫比率,各组次数又叫比率,各组次数又叫比率,各组次数(频数)与总次数(频数)之比。(频数)与总次数(频数)之比。(频数)与总次数(频数)之比。(频数)与总次数(频数)之比。3-15分布数列的概念分布数列的概念频率分布的性质:频率分布的性质:频率分布的性质:频率分布的性质:=110111NiNiiiNiiiFFFF3-16分布数列的种类分布数列的种类 品质分布数列(属性分布数列)品质分布
12、数列(属性分布数列)品质分布数列(属性分布数列)品质分布数列(属性分布数列):按品质标志分组形成的分配:按品质标志分组形成的分配:按品质标志分组形成的分配:按品质标志分组形成的分配数列。数列。数列。数列。变量分布数列(变量分布数列)变量分布数列(变量分布数列)变量分布数列(变量分布数列)变量分布数列(变量分布数列):按数量标志分组形成的分配:按数量标志分组形成的分配:按数量标志分组形成的分配:按数量标志分组形成的分配数列。数列。数列。数列。n n单项数列:总体按单项式分组而单项数列:总体按单项式分组而单项数列:总体按单项式分组而单项数列:总体按单项式分组而形成的变量数列,每个变量值是形成的变量
13、数列,每个变量值是形成的变量数列,每个变量值是形成的变量数列,每个变量值是一个组,顺序排列。一个组,顺序排列。一个组,顺序排列。一个组,顺序排列。n n组距数列:总体按组距式分组而组距数列:总体按组距式分组而组距数列:总体按组距式分组而组距数列:总体按组距式分组而形成的变量数列,每个组是由若形成的变量数列,每个组是由若形成的变量数列,每个组是由若形成的变量数列,每个组是由若干个变量值形成的区间表示。干个变量值形成的区间表示。干个变量值形成的区间表示。干个变量值形成的区间表示。分配数列分配数列品质数列品质数列变量数列变量数列单项数列单项数列组距数列组距数列3-17一、品质分布数列的整理与显示一、
14、品质分布数列的整理与显示1.1.分类数据的整理分类数据的整理2.2.顺序数据的整理顺序数据的整理3-18品质分布数列的整理品质分布数列的整理1.1.列出各类别列出各类别2.2.计算各类别的频数计算各类别的频数3.3.制作频数分布表制作频数分布表4.4.用图形显示数据用图形显示数据分类分类频数频数比例比例百分比百分比比率比率ABCDE3-19分类数据整理分类数据整理频数分布表频数分布表(例题分析例题分析)【例例例例】一一一一家家家家市市市市场场场场调调调调查查查查公公公公司司司司为为为为研研研研究究究究不不不不同同同同品品品品牌牌牌牌饮饮饮饮料料料料的的的的市市市市场场场场占占占占有有有有率率率
15、率,对对对对随随随随机机机机抽抽抽抽取取取取的的的的一一一一家家家家超超超超市市市市进进进进行行行行了了了了调调调调查查查查。调调调调查查查查员员员员在在在在某某某某天天天天对对对对50505050名名名名顾顾顾顾客客客客购购购购买买买买饮饮饮饮料料料料的的的的品品品品牌牌牌牌进进进进行行行行了了了了记记记记录录录录,如如如如果果果果一一一一个个个个顾顾顾顾客客客客购购购购买买买买某某某某一一一一品品品品牌牌牌牌的的的的饮饮饮饮料料料料,就就就就将将将将这这这这一一一一饮饮饮饮料料料料的的的的品品品品牌牌牌牌名名名名字字字字记记记记录录录录一一一一次次次次 。右右右右边边边边就是就是就是就是记
16、录记录记录记录的原始数据的原始数据的原始数据的原始数据用用SPSS制作频数分布表制作频数分布表3-20分类数据的图示分类数据的图示条形图条形图(bar Chart)1.用用宽宽度度相相同同的的条条形形的的高高度度或或长长短短来来表表示示各类别数据的图形各类别数据的图形2.有单式条形图、复式条形图等形式有单式条形图、复式条形图等形式3.主要用于反映分类数据的频数分布主要用于反映分类数据的频数分布4.绘绘制制时时,各各类类别别可可以以放放在在纵纵轴轴,称称为为条条形图,也可以放在横轴,称为柱形形图,也可以放在横轴,称为柱形图图3-21分类数据的图示分类数据的图示条形图条形图(例题分析例题分析)3-
17、22分类数据的图示分类数据的图示饼图饼图(pie Chart)1.1.也也称称圆圆形形图图,是是用用圆圆形形及及园园内内扇扇形形的的面面积积来表示数值大小的图形来表示数值大小的图形2.2.主主要要用用于于表表示示总总体体或或样样本本中中各各组组成成部部分分所所占的比例,对于研究结构性问题十分有用占的比例,对于研究结构性问题十分有用3.3.绘绘制制圆圆形形图图时时,总总体体中中各各部部分分所所占占的的百百分分比比用用园园内内的的各各个个扇扇形形面面积积表表示示,这这些些扇扇形形的的中中心心角角度度,是是按按各各部部分分数数据据百百分分比比占占3603600 0的相应比例确定的的相应比例确定的3-
18、23分类数据的图示分类数据的图示饼图饼图(例题分析例题分析)3-24顺序数据的整理顺序数据的整理1.1.累累积积频频数数(cumulative cumulative frequenciesfrequencies):各各类类别频数的逐级累加别频数的逐级累加2.2.累累积积频频率率(cumulative cumulative percentagespercentages):各各类类别频率别频率(百分比百分比)的逐级累加的逐级累加3-25顺序数据的频数分布表顺序数据的频数分布表(例题分析例题分析)【例例例例】在在在在一一一一项项项项城城城城市市市市住住住住房房房房问问问问题题题题的的的的研研研研究究
19、究究中中中中,研研研研究究究究人人人人员员员员在在在在甲甲甲甲乙乙乙乙两两两两个个个个城城城城市市市市各各各各抽抽抽抽样样样样调调调调查查查查300300300300户户户户,其其其其中中中中的的的的一一一一个个个个问问问问题题题题是是是是:“您您您您对对对对您您您您家家家家庭庭庭庭目目目目前前前前的的的的住住住住房房房房状状状状况是否满意?况是否满意?况是否满意?况是否满意?1 1 1 1非非非非常常常常不不不不满满满满意意意意;2 2 2 2不不不不满满满满意意意意;3 3 3 3一一一一般般般般;4 4 4 4满满满满意意意意;5 5 5 5非常满意。非常满意。非常满意。非常满意。甲城市
20、家庭对住房状况评价的频数分布甲城市家庭对住房状况评价的频数分布甲城市家庭对住房状况评价的频数分布甲城市家庭对住房状况评价的频数分布回答类别回答类别甲甲城市城市户数户数(户户)百分比百分比(%)累累 计计户数户数(户户)百分比百分比(%)非常不满意非常不满意 不满意不满意 一般一般 满意满意 非常满意非常满意24108934530836311510241322252703008.044.075.090.0100.0合计合计300100.03-26顺序数据的频数分布表顺序数据的频数分布表(例题分析例题分析)乙城市家庭对住房状况评价的频数分布乙城市家庭对住房状况评价的频数分布乙城市家庭对住房状况评价
21、的频数分布乙城市家庭对住房状况评价的频数分布回答类别回答类别乙城市乙城市户数户数(户户)百分比百分比(%)累累 计计户数户数(户户)百分比百分比(%)非常不满意非常不满意 不满意不满意 一般一般 满意满意 非常满意非常满意21997864387.033.026.021.312.7211201982623007.040.066.087.3100.0合计合计300100.03-27顺序数据的图示顺序数据的图示累计频数分布图累计频数分布图(例题分析例题分析)甲城市家庭对住房状况评价的累积频数分布甲城市家庭对住房状况评价的累积频数分布甲城市家庭对住房状况评价的累积频数分布甲城市家庭对住房状况评价的累积
22、频数分布3-28环形图环形图(annular chart)1.1.环环形形图图中中间间有有一一个个“空空洞洞”,总总体体中中的的每每一一部分数据用环中的一段表示部分数据用环中的一段表示2.2.环形图与圆形图类似,但又有区别环形图与圆形图类似,但又有区别n n圆形图只能显示一个总体各部分所占的比例圆形图只能显示一个总体各部分所占的比例圆形图只能显示一个总体各部分所占的比例圆形图只能显示一个总体各部分所占的比例n n环环环环形形形形图图图图则则则则可可可可以以以以同同同同时时时时绘绘绘绘制制制制多多多多个个个个总总总总体体体体的的的的数数数数据据据据系系系系列列列列,每一个总体的数据系列为一个环每
23、一个总体的数据系列为一个环每一个总体的数据系列为一个环每一个总体的数据系列为一个环3.3.环形图可用于结构比较研究环形图可用于结构比较研究 4.4.环形图主要用于展示分类和顺序数据环形图主要用于展示分类和顺序数据3-29环形图环形图(例题分析例题分析)8%36%31%15%7%33%26%21%13%10%非常不满意 不满意 一般 满意 非常满意 甲乙两城市家庭对住房状况的评价甲乙两城市家庭对住房状况的评价3-30二、变量数列(数值型数据)的整理与显示二、变量数列(数值型数据)的整理与显示1.数据分组数据分组2.累计频数分布累计频数分布3.数值型数据的图示数值型数据的图示3-31数据分组数据分
24、组3-32分组方法分组方法等距分组等距分组异距分组异距分组3-33单变量值分组单变量值分组(要点要点)1.1.将一个变量值作为一组将一个变量值作为一组2.2.适合于离散变量适合于离散变量3.3.适合于变量值较少的情况适合于变量值较少的情况3-34组距分组组距分组(要点要点)1.将变量值的一个区间作为一组将变量值的一个区间作为一组2.适合于连续变量适合于连续变量3.适合于变量值较多的情况适合于变量值较多的情况4.需要遵循需要遵循“不重不漏不重不漏”的原则的原则5.可可采采用用等等距距分分组组,也也可可采采用用不不等距分组等距分组3-35等距分组等距分组(步骤步骤)2.2.2.2.确确确确定定定定
25、组组组组数数数数:组组组组数数数数的的的的确确确确定定定定应应应应以以以以能能能能够够够够显显显显示示示示数数数数据据据据的的的的分分分分布布布布特特特特征征征征和和和和规规规规律律律律为为为为目目目目的的的的。在在在在实实实实际际际际分分分分组组组组时时时时,可可可可以以以以按按按按 SturgesSturgesSturgesSturges 提提提提出的经验公式来确定组数出的经验公式来确定组数出的经验公式来确定组数出的经验公式来确定组数K K K K3.3.3.3.确确确确定定定定组组组组距距距距:组组组组距距距距(Class(Class(Class(Class Width)Width)Wi
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 贾俊平统计学第三章 数据的整理与显示 贾俊平 统计学 第三 数据 整理 显示
限制150内