第三章数据分布特征的测度.ppt
《第三章数据分布特征的测度.ppt》由会员分享,可在线阅读,更多相关《第三章数据分布特征的测度.ppt(82页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、统计学教学课件 西安工业大学经济管理学院第三章第三章 数据分布特数据分布特征的测度征的测度本章主要内容本章主要内容数据集中趋势的测度指标及其计算方法数据集中趋势的测度指标及其计算方法数据离散趋势的测度指标及其计算方法数据离散趋势的测度指标及其计算方法总体分布的偏度与峰度的测度总体分布的偏度与峰度的测度 数据分布的特征数据分布的特征集中趋势集中趋势集中趋势集中趋势 (位置位置位置位置)离中趋势离中趋势离中趋势离中趋势 (分散程度分散程度分散程度分散程度)偏态和峰度偏态和峰度偏态和峰度偏态和峰度(形状)(形状)(形状)(形状)数据分布的特征和测度数据分布的特征和测度数据的特征和测度数据的特征和测度
2、分布的形状分布的形状集中趋势集中趋势离散程度离散程度众众众 数数数中位数中位数中位数中位数中位数中位数均均均均均均 值值值值值值离散系数离散系数离散系数离散系数离散系数离散系数方差和标准差方差和标准差方差和标准差方差和标准差方差和标准差方差和标准差峰峰峰峰峰峰 度度度度度度四分位差四分位差四分位差四分位差四分位差四分位差异众比率异众比率异众比率异众比率异众比率异众比率偏偏偏偏偏偏 态态态态态态章节安排章节安排第一节第一节 集中趋势的测度集中趋势的测度 第二节第二节 离散程度的测度离散程度的测度第三节第三节 偏态与峰度的测度偏态与峰度的测度3.1 集中趋势的测度集中趋势的测度一一.定类数据:众数
3、定类数据:众数二二.定序数据:中位数和分位数定序数据:中位数和分位数三三.定距和定比数据:平均数定距和定比数据:平均数四四.众数、中位数和平均数的比较众数、中位数和平均数的比较数据特征分布的测度数据特征分布的测度(本节位置)数据的特征和测度数据的特征和测度分布的形状分布的形状集中趋势集中趋势离散程度离散程度众众众众众众 数数数数数数中位数中位数中位数中位数中位数中位数平均数平均数平均数平均数平均数平均数离散系数离散系数离散系数离散系数离散系数离散系数方差和标准差方差和标准差方差和标准差方差和标准差方差和标准差方差和标准差峰峰峰峰峰峰 度度度度度度四分位差四分位差四分位差四分位差四分位差四分位差
4、异众比率异众比率异众比率异众比率异众比率异众比率偏偏偏偏偏偏 态态态态态态集中趋势集中趋势(Central tendency)(要点)(要点)1.1.一组数据向其中心值靠拢的倾向和程度一组数据向其中心值靠拢的倾向和程度一组数据向其中心值靠拢的倾向和程度一组数据向其中心值靠拢的倾向和程度2.2.测度集中趋势就是寻找数据一般水平的代表值或中心值测度集中趋势就是寻找数据一般水平的代表值或中心值测度集中趋势就是寻找数据一般水平的代表值或中心值测度集中趋势就是寻找数据一般水平的代表值或中心值3.3.不同类型的数据用不同的集中趋势测度值不同类型的数据用不同的集中趋势测度值不同类型的数据用不同的集中趋势测度
5、值不同类型的数据用不同的集中趋势测度值4.4.低层次数据的集中趋势测度值适用于高层次的测量数据,低层次数据的集中趋势测度值适用于高层次的测量数据,低层次数据的集中趋势测度值适用于高层次的测量数据,低层次数据的集中趋势测度值适用于高层次的测量数据,反过来,高层次数据的集中趋势测度值并不适用于低层反过来,高层次数据的集中趋势测度值并不适用于低层反过来,高层次数据的集中趋势测度值并不适用于低层反过来,高层次数据的集中趋势测度值并不适用于低层次的测量数据次的测量数据次的测量数据次的测量数据5.5.选用哪一个测度值来反映数据的集中趋势,要根据所掌选用哪一个测度值来反映数据的集中趋势,要根据所掌选用哪一个
6、测度值来反映数据的集中趋势,要根据所掌选用哪一个测度值来反映数据的集中趋势,要根据所掌握的数据的类型来确定握的数据的类型来确定握的数据的类型来确定握的数据的类型来确定3.1.1 集中趋势测度集中趋势测度众数【概念要点】1.1.1.1.集中趋势的测度值之一集中趋势的测度值之一2.2.2.2.出现次数最多的标志值或变量值出现次数最多的标志值或变量值3.3.3.3.不受极端值的影响不受极端值的影响4.4.4.4.可能没有众数或有几个众数可能没有众数或有几个众数5.5.5.5.主要用于定类数据,也可用于定序数主要用于定类数据,也可用于定序数据和数值型数据据和数值型数据众数(众数的不唯一性)1.1.无众
7、数无众数原始数据:10 5 9 12 6 82.一个众数一个众数原始数据:6 5 9 8 5 5 3.多于一个众数多于一个众数 原始数据:25 28 28 36 42 42一、定类数据的众数一、定类数据的众数(算例算例)表表3-1 某城市居民关注广告类型的频数分布某城市居民关注广告类型的频数分布 广告类型广告类型人数人数(人人)比例比例频率频率(%)商品广告商品广告 服务广告服务广告 金融广告金融广告 房地产广告房地产广告 招生招聘广告招生招聘广告 其他广告其他广告112519161020.5600.2550.0450.0800.0500.01056.025.54.58.05.01.0合计合计
8、2001100【例例例例】根据表根据表根据表根据表3-13-1中的数据,计算众数中的数据,计算众数中的数据,计算众数中的数据,计算众数解解解解:这这这这里里里里的的的的标标标标志志志志为为为为“广广广广告告告告类类类类型型型型”,这这这这是是是是个个个个品品品品质质质质标标标标志志志志,不不不不同同同同类类类类型型型型的的的的广广广广告告告告就就就就是是是是标标标标志志志志值值值值。我我我我们们们们看看看看到到到到,在在在在所所所所调调调调查查查查的的的的200200人人人人当当当当中中中中,关关关关注注注注商商商商品品品品广广广广告告告告的的的的人人人人数数数数最最最最多多多多,为为为为11
9、2112人人人人,占占占占总总总总被被被被调调调调查查查查人人人人数数数数的的的的56%56%,因因因因此此此此众众众众数数数数为为为为“商商商商品品品品广广广广告告告告”这这这这一一一一类类类类别别别别,即即即即 MMo o商品广告商品广告商品广告商品广告二、定序数据的众数二、定序数据的众数(算例算例)【例例例例】根据表根据表根据表根据表3-23-2中的数据,计算众数中的数据,计算众数中的数据,计算众数中的数据,计算众数解解解解:这这这这里里里里的的的的数数数数据据据据为为为为定定定定序序序序数数数数据据据据。标标标标志志志志为为为为“回回回回答答答答类类类类别别别别”。甲甲甲甲城城城城市市
10、市市中中中中对对对对住住住住房房房房表表表表示示示示不不不不满满满满意意意意的的的的户户户户数数数数最最最最多多多多,为为为为108108户户户户,因因因因此此此此众众众众数数数数为为为为“不不不不满满满满意意意意”这一类别,即这一类别,即这一类别,即这一类别,即 MMo o不满意不满意不满意不满意表表3-2 甲城市家庭对住房状况评价的频数分布甲城市家庭对住房状况评价的频数分布回答类别回答类别甲城市甲城市户数户数 (户户)百分比百分比 (%)非常不满意非常不满意 不满意不满意 一般一般 满意满意 非常满意非常满意24108934530836311510合计合计300100.0三、数值型分组数据
11、的众数三、数值型分组数据的众数(要点及计算公式要点及计算公式)1.1.众数的值与相邻两组频数的分布有关众数的值与相邻两组频数的分布有关众数的值与相邻两组频数的分布有关众数的值与相邻两组频数的分布有关4.4.4.4.该公式假定众数组的频数在众数组内均匀分布该公式假定众数组的频数在众数组内均匀分布该公式假定众数组的频数在众数组内均匀分布该公式假定众数组的频数在众数组内均匀分布2.2.2.2.2.2.相邻两组的频数相等时,众数组的组中值相邻两组的频数相等时,众数组的组中值相邻两组的频数相等时,众数组的组中值相邻两组的频数相等时,众数组的组中值相邻两组的频数相等时,众数组的组中值相邻两组的频数相等时,
12、众数组的组中值即为众数即为众数即为众数即为众数即为众数即为众数M MMooo3.3.3.3.相邻两组的频数不相等时,众数采用下相邻两组的频数不相等时,众数采用下相邻两组的频数不相等时,众数采用下相邻两组的频数不相等时,众数采用下列近似公式计算列近似公式计算列近似公式计算列近似公式计算M MMoooM MMooo数值型分组数据的众数数值型分组数据的众数(算例算例)表表3-3 某车间某车间50名工人日加工零件数分组表名工人日加工零件数分组表按零件数分组按零件数分组频数(人)频数(人)累积频数累积频数10511011011511512012012512513013013513514035814106
13、4381630404650合计合计50【例例例例】根根根根据据据据表表表表3-33-3中中中中的的的的 数数数数 据据据据,计计计计 算算算算 5050名名名名工工工工 人人人人 日日日日 加加加加工工工工 零零零零 件件件件 数数数数的众数。的众数。的众数。的众数。3.1.2 集中趋势测度集中趋势测度中位数和分中位数和分位数位数3.1.2.1 中位数(概念要点)1.1.1.1.集中趋势的测度值之一集中趋势的测度值之一集中趋势的测度值之一集中趋势的测度值之一2.2.2.2.排序后处于中间位置上的标志值或变量值排序后处于中间位置上的标志值或变量值排序后处于中间位置上的标志值或变量值排序后处于中间
14、位置上的标志值或变量值MMe e50%50%3.3.不受极端值的影响不受极端值的影响不受极端值的影响不受极端值的影响4.4.主要用于定序数据,也可用数值型数据,但不能用主要用于定序数据,也可用数值型数据,但不能用主要用于定序数据,也可用数值型数据,但不能用主要用于定序数据,也可用数值型数据,但不能用于定类数据于定类数据于定类数据于定类数据5.5.各变量值与中位数的离差绝对值之和最小,即各变量值与中位数的离差绝对值之和最小,即各变量值与中位数的离差绝对值之和最小,即各变量值与中位数的离差绝对值之和最小,即中位数(位置的确定)未分组数据:未分组数据:组距分组数据:组距分组数据:未分组数据的中位数(
15、计算公式)一、定序数据的中位数一、定序数据的中位数(算例算例)【例例例例】根根根根据据据据表表表表3-23-2中中中中的的的的数数数数据据据据,计计计计算算算算甲甲甲甲城城城城市市市市家家家家庭庭庭庭对对对对住住住住房房房房满满满满意意意意状状状状况评价的中位数。况评价的中位数。况评价的中位数。况评价的中位数。解:中位数的位置为:解:中位数的位置为:解:中位数的位置为:解:中位数的位置为:300/2300/2150150从从从从累累累累计计计计频频频频数数数数看看看看,中中中中位位位位数数数数的的的的位位位位置置置置在在在在“一一一一般般般般”这一组别中。因此这一组别中。因此这一组别中。因此这
16、一组别中。因此 MMe e一般一般一般一般表表3-2 甲城市家庭对住房状况评价的频数分布甲城市家庭对住房状况评价的频数分布回答类别回答类别甲城市甲城市户数户数 (户户)累计频数累计频数 非常不满意非常不满意 不满意不满意 一般一般 满意满意 非常满意非常满意2410893453024132225270300合计合计300二、数值型未分组数据的中位数二、数值型未分组数据的中位数(5个数据的算例个数据的算例)bb原始数据原始数据:24 22 21 26 20bb排排 序序:20 21 22 24 26bb位位 置置:1 2 3 3 4 5中位数中位数 22数值型未分组数据的中位数数值型未分组数据的
17、中位数(6个数据的算例个数据的算例)bb原始数据原始数据:10 5 9 12 6 8bb排排 序序:5 6 8 9 10 12bb位位 置置:1 2 3 3 4 4 5 6位置位置N+126+123.5中位数中位数 8+928.51.1.1.1.根据位置公式确定中位数所在的组根据位置公式确定中位数所在的组2.2.2.2.采用下列近似公式计算:采用下列近似公式计算:3.3.该公式假定中位数组的频数在该组内均匀该公式假定中位数组的频数在该组内均匀分布分布三、数值型分组数据的中位数三、数值型分组数据的中位数(要点及计算公式要点及计算公式)数值型分组数据的中位数数值型分组数据的中位数(算例算例)表表3
18、-3 某车间某车间50名工人日加工零件数分组表名工人日加工零件数分组表按零件数分组按零件数分组频数(人)频数(人)累积频数累积频数105110110115115120120125125130130135135140358141064381630404650合计合计50【例例例例】根根根根据据据据表表表表3-53-5中中中中的的的的 数数数数 据据据据,计计计计算算算算50 50 名名名名工工工工 人人人人 日日日日 加加加加工工工工 零零零零 件件件件 数数数数的中位数的中位数的中位数的中位数3.1.2.2 四分位数四分位数(概念要点概念要点)1.1.集中趋势的测度值之一集中趋势的测度值之一2
19、.2.排序后处于排序后处于25%25%和和75%75%位置上的值位置上的值QQL LQQMMQQU U25%25%25%25%3.不受极端值的影响不受极端值的影响4.主主要要用用于于定定序序数数据据,也也可可用用于于数数值值型型数数据据,但不能用于定类数据但不能用于定类数据四分位数四分位数(位置的确定位置的确定)未分组数据:未分组数据:下四分位数下四分位数下四分位数下四分位数(QQL L)位置位置位置位置 =N+N+1 14 4上四分位数上四分位数上四分位数上四分位数(QQU U)位置位置位置位置 =3(3(N+N+1)1)4 4组距分组数据:组距分组数据:下四分位数下四分位数下四分位数下四分
20、位数(QQL L)位置位置位置位置 =N N4 4上四分位数上四分位数上四分位数上四分位数(QQL L)位置位置位置位置 =3N3N4 4一、定序数据的四分位数一、定序数据的四分位数(算例算例)【例例例例】根根根根据据据据表表表表3-23-2中中中中的的的的数数数数据据据据,计计计计算算算算甲甲甲甲城城城城市市市市家家家家庭庭庭庭对对对对住住住住房房房房满满满满意意意意状状状状况评价的四分位数。况评价的四分位数。况评价的四分位数。况评价的四分位数。表表3-2 甲城市家庭对住房状况评价的频数甲城市家庭对住房状况评价的频数分布分布回答类别回答类别甲城市甲城市户数户数 (户户)累计频数累计频数 非非
21、常常不不满满意意 不满意不满意 一般一般 满意满意 非常满意非常满意2410893453024132225270300合计合计300解:下四分位数解:下四分位数解:下四分位数解:下四分位数(Q QL L)的位置为:的位置为:的位置为:的位置为:Q QL L位置位置位置位置(300)/4(300)/47575 上四分位数上四分位数上四分位数上四分位数(Q QL L)的位置为:的位置为:的位置为:的位置为:Q QUU位置位置位置位置(3300)/4(3300)/4225225从从从从累累累累计计计计频频频频数数数数看看看看,Q QL L在在在在“不不不不满满满满意意意意”这这这这一一一一组组组组别
22、别别别中中中中;Q QUU在在在在“一一一一般般般般”这一组别中。因此这一组别中。因此这一组别中。因此这一组别中。因此 Q QL L 不满意不满意不满意不满意 Q QUU 一般一般一般一般二、数值型未分组数据的四分位数二、数值型未分组数据的四分位数(7个数据的算例个数据的算例)bb原始数据原始数据:23 21 30 32 28 25 26bb排排 序序:21 23 25 26 28 30 32bb位位 置置:1 2 3 4 5 6 7 7+7+1 1QQL L位置位置位置位置 =4 4=4 4=2=2QQU U位置位置位置位置 =3(3(N+N+1)1)4 43(73(7+1)1)4 4 =6
23、=6QL=23QU=30N+1N+1数值型未分组数据的四分位数数值型未分组数据的四分位数(6个数据的算例个数据的算例)原始数据原始数据:23 21 30 28 25 26排排 序序:21 23 25 26 28 30位位 置置:1 2 3 4 5 6QQL L=21+0.75(23-21)=21+0.75(23-21)=22.522.5QQL L位置位置位置位置 =N+N+1 14 4=6+6+1 14 4=1.75=1.75QQU U位置位置位置位置 =3(3(N+N+1)1)4 43(63(6+1)1)4 4=5.25=5.25QQU U=28+0.25(30-28)=28+0.25(30
24、-28)=28.528.5三、数值型分组数据的四分位数三、数值型分组数据的四分位数(计算公式计算公式)下四分位数下四分位数下四分位数下四分位数下四分位数下四分位数:上四分位数上四分位数上四分位数上四分位数上四分位数上四分位数:UUU-1UUifS3NLQ-+4&数值型分组数据的四分位数数值型分组数据的四分位数(计算示例计算示例)表表3-3 某车间某车间50名工人日加工零件数分组表名工人日加工零件数分组表按零件数分组按零件数分组频数(人)频数(人)累积频数累积频数105110110115115120120125125130130135135140358141064381630404650合计合计
25、50【例例例例】根根根根据据据据表表表表3-33-3中中中中的的的的数数数数据据据据,计计计计算算算算50 50 名名名名工工工工人人人人日日日日加加加加工工工工零零零零件件件件数数数数的的的的四分位数。四分位数。四分位数。四分位数。Q Q Q QL L L L位置位置位置位置50/450/450/450/412.512.512.512.5Q Q Q QU U U U位置位置位置位置350/4350/4350/4350/437.537.537.537.53.1.3 集中趋势测度集中趋势测度平均数 (概念要点)1.集中趋势的测度值之一集中趋势的测度值之一2.2.最常用的测度值最常用的测度值3.3
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 第三 数据 分布 特征 测度
限制150内