《数据分布特征的描述调整课件.ppt》由会员分享,可在线阅读,更多相关《数据分布特征的描述调整课件.ppt(79页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、数据分布特征的描述调整第1页,此课件共79页哦数据分布特征的测度数据特征的测度数据特征的测度分布的形状分布的形状集中趋势集中趋势离散程度离散程度众众众众 数数数数中位数中位数中位数中位数中位数中位数均均均均均均 值值值值值值离散系数离散系数离散系数离散系数离散系数离散系数方差和标准差方差和标准差方差和标准差方差和标准差方差和标准差方差和标准差峰峰峰峰峰峰 态态态态态态四分位差四分位差四分位差四分位差四分位差四分位差异众比率异众比率异众比率异众比率异众比率异众比率偏偏偏偏偏偏 态态态态态态第2页,此课件共79页哦第一第一节集中集中趋势的的测度度 指一组数据向其中心值靠拢的倾指一组数据向其中心值靠
2、拢的倾向和程度。向和程度。集中趋势集中趋势又称平均数,是反又称平均数,是反又称平均数,是反又称平均数,是反映社会经济现象总映社会经济现象总映社会经济现象总映社会经济现象总体各单位某一数量体各单位某一数量体各单位某一数量体各单位某一数量标志在一定时间、标志在一定时间、标志在一定时间、标志在一定时间、地点和条地点和条地点和条地点和条件下所达件下所达件下所达件下所达到的一般水平的综合到的一般水平的综合到的一般水平的综合到的一般水平的综合指标。指标。指标。指标。平平均均数数数值平均数数值平均数位置平均数位置平均数算术平均数算术平均数调和平均数调和平均数几何平均数几何平均数中位数中位数众数众数第3页,此
3、课件共79页哦某系某系83名女生身高名女生身高资料(按序排列)料(按序排列)位置平均数的概念位置平均数的概念 身高身高 人数人数(CM)(人)(人)152 1 154 2 155 2 156 4 157 1 158 2 159 2 160 12 161 7 162 8 163 4 身高身高 人数人数(CM)(人)(人)164 3 165 8 166 5 167 3 168 7 169 1 170 5 171 2 172 3 174 1总计 83 152 154 154 155 155 156 156 156 156 157 158 158 159 159 160 160 160 160 160
4、 160 160 160 160 160 160 160 161 161 161 161 161 161 161 162 162 162 162 162 162 162 162 163 163 163 163 164 164 164 165 165 165 165 165 165 165 165 166 166 166 166 166 167 167 167 168 168 168 168 168 168 168 169 170 170 170 170 170 171 171 172 172 172 174将将变量量值按按顺序排列起来,序排列起来,当反映分布集中当反映分布集中趋势的度量的度量值
5、仅仅由数列中某个位置的由数列中某个位置的值来确定来确定时,这个个值称称为位置平均数。位置平均数。位置平均数与数位置平均数与数值平均数的基平均数的基本区本区别在于其不需要依据每一个在于其不需要依据每一个变量量值来来计算。算。第4页,此课件共79页哦指总体中出现次数最多的变量值,用指总体中出现次数最多的变量值,用 表示表示,它不受极端数值的影响,用来说它不受极端数值的影响,用来说明总体中大多数单位所达到的一般水明总体中大多数单位所达到的一般水平。平。众数众数位置平均数位置平均数第5页,此课件共79页哦0 1 2 3 4 5 6 7 8 9 10 11 12 13 2009 Mode=9Not Af
6、fected by Extreme Values 不受极端值的影响不受极端值的影响There May Not be a Mode 一组数据可能没有众数一组数据可能没有众数There May be Several Modes 也可能有多个众数也可能有多个众数众数的性众数的性质Mode=90 1 2 3 4 5 6 7 8 9 10 11 12 13 14 第6页,此课件共79页哦众数(不唯一性)无众数无众数 原始数据:10 5 9 12 6 8一个众数一个众数一个众数一个众数原始数据原始数据:6 :6 5 9 8 5 55 5多于一个众数多于一个众数 原始数据原始数据:25 :25 28 282
7、8 28 36 42 42第7页,此课件共79页哦众数的确定方法众数的确定方法某年某年级83名女生身高名女生身高资料料 身高身高 人数人数(CM)(人)(人)152 1 154 2 155 2 156 4 157 1 158 2 159 2 160 12 161 7 162 8 163 4 身高身高 人数人数(CM)(人)(人)164 3 165 8 166 5 167 3 168 7 169 1 170 5 171 2 172 3 174 1总计 83 第8页,此课件共79页哦日产量(件)日产量(件)工人人数(人)工人人数(人)101112131470100380150100合计合计800【
8、例例A A】已知已知某企业某日工人的日产量资料如下某企业某日工人的日产量资料如下:众数的确定众数的确定(单值数列)(单值数列)计算该企业该日全部工人日产量的众数。计算该企业该日全部工人日产量的众数。第9页,此课件共79页哦众数的确定众数的确定(组距数列)(组距数列)【例例B B】某车间某车间5050名工人月产量的资料如下:名工人月产量的资料如下:月产量(件)月产量(件)工人人数(人)工人人数(人)向上累计次数向上累计次数(人)(人)200以下以下200400400600600以上以上373283104250合计合计50计算该车间工人月产量的众数。计算该车间工人月产量的众数。第10页,此课件共7
9、9页哦众数的确定众数的确定(组距数列)(组距数列)【例例B B】某车间某车间5050名工人月产量的资料如下:名工人月产量的资料如下:月产量(件)月产量(件)工人人数(人)工人人数(人)向上累计次数向上累计次数(人)(人)200以下以下200400400600600以上以上373283104250合计合计50计算该车间工人月产量的众数。计算该车间工人月产量的众数。第11页,此课件共79页哦定类数据的众数(例题分析)不同品牌饮料的频数分布不同品牌饮料的频数分布 饮料品牌饮料品牌频数频数比例比例百分比百分比(%)可口可乐可口可乐 旭日升冰茶旭日升冰茶 百事可乐百事可乐 汇源果汁汇源果汁 露露露露15
10、119690.300.220.180.120.183022181218合计合计501100解解解解:这这里里的的变变量量为为“饮饮料料品品牌牌”,这这是是个个定定类类变变量量,不不同同类类型的饮料就是变量值型的饮料就是变量值 在在所所调调查查的的5050人人中中,购购买买可可口口可可乐乐的的人人数数最最多多,为为1515人人,占占总总被被调调查查人人数数的的30%30%,因因此此众众数数为为“可可口口可可乐乐”这这一一品牌,即品牌,即 MMo o可口可乐可口可乐可口可乐可口可乐第12页,此课件共79页哦定序数据的众数(例题分析)解解解解:这这里里的的数数据据为为定定序序数数据据。变变量量为为“
11、回回答答类类别别”甲甲城城市市中中对对住住房房表表示示不不满满意意的的户户数数最最多多,为为108108户户,因因此此众众数数为为“不不满满意意”这这一一类类别别,即即 MMo o不满意不满意不满意不满意甲城市家庭对住房状况评价的频数分布甲城市家庭对住房状况评价的频数分布回答类别回答类别甲城市甲城市户数户数 (户户)百分比百分比 (%)非常不满意非常不满意 不满意不满意 一般一般 满意满意 非常满意非常满意24108934530836311510合计合计300100.0第13页,此课件共79页哦将总体各单位标志值按大小顺序排列后,将总体各单位标志值按大小顺序排列后,指处于数列中间位置的标志值,
12、用指处于数列中间位置的标志值,用 表表示示中位数中位数不受极端数不受极端数值的影响的影响,在,在总体体标志志值差异很大差异很大时,具有,具有较强的代表性。的代表性。中位数的性质:中位数的性质:位置平均数位置平均数0 1 2 3 4 5 6 7 8 9 100 1 2 3 4 5 6 7 8 9 10 12 100 Median=5Median=5MMe e50%50%第14页,此课件共79页哦中位数的位次为:中位数的位次为:即第即第3个单位的标志值就是中位数个单位的标志值就是中位数【例例A A】某售货小组某售货小组5 5个人,某天的销售额按个人,某天的销售额按从小到大的顺序排列为从小到大的顺序
13、排列为440440元、元、480480元、元、520520元、元、600600元、元、750750元,则元,则中位数的确定中位数的确定(未分组资料)(未分组资料)第15页,此课件共79页哦中位数的位次为中位数的位次为中位数应为第中位数应为第3和第和第4个单位标志值的算术平均个单位标志值的算术平均数,即数,即【例例B B】若上述售货小组为若上述售货小组为6 6个人,某天的销个人,某天的销售额按从小到大的顺序排列为售额按从小到大的顺序排列为440440元、元、480480元、元、520520元、元、600600元、元、750750元、元、760760元,则元,则中位数的确定中位数的确定(未分组资料
14、)(未分组资料)第16页,此课件共79页哦【例例C C】某企业某日工人的日产量资料如下:某企业某日工人的日产量资料如下:日产量(件)日产量(件)工人人数(人)工人人数(人)向上累计次数向上累计次数(人)(人)10111213147010038015010070170550700800合计合计800计算该企业该日全部工人日产量的中位数。计算该企业该日全部工人日产量的中位数。中位数的位次:中位数的位次:中位数的确定中位数的确定(单值数列)(单值数列)第17页,此课件共79页哦中位数的确定中位数的确定(组距数列)(组距数列)【例例D D】某车间某车间5050名工人月产量的资料如下:名工人月产量的资料
15、如下:月产量(件)月产量(件)工人人数(人)工人人数(人)由底向高累计次数由底向高累计次数(人)(人)200以下以下200400400600600以上以上373283104250合计合计50计算该车间工人月产量的中位数。计算该车间工人月产量的中位数。第18页,此课件共79页哦中位数的确定中位数的确定(组距数列)(组距数列)【例例D D】某车间某车间5050名工人月产量的资料如下:名工人月产量的资料如下:月产量(件)月产量(件)工人人数(人)工人人数(人)由高向低累计次数由高向低累计次数(人)(人)200以下以下200400400600600以上以上373285047408合计合计50计算该车间
16、工人月产量的中位数。计算该车间工人月产量的中位数。第19页,此课件共79页哦中位数的确定中位数的确定(组距数列)(组距数列)共共 个单位个单位共共 个单位个单位共共 个单位个单位共共 个单位个单位LU中位数组中位数组中位数组中位数组组距为组距为d共共 个单位个单位假定该组内的单假定该组内的单假定该组内的单假定该组内的单位呈均匀分布位呈均匀分布位呈均匀分布位呈均匀分布共有单位数共有单位数 中位数下限公式为中位数下限公式为 该段长度应为该段长度应为 第20页,此课件共79页哦定序数据的中位数(例题分析)解解解解:中中 位位 数数 的的 位位 置置 为为 300/2300/2150150 从从累累计
17、计频频数数看看,中中位位数数在在“一一般般”这这一一组组别中。因此别中。因此 MMe e=一般一般甲城市家庭对住房状况评价的频数分布甲城市家庭对住房状况评价的频数分布回答类别回答类别甲城市甲城市户数户数 (户户)累计频数累计频数 非常不满意非常不满意 不满意不满意 一般一般 满意满意 非常满意非常满意2410893453024132225270300合计合计300第21页,此课件共79页哦数值平均数数值平均数第22页,此课件共79页哦基本形式:基本形式:例:例:直直接接承承担担者者算术平均数算术平均数第23页,此课件共79页哦A.简单算术平均数简单算术平均数 适用于适用于总体体资料未料未经分分
18、组整理、尚整理、尚为原始原始资料料的情况的情况式中:式中:为算算术平均数平均数;为总体体单位位总数;数;为第第i 个个单位的位的标志志值。算术平均数的计算方法算术平均数的计算方法第24页,此课件共79页哦平均每人日平均每人日销售售额为:算术平均数的计算方法算术平均数的计算方法某售某售货小小组5个人,某天的个人,某天的销售售额分分别为520元、元、600元、元、480元、元、750元、元、440元,元,则【例例】第25页,此课件共79页哦B.加权算术平均数加权算术平均数适用于适用于总体体资料料经过分分组整理形成整理形成变量数列的量数列的情况情况式中:式中:为算算术平均数平均数;为第第组的次数;的
19、次数;为组数;数;为第第 组的的标志志值或或组中中值。算术平均数的计算方法算术平均数的计算方法第26页,此课件共79页哦【例例】某企业某日工人的日产量资料如下:某企业某日工人的日产量资料如下:日产量(件)日产量(件)工人人数(人)工人人数(人)101112131470100380150100合计合计800计算该企业该日全部工人的平均日产量。计算该企业该日全部工人的平均日产量。算术平均数的计算方法算术平均数的计算方法第27页,此课件共79页哦解:解:算术平均数的计算方法算术平均数的计算方法若上述若上述资料料为组距数列,距数列,则应取各取各组的的组中中值作作为该组的代表的代表值用于用于计算;此算;
20、此时求求得的算得的算术平均数只是其真平均数只是其真值的的近似近似值。说说明明第28页,此课件共79页哦已改至此!已改至此!某电脑公司销售量数据分组表某电脑公司销售量数据分组表按销售量分组按销售量分组组中值组中值(Mi)频数频数(fi)Mi fi 14015015016016017017018018019019020020021021022022023023024014515516517518519520521522523549162720171084558013952640472537003315205017209001175合计合计12022200加权均值加权均值(例题分析例题分析)第29页
21、,此课件共79页哦表表现为次数、次数、频数、数、单位数;即位数;即公式公式中的中的表表现为频率、比重;即公式率、比重;即公式中的中的算术平均数的计算方法算术平均数的计算方法指指变量数列中各量数列中各组标志志值出出现的次的次数,是数,是变量量值的承担者,反映了各的承担者,反映了各组的的标志志值对平均数的影响程度平均数的影响程度权数权数绝对权数绝对权数相对权数相对权数第30页,此课件共79页哦权数与加数与加权234567819算算术平均数的平均数的计算取决于算取决于变量量值和和权数的共同作用:数的共同作用:变量量值决定平均数的范决定平均数的范围;权数数则决定平均数的位置决定平均数的位置第31页,此
22、课件共79页哦变量量值与其算与其算术平均数的离差之和平均数的离差之和衡等于零,即:衡等于零,即:变量值与其算术平均数的离差平方变量值与其算术平均数的离差平方和为最小,即:和为最小,即:算术平均数的主要数学性质算术平均数的主要数学性质第32页,此课件共79页哦离差的概念离差的概念12345678-1-1-213第33页,此课件共79页哦【例例】设设X=(2,4,6,8),则其调和平均数),则其调和平均数可由定义计算如下:可由定义计算如下:再求算术平均数:再求算术平均数:求各标志值的倒数求各标志值的倒数:,再求倒数:再求倒数:是是总体各体各单位位标志志值倒数的算倒数的算术平均数平均数的倒数,又叫的
23、倒数,又叫倒数平均数倒数平均数调和平均数调和平均数第34页,此课件共79页哦A.简单调和平均数简单调和平均数适用于适用于总体体资料未料未经分分组整理、尚整理、尚为原始原始资料的情料的情况况式中:式中:为调和平均数和平均数;为变量量值 的的个数;个数;为第第个个变量量值。调和平均数的计算方法调和平均数的计算方法第35页,此课件共79页哦B.加权调和平均数加权调和平均数适用于适用于总体体资料料经过分分组整理形成整理形成变量数列的情况量数列的情况式中:式中:为第第 组的的变量量值;为第第组的的标志志总量。量。调和平均数的计算方法调和平均数的计算方法第36页,此课件共79页哦日产量(件)日产量(件)日
24、产量(件)日产量(件)各组工人日总产量(件)各组工人日总产量(件)各组工人日总产量(件)各组工人日总产量(件)1010111112121313141470070011001100456045601950195014001400合计合计合计合计97109710【例例】某企业某日工人的日产量资料如下:某企业某日工人的日产量资料如下:计算该企业该日全部工人的平均日产量。计算该企业该日全部工人的平均日产量。调和平均数的应用调和平均数的应用第37页,此课件共79页哦即该企业该日全部工人的平均日产量为即该企业该日全部工人的平均日产量为12.1375件。件。调和平均数的应用调和平均数的应用解解第38页,此课
25、件共79页哦x、f 为已知已知若只知若只知 x 和和xf,而,而f 未未知,知,则不能使用加不能使用加权算算术平均方式,只能使用其平均方式,只能使用其变形即加形即加权调和和平均方式平均方式。苹果苹果 单价价 购买量量 总金金额 品种品种 (元)(公斤)(元)(公斤)(元)(元)红富士富士 2 3 6青香蕉青香蕉 1.8 5 9 第39页,此课件共79页哦是是N项变量值连乘积的开项变量值连乘积的开N次方根。次方根。几何平均数几何平均数用于用于计算算现象的平均比率或平均速度象的平均比率或平均速度应用:应用:q各个比率或速度的各个比率或速度的连乘乘积等于等于总比率或比率或总速度;速度;q相乘的各个比
26、率或速度不相乘的各个比率或速度不为零或零或负值。应用的前提条件:应用的前提条件:第40页,此课件共79页哦q各个比率或速度的各个比率或速度的连乘乘积等于等于总比率或比率或总速度速度;例子:某企例子:某企业2003年盈利率比上年年盈利率比上年提高提高5,2004年同比又提高了年同比又提高了15,那,那么么这两年盈利率平均提高了多少?两年盈利率平均提高了多少?注意:是注意:是5乘以乘以15吗?先将增量先将增量变换为完全量,即将完全量,即将5和和15变换为105和和115,而后再用几何平均法。,而后再用几何平均法。第41页,此课件共79页哦A.简单几何平均数简单几何平均数适用于适用于总体体资料未料未
27、经分分组整整理尚理尚为原始原始资料的情况料的情况式中:式中:为几何平均数几何平均数;为变量量值的个的个数;数;为第第 个个变量量值。几何平均数的计算方法几何平均数的计算方法第42页,此课件共79页哦【例例】某流水生产线有前后衔接的五道工序。某某流水生产线有前后衔接的五道工序。某日各工序产品的合格率分别为日各工序产品的合格率分别为9595、9292、9090、8585、8080,求整个流水生产线产品的平均合格率。,求整个流水生产线产品的平均合格率。分析:分析:设最初投产设最初投产100A个单位个单位,则,则第一道工序的合格品为第一道工序的合格品为100A0.95;第二道工序的合格品为第二道工序的
28、合格品为(100A0.95)0.92;第五道工序的合格品为第五道工序的合格品为(100A0.950.920.900.85)0.80;第43页,此课件共79页哦因该流水线的最终合格品即为第五道工序的合因该流水线的最终合格品即为第五道工序的合格品,格品,故该流水线总的合格品应为故该流水线总的合格品应为 100A0.950.920.900.850.80;则该流水线产品总的合格率为:则该流水线产品总的合格率为:即即该流水线总的合格率等于各工序合格率的该流水线总的合格率等于各工序合格率的连乘积,符合几何平均数的适用条件,故需连乘积,符合几何平均数的适用条件,故需采用几何平均法计算采用几何平均法计算。第4
29、4页,此课件共79页哦因该流水线的最终合格品即为第五道工序的合因该流水线的最终合格品即为第五道工序的合格品,格品,故该流水线总的合格品应为故该流水线总的合格品应为 100A0.950.920.900.850.80;则该流水线产品总的合格率为:则该流水线产品总的合格率为:即即该流水线总的合格率等于各工序合格率的该流水线总的合格率等于各工序合格率的连乘积,符合几何平均数的适用条件,故需连乘积,符合几何平均数的适用条件,故需采用几何平均法计算采用几何平均法计算。解:解:第45页,此课件共79页哦B.加权几何平均数加权几何平均数适用于适用于总体体资料料经过分分组整理整理形成形成变量数列的情况量数列的情
30、况式中:式中:为几何平均数几何平均数;为第第 组的次数;的次数;为组数;数;为第第 组的的标志志值或或组中中值。几何平均数的计算方法几何平均数的计算方法第46页,此课件共79页哦【例例】某金融机构以复利计息。近某金融机构以复利计息。近12年来的年利年来的年利率有率有4年为年为3,2年为年为5,2年为年为8,3年为年为10,1年为年为15。求平均年利率。求平均年利率。设本金为设本金为V,则至各年末的本利和应为:,则至各年末的本利和应为:第第1年末的本利和为:年末的本利和为:第第2年末的本利和为:年末的本利和为:第第12年末的本利和为:年末的本利和为:分析:分析:第第2年的年的计息基础计息基础第第
31、12年的年的计息基础计息基础第47页,此课件共79页哦则该笔本金则该笔本金12年总的本利率为:年总的本利率为:即即即即1212年总本利率等于各年本利率的连乘积年总本利率等于各年本利率的连乘积年总本利率等于各年本利率的连乘积年总本利率等于各年本利率的连乘积,符合几何,符合几何,符合几何,符合几何平均数的适用条件,故计算平均年本利率应采用几何平均平均数的适用条件,故计算平均年本利率应采用几何平均平均数的适用条件,故计算平均年本利率应采用几何平均平均数的适用条件,故计算平均年本利率应采用几何平均法。法。法。法。解:解:第48页,此课件共79页哦几何平均数的计算方法几何平均数的计算方法思思考考若上若上
32、题中不是按复利而是按中不是按复利而是按单利利计息息,且各年的利率与上相同,且各年的利率与上相同,求平均年利率。求平均年利率。分分析析第第1年末的应得利息为年末的应得利息为:第第2年末的应得利息为年末的应得利息为:第第12年末的应得利息为:年末的应得利息为:设本金为设本金为V,则各年末应得利息为:,则各年末应得利息为:第49页,此课件共79页哦则该笔本金则该笔本金12年应得的利息总和为:年应得的利息总和为:=V(0.034+0.052+0.151)这里的利息率或本利率不再符合几何平均数这里的利息率或本利率不再符合几何平均数的适用条件,需按照求解比值的平均数的方法计的适用条件,需按照求解比值的平均
33、数的方法计算。因为算。因为假定本假定本金为金为V 第50页,此课件共79页哦所以,应采用加权算术平均数公式计算平均年所以,应采用加权算术平均数公式计算平均年利息率,即:利息率,即:解:解:(比较:按复利计息时的平均年利率为(比较:按复利计息时的平均年利率为6.85)第51页,此课件共79页哦是否为比率是否为比率或速度或速度各个比率或速各个比率或速度的连乘积是否等于总比度的连乘积是否等于总比率或总速度率或总速度是否为是否为其他比值其他比值是是是是否否否否否否否否是是是是否否否否是是是是 几何平均法几何平均法算术平均法算术平均法求解比值的平均数的方法求解比值的平均数的方法数值平均数计算公数值平均数
34、计算公数值平均数计算公数值平均数计算公式的选用顺序式的选用顺序式的选用顺序式的选用顺序指标指标第52页,此课件共79页哦众数、中位数和均众数、中位数和均值的比的比较一、众数、中位数和均一、众数、中位数和均值位置上的关系位置上的关系左偏分布左偏分布左偏分布左偏分布左偏分布左偏分布均值均值均值均值均值均值 中位数中位数中位数中位数中位数中位数 众数众数众数众数众数众数对称分布对称分布对称分布对称分布对称分布对称分布 均值均值均值均值均值均值=中位数中位数中位数中位数中位数中位数=众数众数众数众数众数众数右偏分布右偏分布右偏分布右偏分布右偏分布右偏分布众数众数众数众数众数众数 中位数中位数中位数中位
35、数中位数中位数均值均值均值均值均值均值第53页,此课件共79页哦众数、中位数和均众数、中位数和均值的比的比较二、众数、中位数和均二、众数、中位数和均值数数值上的关系上的关系 众数与中位数的差约为算术平均与中位数的差的两倍。例:根据某城市住户家庭收入的抽样调查资料计算得到众数为1040元,中位数为1128.57元,问算术平均约为多少?其分布呈何形态?(对称、左偏、右偏)第54页,此课件共79页哦二、众数、中位数和均二、众数、中位数和均值的特点和的特点和应用用众数众数不受极端不受极端值影响影响具有不唯一性具有不唯一性数据分布偏斜程度数据分布偏斜程度较大大时应用用中位数中位数不受极端不受极端值影响影
36、响数据分布偏斜程度数据分布偏斜程度较大大时应用用均均值易受极端易受极端值影响影响数学性数学性质优良良数据数据对称分布或接近称分布或接近对称分布称分布时应用用第55页,此课件共79页哦第二第二节离散离散趋势的的测度度 标志变异指标标志变异指标统计上用来反映总体各单位标志值统计上用来反映总体各单位标志值之间差异程度大小的综合指标,也之间差异程度大小的综合指标,也称做称做标志变动度标志变动度。平均指平均指标是一个代表性数是一个代表性数值,它反映,它反映总体各体各单位某一数量位某一数量标志的一般水平,而把志的一般水平,而把总体各体各单位之位之间的差异抽象化了。但的差异抽象化了。但总体体各各单位之位之间
37、的差异是客的差异是客观存在的,存在的,这种差异也是种差异也是统计总体的重体的重要特征之一。因此,要全面反映一个要特征之一。因此,要全面反映一个总体的特征,体的特征,还必必须测定定总体各体各单位之位之间差异程度差异程度。作用作用1、衡量平均指标、衡量平均指标代表性代表性的大小的大小2、反映社会经济活动过程的、反映社会经济活动过程的均衡性均衡性和和稳定性稳定性第56页,此课件共79页哦集中集中趋势弱、弱、离散离散趋势强集中集中趋势强、离散离散趋势弱弱第57页,此课件共79页哦指所研究的数据中,最大指所研究的数据中,最大值与与最小最小值之差,又称之差,又称极差极差。全距全距最大最大变量量值或最或最高
38、高组上限或开口上限或开口组假定上限假定上限最小最小变量量值或最或最低低组下限或开口下限或开口组假定下限假定下限【例例A】某售某售货小小组5人某天的人某天的销售售额分分别为440元、元、480元、元、520元、元、600元、元、750元,元,则标志变异指标的种类标志变异指标的种类第58页,此课件共79页哦【例例B】某季度某工某季度某工业公司公司18个工个工业企企业产值计划完成情况如下:划完成情况如下:计划完成程度计划完成程度计划完成程度计划完成程度()组中值组中值组中值组中值()企业数企业数企业数企业数(个)(个)(个)(个)计划产值计划产值计划产值计划产值(万元)(万元)(万元)(万元)909
39、0以下以下以下以下9090100100100100110110110110以上以上以上以上858595951051051151152 23 310103 380080025002500172001720044004400合计合计合计合计18182490024900计算该公司该季度计划完成程度的全距。计算该公司该季度计划完成程度的全距。标志变异指标的种类标志变异指标的种类第59页,此课件共79页哦q优点点:计算算方法方法简单、易懂;、易懂;q缺点缺点:易受极端数易受极端数值的影响,不能全的影响,不能全面反映所有面反映所有标志志值差异大小及分布状差异大小及分布状况,准确程度差况,准确程度差往往往往
40、应用于生用于生产过程的程的质量控制中量控制中全距的特点全距的特点标志变异指标的种类标志变异指标的种类第60页,此课件共79页哦上四分位数与下四分位数之差QD=QU QL四分位差四分位差标志变异指标的种类标志变异指标的种类四分位差的特点四分位差的特点1、反映了中、反映了中间50%数据的离散程度数据的离散程度2、不受极端、不受极端值的影响的影响第61页,此课件共79页哦 简单平均差简单平均差适用于未分组资料适用于未分组资料是各个数据与其算是各个数据与其算术平均数的离差平均数的离差绝对值的算的算术平均数,用平均数,用A.D 表示表示平均差平均差计算公式:计算公式:总体算术总体算术平均数平均数总体单总
41、体单位总数位总数第第 个单位个单位的变量值的变量值标志变异指标的种类标志变异指标的种类第62页,此课件共79页哦【例例A】某售货小组某售货小组5个人,某天的销售额分别为个人,某天的销售额分别为440元、元、480元、元、520元、元、600元、元、750元,求该售元,求该售货小组销售额的平均差。货小组销售额的平均差。解:解:即该售货小组即该售货小组5个人销售额的平均差为个人销售额的平均差为93.6元元标志变异指标的种类标志变异指标的种类第63页,此课件共79页哦 加权平均差加权平均差适用于分组资料适用于分组资料平均差的计算公式平均差的计算公式总体算术总体算术平均数平均数第第 组变量值组变量值出
42、现的次数出现的次数第第 组的变量组的变量值或组中值值或组中值第64页,此课件共79页哦【例例B】计算下表中某公司职工月工资的平均差计算下表中某公司职工月工资的平均差月工资(元)月工资(元)组中值(元)组中值(元)职工人数(人)职工人数(人)300以下以下300400400500500600600700700800800900900以上以上2503504505506507508509502083143824563052377820合计合计2000第65页,此课件共79页哦解:解:即该公司职工月工资的平均差为即该公司职工月工资的平均差为138.95元元第66页,此课件共79页哦q优点点:不易受极端
43、数不易受极端数值的影响,能的影响,能综合反合反映全部映全部单位位标志志值的的实际差异程度;差异程度;q缺点缺点:用用绝对值的形式消除各的形式消除各标志志值与算与算术平均数离差的正平均数离差的正负值问题,不便于作数,不便于作数学学处理和参与理和参与统计分析运算。分析运算。平均差的特点平均差的特点一般情况下都是通一般情况下都是通过计算另一种算另一种标志志变异指异指标标准差,来反映准差,来反映总体内体内部各部各单位位标志志值的差异状况的差异状况第67页,此课件共79页哦方差和标准差(variance and standard deviation)1.数据离散程度的最常用测度值2.反映了各变量值与均值
44、的平均差异3.根据总体数据计算的,称为总体方差或标准差;根据样本数据计算的,称为样本方差或标准差4 6 8 10 12x=8.3第68页,此课件共79页哦样本方差自由度(degree of freedom)1.1.一一组数据中可以自由取数据中可以自由取值的数据的个数的数据的个数2.2.当当样本本数数据据的的个个数数为 n 时,若若样本本均均值 x 确确定定后后,只只有有n-1个数据可以自由取个数据可以自由取值,其中必有一个数据,其中必有一个数据则不能自由取不能自由取值3.3.例例如如,样本本有有3个个数数值,即即x1=2,x2=4,x3=9,则 x=5。当当 x=5 确确定定后后,x1,x2和
45、和x3有有两两个个数数据据可可以以自自由由取取值,另另一一个个则不不能能自自由由取取值,比比如如x1=6,x2=7,那那么么x3则必必然然取取2,而不能取其他,而不能取其他值样本本方方差差用用自自由由度度去去除除,其其原原因因可可从从多多方方面面来来解解释,从从实际应用用角角度度看看,在在抽抽样估估计中中,当当用用样本本方方差差s2去去估估计总体方差体方差2时,s2是是2的无偏估的无偏估计量量第69页,此课件共79页哦由同一资料计算的标准差的结果一般要略大于平均差。由同一资料计算的标准差的结果一般要略大于平均差。证明:当证明:当a,b,c0时,有时,有 标准差的特点标准差的特点q不易受极端数不
46、易受极端数值的影响,能的影响,能综合反映全合反映全部部单位位标志志值的的实际差异程度;差异程度;q用平方的方法消除各用平方的方法消除各标志志值与算与算术平均数平均数离差的正离差的正负值问题,可方便地用于数学,可方便地用于数学处理和理和统计分析运算分析运算.第70页,此课件共79页哦身高的差异水平:身高的差异水平:cmcm体重的差异水平:体重的差异水平:kgkg用用变异系数变异系数可以相互比较可以相互比较可可比比第71页,此课件共79页哦平均差系数平均差系数标准差系数标准差系数变异系数变异系数用来用来对比不同水平的同比不同水平的同类现象,特象,特别是是不同不同类现象象总体平均数代表性的大小体平均
47、数代表性的大小:标准差系数小的准差系数小的总体,其平均数的体,其平均数的代表性大;反之,亦然。代表性大;反之,亦然。应用应用:各种变指标与其算术平均数之各种变指标与其算术平均数之比。一般用比。一般用V表示。表示。第72页,此课件共79页哦【例例】某年级一、二两班某门课的平均成绩分别为某年级一、二两班某门课的平均成绩分别为82分和分和76分,其成绩的标准差分别为分,其成绩的标准差分别为15.6分和分和14.8分,分,比较两班平均成绩代表性的大小。比较两班平均成绩代表性的大小。解:解:一班成绩的标准差系数为:一班成绩的标准差系数为:二班成绩的标准差系数为:二班成绩的标准差系数为:因为因为 ,所以一
48、班平均成绩的代,所以一班平均成绩的代表性比二班大。表性比二班大。第73页,此课件共79页哦非非对称的,称的,偏斜的分偏斜的分布布对称的、称的、高度适中高度适中的分布的分布既偏斜又既偏斜又低平的分低平的分布布第74页,此课件共79页哦第三第三节偏偏态与峰度与峰度 偏偏态指分布数列的不对称性。指分布数列的不对称性。非非对称的,称的,偏斜的分布偏斜的分布对称的、高度称的、高度适中的分布适中的分布既偏斜又低既偏斜又低平的分布平的分布第75页,此课件共79页哦偏度(偏度(skewness):度量数据):度量数据分布非分布非对称方向及程度的指称方向及程度的指标。SK第76页,此课件共79页哦统计学统计学第
49、二章第二章 统计数据统计数据动差法偏度的差法偏度的计算:算:一一阶中心矩衡中心矩衡为零,偶数零,偶数阶中心矩中心矩为正数,正数,奇数奇数阶中心矩可以反映分布偏度。中心矩可以反映分布偏度。三三阶中心矩有中心矩有计量量单位,不便于比位,不便于比较,故,故用具有相同用具有相同单位的位的 3相除,去掉相除,去掉单位位第77页,此课件共79页哦统计学统计学第二章第二章 统计数据统计数据峰度(峰度(qurtosis):描述数据分):描述数据分布峰布峰态的指的指标,也是度量数据分布,也是度量数据分布集中程度的指集中程度的指标。在正在正态分布情况下分布情况下:因此有:因此有:高峰高峰态低峰低峰态第78页,此课件共79页哦-4 -3 -2 -1 0 1 2 3 44kg2kg作用力作用力力臂力臂统计动差(矩):利用力的差(矩):利用力的动差来反映数据分布特征的指差来反映数据分布特征的指标。它。它以次数以次数 f 为作用力,以作用力,以变量量x 为力臂,力臂,并以并以总次数次数为单位位计算平均算平均动差。差。称称为随机随机变量量 x 对a 的的 k 阶矩(矩(动差)。差)。令令a,则称称为 k 阶原原点矩点矩 k令令a ,则称称为 k 阶中中心矩心矩 k常用的矩:常用的矩:第79页,此课件共79页哦
限制150内