统计学数据分布特征的描述幻灯片.ppt
《统计学数据分布特征的描述幻灯片.ppt》由会员分享,可在线阅读,更多相关《统计学数据分布特征的描述幻灯片.ppt(45页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、统计学数据分布特征的描述统计学数据分布特征的描述1第1页,共45页,编辑于2022年,星期二对单变量截面数据的特征描述,主要有四个方面:集中趋势、离散程度、偏态与峰度。各各各各类类类类代代代代表表表表性性性性的的的的数数数数量量量量特特特特征征征征值值值值代表值是多少代表值是多少代表值是多少代表值是多少代表性有多大代表性有多大代表性有多大代表性有多大代表性可靠吗代表性可靠吗代表性可靠吗代表性可靠吗集中趋势的度量集中趋势的度量集中趋势的度量集中趋势的度量离散趋势的度量离散趋势的度量离散趋势的度量离散趋势的度量分布特征的度量分布特征的度量分布特征的度量分布特征的度量平均指标平均指标平均指标平均指标
2、变异指标变异指标变异指标变异指标偏度峰度指标偏度峰度指标偏度峰度指标偏度峰度指标基本基本基本基本公式公式公式公式简单式简单式简单式简单式加权加权加权加权式式式式公式公式公式公式公式公式公式公式公式公式公式公式公式公式公式公式公式公式公式公式公式公式公式公式公式公式公式公式公式公式公式公式公式公式公式公式公式公式公式公式公式公式公式公式公式公式公式公式公式公式公式公式公式公式公式公式公式公式公式公式公式公式公式公式公式公式公式公式公式公式公式公式公式公式公式公式公式公式公式公式公式公式公式公式公式公式公式公式公式公式公式公式公式公式公式公式公式公式公式公式公式公式公式公式公式公式公式公式公式公式
3、公式公式公式公式公式公式公式公式公式公式公式公式公式公式公式公式公式公式公式公式公式公式公式公式公式公式公式公式公式公式公式公式公式公式算术平均数算术平均数算术平均数算术平均数调和平均数调和平均数调和平均数调和平均数几何平均数几何平均数几何平均数几何平均数中位数中位数中位数中位数众数众数众数众数极差极差极差极差平均差平均差平均差平均差标准差标准差标准差标准差离散系数离散系数离散系数离散系数原点矩原点矩原点矩原点矩中心距中心距中心距中心距N N N N阶矩阶矩阶矩阶矩第三章第三章第三章第三章 数据分布特征的描述数据分布特征的描述数据分布特征的描述数据分布特征的描述2第2页,共45页,编辑于202
4、2年,星期二第三章第三章第三章第三章 数据分布特征的描述数据分布特征的描述数据分布特征的描述数据分布特征的描述第一节第一节 统计变量集中趋势的测定统计变量集中趋势的测定第二节第二节 统计变量离散程度的测定统计变量离散程度的测定第三节第三节 变量分布的偏度与峰度变量分布的偏度与峰度第四节第四节 利用利用ExcelExcel计算描述统计指标计算描述统计指标3第3页,共45页,编辑于2022年,星期二第一节第一节第一节第一节 统计变量集中趋势的测定统计变量集中趋势的测定统计变量集中趋势的测定统计变量集中趋势的测定一一 测定集中趋势的指标及其作用测定集中趋势的指标及其作用二二 数值平均数数值平均数三三
5、 众数与中位数众数与中位数4第4页,共45页,编辑于2022年,星期二一、测定集中趋势的指标及其作用一、测定集中趋势的指标及其作用集中趋势集中趋势(Central tendency)较大和较小的观测值出现的频率比较低,大多数观测值密集分布在中心附近,较大和较小的观测值出现的频率比较低,大多数观测值密集分布在中心附近,使得全部数据呈现出向中心聚集或靠拢的态势。使得全部数据呈现出向中心聚集或靠拢的态势。测度集中趋势的指标有两大类:测度集中趋势的指标有两大类:数值平均数数值平均数是根据全部数据计算得到的代表值,主要有算术平均是根据全部数据计算得到的代表值,主要有算术平均数、调和平均数及几何平均数;数
6、、调和平均数及几何平均数;位置代表值位置代表值根据数据所处位置直接观察或根据与特定位置有关的根据数据所处位置直接观察或根据与特定位置有关的部分数据来确定的代表值,主要有众数和中位数。部分数据来确定的代表值,主要有众数和中位数。5第5页,共45页,编辑于2022年,星期二测定集中趋势指标的作用测定集中趋势指标的作用1反映变量分布的集中趋势和一般水平。反映变量分布的集中趋势和一般水平。如用平均工资了解职工工资分布的中心,反映职工工资如用平均工资了解职工工资分布的中心,反映职工工资的一般水平。的一般水平。2可用来比较同一现象在不同空间或不同阶段的发展水平。可用来比较同一现象在不同空间或不同阶段的发展
7、水平。不受总体规模大小的影响;不受总体规模大小的影响;在一定程度上使偶然因素的影响相互抵消。在一定程度上使偶然因素的影响相互抵消。3可用来分析现象之间的依存关系。可用来分析现象之间的依存关系。如研究劳动者的文化程度与收入的关系。如研究劳动者的文化程度与收入的关系。4平均指标也是统计推断中的一个重要统计量,是平均指标也是统计推断中的一个重要统计量,是进行统计推断的基础。进行统计推断的基础。年份年份人均可支配人均可支配收入收入人均消费人均消费性支出性支出19922.0271.67219932.5772.11119943.4962.85119954.2833.53819964.8393.919199
8、75.164.18619985.4254.33219995.8544.61620006.284.99820016.865.30920027.7036.0320038.4726.511合计合计62.97650.0736第6页,共45页,编辑于2022年,星期二二、数值平均数二、数值平均数(一)算术平均数(均值)(一)算术平均数(均值)一组数据的总和除以这组数据的项数所得的结果一组数据的总和除以这组数据的项数所得的结果;最常用的数值平均数。最常用的数值平均数。1简单算术平均数简单算术平均数把每项数据直接加总后除以它们的项数。把每项数据直接加总后除以它们的项数。通常用于对未分组的数据计算算术平均数。
9、通常用于对未分组的数据计算算术平均数。计算公式:计算公式:表表 3-13-1男性男性女性女性222222222222222225252525252525252525252525252525252525253030303030303030505030307第7页,共45页,编辑于2022年,星期二二、数值平均数二、数值平均数表表 3-23-2年龄年龄人数(人)人数(人)x xf f22224 42525101030305 550501 1合计合计2020表表 3-13-1男性男性女性女性2222222222222222252525252525252525252525252525252525252
10、53030303030303030505030302加权算术平均数加权算术平均数加权算术平均数的计算公式:加权算术平均数的计算公式:加权加权为了体现各变量值轻重不同的影响作为了体现各变量值轻重不同的影响作用,对各个变量值赋予不尽相同的权数(用,对各个变量值赋予不尽相同的权数(fi fi)。)。8第8页,共45页,编辑于2022年,星期二二、数值平均数二、数值平均数2加权算术平均数加权算术平均数加权算术平均数的计算公式:加权算术平均数的计算公式:权数(权数(fi,也称权重),也称权重)权数权数指在计算总体平均数或综合水平的过程中对各个数据起着权衡轻重指在计算总体平均数或综合水平的过程中对各个数据
11、起着权衡轻重作用的变量。可以是绝对数形式,也可以是比重形式(如频率)来表示。作用的变量。可以是绝对数形式,也可以是比重形式(如频率)来表示。事实上比重权数更能够直接表明权数的权衡轻重作用的实质。事实上比重权数更能够直接表明权数的权衡轻重作用的实质。9第9页,共45页,编辑于2022年,星期二二、数值平均数二、数值平均数产量产量(件(件/人)人)人数(人)人数(人)x xf fxfxf22224 488882525101025025030305 515015050501 15050合计合计20205385382加权算术平均数加权算术平均数权数的性质:权数的性质:加权加权为了体现各变量值轻重不同的
12、影响作用,对各个变量值赋为了体现各变量值轻重不同的影响作用,对各个变量值赋予不尽相同的权数(予不尽相同的权数(fi fi)表表 1 1表表 2 2表表 3 3产量产量(件(件/人)人)人数(人)人数(人)x xf fxfxf22221 1222225255 51251253030101030030050504 4200200合计合计2020647647产量产量(件(件/人)人)人数(人)人数(人)x xf fxfxf22225 511011025255 512512530305 515015050505 5250250合计合计2020635635大变量值组大权数,小变量值组小权数,则平均数就大
13、大变量值组大权数,小变量值组小权数,则平均数就大大变量值组小权数,小变量值组大权数,则平均数就小大变量值组小权数,小变量值组大权数,则平均数就小当权数完全相等(当权数完全相等(f f1=1=f f2=2=fnfn)时,)时,加权算术平均数就成了简单算术平均加权算术平均数就成了简单算术平均数。数。10第10页,共45页,编辑于2022年,星期二表表3 33 3 节能灯泡的使用寿命的分组数据节能灯泡的使用寿命的分组数据使用寿命使用寿命(小时)(小时)组中值组中值x数量数量fXf 频率频率f/fXf/f1000以下以下900218000.020 181000-12001100888000.080 8
14、81200-1400130016208000.160 2081400-1600150035525000.350 5251600-1800170023391000.230 3911800-2000190012228000.120 2282000以上以上2100484000.040 84合合 计计1001542001.000 15423由组距数列计算算术由组距数列计算算术平均数平均数u各组变量值用各组变量值用组中值来代表。组中值来代表。u假定条件是各组内假定条件是各组内数据呈均匀分布或数据呈均匀分布或对称分布。对称分布。u计算结果是近似计算结果是近似值。值。二、数值平均数二、数值平均数11第11页
15、,共45页,编辑于2022年,星期二表表 3-43-4企企 业业流通费用率()流通费用率()商品销售额(万元)商品销售额(万元)流通费用(万流通费用(万元)元)甲甲161600256256乙乙104750475475丙丙124000480480合合 计计11.7004811.700481035012114对相对数求算术平均数对相对数求算术平均数由于各个相对数的对比基础不同,采用简单算术平均通常不合理,需要加由于各个相对数的对比基础不同,采用简单算术平均通常不合理,需要加权。权。u权数的选择必须符权数的选择必须符合该相对数本身的计合该相对数本身的计算公式。算公式。u权数通常为该相对数权数通常为该
16、相对数的分母指标。的分母指标。二、数值平均数二、数值平均数12第12页,共45页,编辑于2022年,星期二5算术平均数的主要数学性质算术平均数的主要数学性质(1)算术平均数与变量值个数的乘积等于各个变量值的总和)算术平均数与变量值个数的乘积等于各个变量值的总和(2)各变量值与算术平均数的离差之总和等于零)各变量值与算术平均数的离差之总和等于零(3)各变量值与算术平均数离差平方之总和为最小)各变量值与算术平均数离差平方之总和为最小 二、数值平均数二、数值平均数13第13页,共45页,编辑于2022年,星期二二、数值平均数二、数值平均数产量产量(件(件/人)人)人数(人)人数(人)总产量总产量(件
17、)(件)x xf fxfxf22224 488882525101025025030305 515015050501 15050合计合计2020538538(二)调和平均数(二)调和平均数(Harmonic mean)对于已分组资料,当对于已分组资料,当已知各组单位总量已知各组单位总量f f,未知,未知各组标志总量各组标志总量m m时,采用加时,采用加权算术平均数。权算术平均数。表表 1 1表表 2 2产量产量(件(件/人)人)总产量总产量(件)(件)人数人数(人)(人)x xm mm/xm/x222288884 42525250250101030301501505 5505050501 1合计
18、合计5385382020商务统计中所应用的调和平均数通常是加商务统计中所应用的调和平均数通常是加权算术平均数的变形权算术平均数的变形 对于已分组资料,当已知对于已分组资料,当已知各组标志总量各组标志总量m m,未知各组单,未知各组单位总量位总量f f时,采用加权调和时,采用加权调和平均数。平均数。对于未分组资料,或虽对于未分组资料,或虽已分组但各组次数相同时,已分组但各组次数相同时,采用简单算术平均数。采用简单算术平均数。14第14页,共45页,编辑于2022年,星期二二、数值平均数二、数值平均数(二)调和平均数(二)调和平均数(Harmonic mean)调和平均数也称为倒数平均数。各变量值
19、的倒数(调和平均数也称为倒数平均数。各变量值的倒数(1/xi)的算术平均数的倒数。其计)的算术平均数的倒数。其计算公式为:算公式为:对于未分组资料,采用简单调和平对于未分组资料,采用简单调和平均数。均数。对于已分组资料,当已知各组标志总量对于已分组资料,当已知各组标志总量m m,未知各组单位总量,未知各组单位总量f f时,采用加权调和平均数。时,采用加权调和平均数。15第15页,共45页,编辑于2022年,星期二二、数值平均数二、数值平均数【例例】某企业产品的加工要顺次经过前后衔接的五道工序。本月该企业各加工工序的合格率分别为某企业产品的加工要顺次经过前后衔接的五道工序。本月该企业各加工工序的
20、合格率分别为8888、8585、9090、9292、9696,试求这五道工序的平均合格率。,试求这五道工序的平均合格率。本例中各工序的合格率具有环比的性质,企业产品的总合格率等于各工序合格率之连乘积。所以,本例中各工序的合格率具有环比的性质,企业产品的总合格率等于各工序合格率之连乘积。所以,所求的平均合格率应为:所求的平均合格率应为:(三)几何平均数(三)几何平均数(Geometric meanGeometric mean)16第16页,共45页,编辑于2022年,星期二(三)几何平均数(三)几何平均数(Geometric mean)几何平均数几何平均数 n个变量值连乘积的个变量值连乘积的n次
21、方根。次方根。简单几何平均数简单几何平均数加权几何平均数加权几何平均数适用于各个变量值之间存在连乘积关系的场合。适用于各个变量值之间存在连乘积关系的场合。主要用于计算现象的平均发展速度;主要用于计算现象的平均发展速度;也适用于对某些具有环比性质的比率求平均。也适用于对某些具有环比性质的比率求平均。二、数值平均数二、数值平均数17第17页,共45页,编辑于2022年,星期二数值平均数小结:数值平均数小结:二、数值平均数二、数值平均数简单式简单式简单式简单式加权式加权式加权式加权式算术算术算术算术平均数平均数平均数平均数调和调和调和调和平均数平均数平均数平均数几何几何几何几何平均数平均数平均数平均
22、数算术和的关算术和的关算术和的关算术和的关系系系系倒数和的关倒数和的关倒数和的关倒数和的关系系系系连乘积的关连乘积的关连乘积的关连乘积的关系系系系由未分组资料计算由未分组资料计算由未分组资料计算由未分组资料计算由已分组资料计算由已分组资料计算由已分组资料计算由已分组资料计算变量值的关变量值的关变量值的关变量值的关系系系系数值平均数数值平均数数值平均数数值平均数的计算的计算的计算的计算18第18页,共45页,编辑于2022年,星期二三、众数与中位数三、众数与中位数(一)众数(一)众数(Mode)众数是一组数据中出现频数最多、频率最高的变量值,常用众数是一组数据中出现频数最多、频率最高的变量值,常
23、用 Mo 表示。表示。如表如表3-2中年龄的众数值中年龄的众数值Mo25。众数代表的是最常见、最普遍的状况,是对现象集中趋势的度量。众数代表的是最常见、最普遍的状况,是对现象集中趋势的度量。可用来测度定性变量的集中趋势;可用来测度定性变量的集中趋势;销售量最大的产品颜色是销售量最大的产品颜色是“白色白色”,则有,则有Mo“白色白色”。可以度量定量变量的集中趋势。可以度量定量变量的集中趋势。从分布曲线的角度看,众数就是变量分布曲线的最高峰所对应的变量从分布曲线的角度看,众数就是变量分布曲线的最高峰所对应的变量值。值。19第19页,共45页,编辑于2022年,星期二组距数列中众数的确定组距数列中众
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 统计学 数据 分布 特征 描述 幻灯片
限制150内