数据分布特征测度.ppt
《数据分布特征测度.ppt》由会员分享,可在线阅读,更多相关《数据分布特征测度.ppt(27页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、数据分布特征测度现在学习的是第1页,共27页6.1.16.1.1数据分布特征测度数据分布特征测度的内容的内容6.1.1 6.1.1 数据分布特征测度概述数据分布特征测度概述1.分布特征识别:考察变量数列的分布特征与分布类型等。分布特征识别:考察变量数列的分布特征与分布类型等。2.集中趋势测度:有算均、调均、几均、中位数和众数等平均指标集中趋势测度:有算均、调均、几均、中位数和众数等平均指标3.离散趋势测度:有全距、方差与标准差、变异系数等变异指标。离散趋势测度:有全距、方差与标准差、变异系数等变异指标。4.偏度与峰度测定偏度与峰度测定:考察次数分布非对称程度和分布曲线尖峭程度。考察次数分布非对
2、称程度和分布曲线尖峭程度。6.1.2 数据分布特征测度的作用数据分布特征测度的作用1.1.认识作用。认识总体内部结构与分布特征、一般水平与差异程度认识作用。认识总体内部结构与分布特征、一般水平与差异程度.2.2.比较作用。通过集中趋势与离散趋势测度,可作横向和动态比较。比较作用。通过集中趋势与离散趋势测度,可作横向和动态比较。3.3.数量标准作用。在制定管理定额中,常以相应的平均数为基础。数量标准作用。在制定管理定额中,常以相应的平均数为基础。4.4.推断作用。样本平均数和样本标准差,是抽样推断的重要依据。推断作用。样本平均数和样本标准差,是抽样推断的重要依据。6.1.3 数据分布特征测度的原
3、则数据分布特征测度的原则 1.1.注意总体各单位的同质性。注意总体各单位的同质性。2.2.用组平均数补充总年均数。用组平均数补充总年均数。3.3.用次数分布补充总平均数。用次数分布补充总平均数。4.4.集中趋势与离散趋势测度相结合。集中趋势与离散趋势测度相结合。5.5.注意一般与个别相结合。注意一般与个别相结合。现在学习的是第2页,共27页6.2 6.2 次数分布的类型与识别次数分布的类型与识别 6.2.1 次数分布的类型次数分布的类型次数分布:变量的不同取值及其相应的频数所构成的分布数列次数分布:变量的不同取值及其相应的频数所构成的分布数列.频率分布:变量的不同取值及其相应的频率所构成的分布
4、数列频率分布:变量的不同取值及其相应的频率所构成的分布数列.次数分布或频率分布的主要类型有三种:次数分布或频率分布的主要类型有三种:1.1.钟形分布:钟形分布:“两头小,中间大两头小,中间大”为特征的次数分布或频率分布。曲线图犹如为特征的次数分布或频率分布。曲线图犹如一口古钟;故称钟形分布。一口古钟;故称钟形分布。钟形分布可分为对称分布、右偏分布和左偏分布三种类型钟形分布可分为对称分布、右偏分布和左偏分布三种类型.2.2.U U形分布:形分布:“两头大,中间小两头大,中间小”为特征的次数分布或频率分布。曲线图象为特征的次数分布或频率分布。曲线图象英文字母英文字母“U U”.3.J J 型分布:
5、有正型分布:有正J型分布和反型分布和反J型分布两种类型型分布两种类型现在学习的是第3页,共27页6.2.2 次数分布类型的识别次数分布类型的识别主要考察变量数列次数或频率分布的类型与分布特征主要考察变量数列次数或频率分布的类型与分布特征,描述总体或样本的结描述总体或样本的结构与分布。主要有图示识别法、位置测度法和偏度测定法等。构与分布。主要有图示识别法、位置测度法和偏度测定法等。图示识别法图示识别法:离散型数列宜采用直线图和条形图,连续型数列宜采用直方图、折离散型数列宜采用直线图和条形图,连续型数列宜采用直方图、折线图、平滑图。线图、平滑图。【例例6.1】现在学习的是第4页,共27页6.3 集
6、中趋势测度集中趋势测度 集中趋势是指变量数列中数据分布的中心值或一般集中趋势是指变量数列中数据分布的中心值或一般水平。集中趋势测度就是计算变量数列的平均数,而平水平。集中趋势测度就是计算变量数列的平均数,而平均数有算术平均数、调和平均数、几何平均数、中位数均数有算术平均数、调和平均数、几何平均数、中位数和众数等五种,前三种称为数值平均数,后两种称为位和众数等五种,前三种称为数值平均数,后两种称为位置平均数。置平均数。现在学习的是第5页,共27页6.3.1 6.3.1 算术平均数算术平均数基本算式基本算式:总体标志总量总体标志总量/总体单位总量总体单位总量【例例6.2】1.简单算术平均数简单算术
7、平均数:未分组资料未分组资料 平均数平均数=x/n【例例6.3】2.加权算术平均数加权算术平均数:分组资料求平均数分组资料求平均数计算加权算术平均数应注意两点:计算加权算术平均数应注意两点:(1)(1)权数权数绝对权数和绝对权数和比重权数之分比重权数之分.(2)(2)权数对平均数大小起权衡轻重的作用,比重权数更能反映权数权数对平均数大小起权衡轻重的作用,比重权数更能反映权数的实质。的实质。(3)(3)根据组距数列计算的平均数只是一个近似值。根据组距数列计算的平均数只是一个近似值。【例例6.4】【例例6.5】现在学习的是第6页,共27页3.算术平均数的数学性质算术平均数的数学性质现在学习的是第7
8、页,共27页5.总平均数与分段平均数总平均数与分段平均数以总平均数为临界点,可将数列划分为低于总平均数和高于总平均数的两部分,进而可以总平均数为临界点,可将数列划分为低于总平均数和高于总平均数的两部分,进而可计算低段计算低段n n1 1个数据的平均数和高段个数据的平均数和高段n n2 2个数据的平均数来概括数据分布的特征,分段个数据的平均数来概括数据分布的特征,分段平均数可补充说明总平均数的不足,亦可度量先进平均水平和落后平均水平,作平均数可补充说明总平均数的不足,亦可度量先进平均水平和落后平均水平,作为制订先进平均定额的依据为制订先进平均定额的依据.【例例6.6】6.6.几种特殊的算术平均数
9、几种特殊的算术平均数(1)等级平均数。通常把属性数列中的等级量化为等级平均数。通常把属性数列中的等级量化为1、2、3,用观察的次数作权数,用观察的次数作权数,用加权平均法计算平均等级来反映集中趋势。,用加权平均法计算平均等级来反映集中趋势。【例例6.7】(2)评分平均数。通常把人们对评价项目的评分值作为评分平均数。通常把人们对评价项目的评分值作为x x,把事先规定的项目重,把事先规定的项目重要程度作权数要程度作权数f f,计算评分平均数。,计算评分平均数。【例例6.8】(3)截尾平均数。由于算术平均数易受极端值的影响,有时为了消除少数特截尾平均数。由于算术平均数易受极端值的影响,有时为了消除少
10、数特别大或特别小的数值影响,而采用截尾平均数。如评级评奖项目的平均分值的计别大或特别小的数值影响,而采用截尾平均数。如评级评奖项目的平均分值的计算,可去掉一些最低分和最高分,再求平均分算,可去掉一些最低分和最高分,再求平均分.【例例6.9】现在学习的是第8页,共27页6.3.2 6.3.2 调和平均数调和平均数调和平均数是各个变量值倒数的算术平均数的倒数调和平均数是各个变量值倒数的算术平均数的倒数.有简单调均与加权调均有简单调均与加权调均两种,计算公式为:两种,计算公式为:调和平均数可避免算术平均数易受极端值的影响,但本意上的调和平均数应调和平均数可避免算术平均数易受极端值的影响,但本意上的调
11、和平均数应用很少,在实际工作中,常把调和平均数作为算术平均数的变形来使用。其变形形用很少,在实际工作中,常把调和平均数作为算术平均数的变形来使用。其变形形式为:式为:【例例6.10】【例例6.11】【例例6.12】现在学习的是第9页,共27页6.3.3 6.3.3 几何平均数几何平均数1.1.几均是数列中几均是数列中 n n 个变量值的连乘积的个变量值的连乘积的n n次方根次方根.适宜于求数列的平均比率或适宜于求数列的平均比率或平均速度。亦有简单几均与加权几均之分,计算公式为:平均速度。亦有简单几均与加权几均之分,计算公式为:计算时,应注意各变量值中不能有数值为零或为负数的数出现。计算时,应注
12、意各变量值中不能有数值为零或为负数的数出现。【例例6.13】【例例6.14】【例例6.15】2.2.几均、算均、调均的关系几均、算均、调均的关系对同一变量数列而言,若分别计算几均、算均、调均,则有算均最大、调均最小、几对同一变量数列而言,若分别计算几均、算均、调均,则有算均最大、调均最小、几均居中,三者的关系用不等表示为均居中,三者的关系用不等表示为:现在学习的是第10页,共27页6.3.4 6.3.4 中位数中位数中位数变量数列中居中间位置的变量值,又称二分位数。由于中位数位置居中,其值不中位数变量数列中居中间位置的变量值,又称二分位数。由于中位数位置居中,其值不大不小,因而,可用来代表数列
13、的一般水平。大不小,因而,可用来代表数列的一般水平。1.1.未分组资料求中位数。先将未分组资料求中位数。先将 n n 个数值由小到大排列个数值由小到大排列;其次其次,用(用(n n+1+1)/2/2 确定中确定中位数所处位置;最后视位数所处位置;最后视n n为奇数还是偶数确定中位数为奇数还是偶数确定中位数.2.2.单项数列求中位数。先用较小累计制求累计次数,其次用公式(单项数列求中位数。先用较小累计制求累计次数,其次用公式(f+1)/2决定决定中位数的位次和所在的组别,最后确定中位数中位数的位次和所在的组别,最后确定中位数.3.3.由组距数列确定中位数,先采用较小或较大累计制计算各组累计次数;
14、由组距数列确定中位数,先采用较小或较大累计制计算各组累计次数;其次用(其次用(f+1)/2确定中位数的位次和所处的组别,最后根据均匀分布假设,用下确定中位数的位次和所处的组别,最后根据均匀分布假设,用下列公式求中位数列公式求中位数:【例例6.16】【例例6.16】【例例6.18】现在学习的是第11页,共27页6.3.5 6.3.5 众众 数数众数是变量数列中出现次数最多的变量值。由于众数在数列中出现的频率较高,有时众数是变量数列中出现次数最多的变量值。由于众数在数列中出现的频率较高,有时利用众数来表示现象的一般水平或集中趋势。众数利用众数来表示现象的一般水平或集中趋势。众数 M0 M0 的确定
15、有以下两种情形:的确定有以下两种情形:1 1、单项分组数列求众数。直接找出次数最多的变量值即为众数、单项分组数列求众数。直接找出次数最多的变量值即为众数2 2、组距变量数列求众数。对称分布时众数、组距变量数列求众数。对称分布时众数M0M0为众数组(次数最多的组)为众数组(次数最多的组)的组中值的组中值(粗众数粗众数)。非对称分布时。非对称分布时,众数会受众数组前后两组次数(众数会受众数组前后两组次数(f-1及及f+1)的影响)的影响众众数有两种计算方法:数有两种计算方法:【例例6.18】金氏插值法。根据众数组前后两组次数,用下列公式求众数金氏插值法。根据众数组前后两组次数,用下列公式求众数:切
16、伯插值法。根据众数组次数分别与前后两组次数之差求众数切伯插值法。根据众数组次数分别与前后两组次数之差求众数:现在学习的是第12页,共27页6.3.6 四分位数四分位数将一群由小到大排列的数列分为四等分,可得到三个分割点将一群由小到大排列的数列分为四等分,可得到三个分割点Q1Q1、Q2Q2、Q3Q3,分别称为下,分别称为下四分位数、中位数、上四分位数。这三个临界点就是四分位数四分位数、中位数、上四分位数。这三个临界点就是四分位数.【例例6.20】6.3.7 五数概括法和箱线图五数概括法和箱线图 五数概括法是用数列中的最小值五数概括法是用数列中的最小值(min)(min)、下四分位数、中位数、上四
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 数据 分布 特征 测度
限制150内