《变量分析》PPT课件.ppt
《《变量分析》PPT课件.ppt》由会员分享,可在线阅读,更多相关《《变量分析》PPT课件.ppt(36页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、下页下页上页上页第五章第五章第五章第五章 变量数列分析变量数列分析 本章主要阐述变量数列描述性分析的基本方法本章主要阐述变量数列描述性分析的基本方法,主要包括集主要包括集中趋势测度与离散趋势测度,及偏度与峰度的测度方法。中趋势测度与离散趋势测度,及偏度与峰度的测度方法。5.1 变量数列分析概述变量数列分析概述一一.变量数列分析的内容变量数列分析的内容 变量数列分析变量数列分析是对总体各单位按数量水准分组形是对总体各单位按数量水准分组形成的分布数列进行定量分析,以揭示总体的分布特征、成的分布数列进行定量分析,以揭示总体的分布特征、集中趋势、离散趋势等。主要内容有:集中趋势、离散趋势等。主要内容有
2、:(1)总体结构与分布特征总体结构与分布特征.主要考察变量数列中各组主要考察变量数列中各组在总体中所占的比重在总体中所占的比重,分布特征与分布类型等分布特征与分布类型等.(2)集中趋势测度集中趋势测度.主要考察变量数列中总体各单位主要考察变量数列中总体各单位某一数量标志值或统计指标的一般水平某一数量标志值或统计指标的一般水平,主要测度有主要测度有算均算均,调均调均,几均几均,中位数和众数等平均指标中位数和众数等平均指标.1/30/2023下页下页上页上页第五章第五章 (3)离散趋势测度离散趋势测度.主要考察变量数列中总体各单位主要考察变量数列中总体各单位数量标志或统计指标的差异程度数量标志或统
3、计指标的差异程度,主要测度有全距主要测度有全距,四四方位差方位差,方差与标准差方差与标准差,变异系数等指标变异系数等指标.(4)偏度与峰度测定偏度与峰度测定.主要考察变量数列次数分布的主要考察变量数列次数分布的非对称程度和次数分布曲线的尖峭程度非对称程度和次数分布曲线的尖峭程度.二二.变量数列分析的作用变量数列分析的作用 (1)认识作用认识作用.通过变量数列分析可以认识总体内部通过变量数列分析可以认识总体内部结构与分布特征结构与分布特征,总体各单位的一般水平与差异程度总体各单位的一般水平与差异程度,掌握客观现象的数量特征与规律掌握客观现象的数量特征与规律.(2)比较作用比较作用.通过集中趋势与
4、离散趋势测度通过集中趋势与离散趋势测度,可以比可以比较不同国家、地区、企业同类现象一般水平的高低及较不同国家、地区、企业同类现象一般水平的高低及其差异程度以及收入差距是否扩大其差异程度以及收入差距是否扩大.1/30/2023下页下页上页上页第五章第五章 (3)数量标准作用数量标准作用.以平均数为标准以平均数为标准,可以判断某种现可以判断某种现象或事物数量的大小象或事物数量的大小,水平的高低水平的高低,效果和质量的好坏效果和质量的好坏.在制定各种管理定额中在制定各种管理定额中,常以相应的平均数为基础常以相应的平均数为基础.(4)推断作用推断作用.集中趋势测度的样本平均数和离散趋集中趋势测度的样本
5、平均数和离散趋势测度的样本方差是抽样推断的重要依据势测度的样本方差是抽样推断的重要依据.亦可根据亦可根据总体单位总量及总平均数推算总体标志总量总体单位总量及总平均数推算总体标志总量.三三.变量数列分析的作用变量数列分析的作用 (1)注意总体各单位的同质性注意总体各单位的同质性.若总体中极端值的非若总体中极端值的非同质总体单位的混入同质总体单位的混入,则大大削弱了平均指标的意义则大大削弱了平均指标的意义,扩大了总体单位之间的离散程度扩大了总体单位之间的离散程度.(2)用组平均数补充总平均数用组平均数补充总平均数.用组平均数对总平均用组平均数对总平均数作补充说明数作补充说明,可以说明总平均数内部原
6、因或说明不可以说明总平均数内部原因或说明不同时间同时间,不同空间总平均数差异的原因不同空间总平均数差异的原因.1/30/2023下页下页上页上页第五章第五章 (3)用次数分布补充总平均数用次数分布补充总平均数.总平均数把总体各单总平均数把总体各单位的差异抽象化了位的差异抽象化了,掩盖了总体各单位的差异及其分掩盖了总体各单位的差异及其分布状况布状况,因此用次数或频率分布补充总平均数因此用次数或频率分布补充总平均数,可以较可以较全面地认识单体的数量特征全面地认识单体的数量特征.(4)集中趋势与离散趋势测度相结合集中趋势与离散趋势测度相结合.集中趋势测度集中趋势测度的只能说明数列的一般水平的只能说明
7、数列的一般水平,离散趋势测度的变异指离散趋势测度的变异指标标,可以衡量平均数代表性高低可以衡量平均数代表性高低,评价现象变动的均衡评价现象变动的均衡性或稳定性性或稳定性,因此二者应结合应用因此二者应结合应用.(5)注意一般与个别相结合注意一般与个别相结合.为了丰富平均数对客观为了丰富平均数对客观现象的认识作用现象的认识作用,往往需要结合典型事例往往需要结合典型事例,特别是要用特别是要用先进和落后的典型来补充总平均数的不足先进和落后的典型来补充总平均数的不足.1/30/2023下页下页上页上页第五章第五章5.2 变量数列分布分析变量数列分布分析一一.次数分布与频率分布次数分布与频率分布 变量数列
8、次数分布变量数列次数分布是由变量的不同取值及其相应的是由变量的不同取值及其相应的频数所构成的分布数列;频率分布是由变量的不同取频数所构成的分布数列;频率分布是由变量的不同取值及其相应的频率所构成的值及其相应的频率所构成的.在变量数列中在变量数列中,各组次数各组次数 fi占总次数的比率即频率占总次数的比率即频率.其满足其满足 次数分布和频率分布都能说明总体中所有个体在各次数分布和频率分布都能说明总体中所有个体在各组间的分布特征组间的分布特征,因此在编制变量数列时因此在编制变量数列时,常把频率常把频率列入数列中列入数列中,以便更好地说明问题以便更好地说明问题.1/30/2023下页下页上页上页第五
9、章第五章二二.次数分布的主要类型次数分布的主要类型 由于现象的性质不同由于现象的性质不同,次数分布或频率分布有次数分布或频率分布有:(1)钟形分布钟形分布:其特征是其特征是“中间大,两头小中间大,两头小”,即靠近,即靠近中间的变量值分布的次数或频率多,靠近两端的变量中间的变量值分布的次数或频率多,靠近两端的变量值分布的次数或频率少,值分布的次数或频率少,绘成曲线图,像口钟。可分绘成曲线图,像口钟。可分为对称分布为对称分布(如图如图5-1(a)、右偏、右偏(图图5-1(b)和左偏分布和左偏分布(图图5-1(c).对称分布的特征是对称分布的特征是:中间变量值分布的次中间变量值分布的次数或频率最多数
10、或频率最多,两侧变量值分布的次数随着与中间变两侧变量值分布的次数随着与中间变量值距离的增大逐渐减少量值距离的增大逐渐减少,并围绕中心变量值两侧呈并围绕中心变量值两侧呈对称分布对称分布,最常见的最重要是正态分布最常见的最重要是正态分布,许多现象的许多现象的总体分布都趋于正态分布总体分布都趋于正态分布,因而它在统计研究和应用因而它在统计研究和应用中具有极其重要的作用中具有极其重要的作用.1/30/2023下页下页上页上页第五章第五章(a)(b)(c)图图5-1 钟形分布图钟形分布图 (2)U形分布形分布:其特征是其特征是“中间小,两头大中间小,两头大”,即靠近,即靠近中间的变量值分布的次数或频率少
11、,靠近两端的变量中间的变量值分布的次数或频率少,靠近两端的变量值分布的次数或频率多,值分布的次数或频率多,绘成曲线图,像字母绘成曲线图,像字母U。最。最常见的常见的U型分布是人口死亡率的分布型分布是人口死亡率的分布,即按年龄阶段即按年龄阶段来看来看,婴儿和老年死亡率较高婴儿和老年死亡率较高,中年死亡率最低中年死亡率最低.(3)J形分布形分布:其有两种类型其有两种类型,即正即正J形和反形和反J形分布形分布.如投资额与利润率大小一般呈正如投资额与利润率大小一般呈正J形分布;如费用率形分布;如费用率按销售额大小呈反按销售额大小呈反J形分布形分布.1/30/2023下页下页上页上页第五章第五章三三.变
12、量数列分布分析变量数列分布分析 变量数列分布分析主要考察变量取值的分布类型变量数列分布分析主要考察变量取值的分布类型,描述总体或样本的结构描述总体或样本的结构.变量数列按变量的取值是否变量数列按变量的取值是否连续连续,可分为离散型与连续型变量数列可分为离散型与连续型变量数列.离散型变量离散型变量宜采用直线图和直方图宜采用直线图和直方图,连续型变量宜采用直方图连续型变量宜采用直方图,折折线图线图,平滑图平滑图.变量数列分布的类型也有钟形分布变量数列分布的类型也有钟形分布,U形分布及形分布及J 形分布等形分布等.例例5.1 表表5-1所示是某市所示是某市1000户被调查的居民家庭现户被调查的居民家
13、庭现有住房面积的分布有住房面积的分布.从中可看出从中可看出,这这1000户中户中,住房面住房面积在积在60 m2以下的占以下的占3.1%,在在120 m2以上的占以上的占42.1%.假定假定120 m2以下的居民都想提高到以下的居民都想提高到120 m2以上以上,全市全市现有现有57.9%的居民家庭低于这个值的居民家庭低于这个值,因此该市地产商因此该市地产商仍有较大的市场潜力仍有较大的市场潜力.1/30/2023下页下页上页上页第五章第五章表表5-1 某市居民家庭现有住房面积分布某市居民家庭现有住房面积分布住房面积住房面积(m2)户数户数(户户)频率频率(%)累计累计户数户数(人人)频率()频
14、率()40以下以下4060608080100100120120140140160160180180以上以上合计合计1021731952802069865521 0001.02.17.319.528.020.69.86.55.2100.010311042995797858839481 0001.03.110.429.957.978.588.394.8100.01/30/2023下页下页上页上页第五章第五章5.3 集中趋势测度集中趋势测度 集中趋势集中趋势是指变量数列中数据分布的中心值或一般是指变量数列中数据分布的中心值或一般水平。变量数列是以平均数为中心而上下波动,故平水平。变量数列是以平均数为
15、中心而上下波动,故平均数反映了总体的集中趋势,它是总体分布的重要特均数反映了总体的集中趋势,它是总体分布的重要特征之一。集中趋势测度就是计算变量数列的平均数,征之一。集中趋势测度就是计算变量数列的平均数,而常见平均数有算术平均数、调和平均数、几何平均而常见平均数有算术平均数、调和平均数、几何平均数、中位数和众数等,前三种称为数值平均数,后两数、中位数和众数等,前三种称为数值平均数,后两种称为位置平均数。种称为位置平均数。一一.算术平均数算术平均数 算术平均数算术平均数是指变量数列中所有数据的总和除以数是指变量数列中所有数据的总和除以数据个数所得这商。此为一般所称的平均数,用据个数所得这商。此为
16、一般所称的平均数,用 来表来表示,其算式为示,其算式为数据总和数据总和数据个数数据个数1/30/2023下页下页上页上页第五章第五章 1.简单算术平均数:其是用于未分组资料求平均数简单算术平均数:其是用于未分组资料求平均数.2.加权平均数加权平均数:其是用于分组数列求平均数其是用于分组数列求平均数.其中其中 代表各组变量值的频率代表各组变量值的频率.看例看例5.34 注意注意:(1)权数对平均数大小起着权衡轻重作用权数对平均数大小起着权衡轻重作用,但不但不 取决于它的绝对值的大小取决于它的绝对值的大小,而是取决于它的比重而是取决于它的比重,故比故比重权更能反映权数的实质重权更能反映权数的实质.
17、(2)根据组距数列求加权算根据组距数列求加权算术平均时术平均时,需取组中值作为各组变量值的代表需取组中值作为各组变量值的代表,是假定是假定总体各单位在各组内部是均匀分布的总体各单位在各组内部是均匀分布的,但实际并非如但实际并非如此此,故这样计算的平均数只是一人近似数故这样计算的平均数只是一人近似数.如例如例4.1原原始数据未分组的平均分为始数据未分组的平均分为78.1,而例而例5.4分组后平均分分组后平均分为为77.5分分.1/30/2023下页下页上页上页第五章第五章 3.算术平均数的性质算术平均数的性质:(1)算术平均数与总体个数乘积等于总体数据和算术平均数与总体个数乘积等于总体数据和.即
18、即或或(2)各变量值与算术平均数差异总和为零各变量值与算术平均数差异总和为零.即即或或(3)各变量值与算术平均数差异的平方和最小各变量值与算术平均数差异的平方和最小.(4)组平均数组平均数 的加权平均数等于总平均数的加权平均数等于总平均数.(5)=E(X),因因 E(aX+b)=aE(X)+b,即有书上即有书上8条条.1/30/2023下页下页上页上页第五章第五章 4.先进平均数先进平均数 先进平均数是根据数列中比一般算术平均数先进的先进平均数是根据数列中比一般算术平均数先进的那一部分数据所计算的平均数那一部分数据所计算的平均数.(即比平均数大的平均即比平均数大的平均数数)二二.调和平均数调和
19、平均数 调和平均数调和平均数是各个变量值倒数的算术平均数的倒数是各个变量值倒数的算术平均数的倒数,又称倒数平均数又称倒数平均数,用用H表示表示,调均也有简单也加权两种调均也有简单也加权两种.加权调均加权调均:(分组资料分组资料)其中其中n代表变量值项数代表变量值项数,m代表调均的权数代表调均的权数.简单调均简单调均:(未分组资料未分组资料)1/30/2023下页下页上页上页第五章第五章例例5.5 某工厂某工厂8个工人日生产某产品的件数分别为个工人日生产某产品的件数分别为:20,22,23,25,26,24,28,30则则算均算均为为其调均为其调均为 例例5.6 将例将例5.3的数据更改为工资数
20、及各段的数据更改为工资数及各段总工资总数总工资总数所计算的调和平均数与例所计算的调和平均数与例5.3的的频数分布频数分布所计算的加权所计算的加权平均数相等。即平均数相等。即 已知已知各变量值各变量值和和各组次数各组次数,采用算术,采用算术平均法的加权平均数;平均法的加权平均数;与已知与已知变量值变量值和和各组变量值的各组变量值的总和总和时,时,采用调和平均法求得的平均数是相等的。采用调和平均法求得的平均数是相等的。1/30/2023下页下页上页上页第五章第五章三三.几何平均数几何平均数 1.几何平均数的计算几何平均数的计算 例例5.85.9具体的计算。具体的计算。2.几均,几均,算均,调均的关
21、系算均,调均的关系对同一变量数列而言对同一变量数列而言,若分别计算几均若分别计算几均,算均及调均算均及调均,则有如下大小关系则有如下大小关系:(注数列注数列 x 值都是正值值都是正值)简单几均简单几均:加权几均加权几均:等号当且仅当等号当且仅当 各各 x 的值都为同一值的值都为同一值.1/30/2023下页下页上页上页第五章第五章四四.中位数中位数 中位数中位数是指在变量值大小排序后数列可变量中属于是指在变量值大小排序后数列可变量中属于中间位置的变量值中间位置的变量值,又称二分位数又称二分位数.由于中位数位置居由于中位数位置居中中,其数值不太大也不太小其数值不太大也不太小,因而可用其代表数列的
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 变量分析 变量 分析 PPT 课件
限制150内