《统计学第三章(二).ppt》由会员分享,可在线阅读,更多相关《统计学第三章(二).ppt(46页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、统计学统计学第三章 分布数量特征的统计描述n主要内容:主要内容:l第一节第一节 分布的平均水平、集中趋势和位置的度量分布的平均水平、集中趋势和位置的度量l第二节第二节 分布离散程度的度量分布离散程度的度量l第三节第三节 分布的偏度和峰度分布的偏度和峰度统计学统计学 第三章第二节统计学统计学 第三章第一节现象分布数量特征的统计描述现象分布数量特征的统计描述 平均水平、平均水平、集中趋势集中趋势 离散程度离散程度分布的形状分布的形状平均数平均数中位数中位数众数众数极差极差四分位差四分位差方差方差标准差标准差变异系数变异系数峰度峰度偏度偏度统计学统计学n一、变异指标的含义与作用 (一)变异指标的含义
2、l反映总体内部的离中趋势离中趋势或变异状况变异状况。l变异指标值越大,表明总体各单位标志的变异程度越大。第二节 分布离散程度的度量 第三章第二节统计学统计学n(二)变异指标的作用l1.衡量平均指标的代表性 当总体各单位标志值的变异程度越大时,平均指标的代表性就越当总体各单位标志值的变异程度越大时,平均指标的代表性就越 小;反之则越大。小;反之则越大。【例例3-3-1313】过去三年中,某公司的年平均销售额已达到过去三年中,某公司的年平均销售额已达到12001200万元,这可万元,这可能有下面能有下面A A、B B、C C三种情况,如下表所示。三种情况,如下表所示。表表3-5 3-5 某公司平均
3、销售额某公司平均销售额 单位:万元单位:万元第二节 分布离散程度的度量 第三章第二节年份年份A A销售额销售额B B销售额销售额C C销售额销售额1 111001100200200160016002 21300130030003000120012003 312001200400400800800统计学统计学n(二)变异指标的作用l2.反映社会经济活动的均衡性 变异指标可以表明生产过程的节奏性和其他经济活动的均衡性,因此可以作为企业产品质量控制和评价经济管理工作的依据。表表3-6 3-6 某公司下属两个企业销售额计划完成情况某公司下属两个企业销售额计划完成情况第二节 分布离散程度的度量 第三章第
4、二节企业企业计划计划数数实际实际数数第一季度第一季度第二季度第二季度第三季度第三季度第四季度第四季度绝对绝对数数比重比重%绝对绝对数数比重比重%绝对绝对数数比重比重%绝对绝对数数比重比重%甲1000100014014100104604630030乙120012003002528023.331025.831025.8统计学统计学n(二)变异指标的作用l3.研究总体标志值分布偏离正态的情况 标志值分布越集中,频数分布的形态也越尖峭,标志 值分布越分散,频数分布的形态也越平坦。l4.资产风险的度量l5.变异指标是进行抽样推断等统计分析的一个基本指标。第二节 分布离散程度的度量 第三章第二节统计学统计
5、学n二、极差与四分位差n(一)极差l一组数据的最大值与最小值之差l离散程度的最简单测度值l易受极端值的影响l未考虑数据的分布l计算公式为 未分组数据 组距分组数据 R=最高组上限-最低组下限第二节 分布离散程度的度量 第三章第二节统计学统计学n(二)四分位差l离散程度的测度值之一l上四分位数与下四分位数之差l反映了中间50%数据的离散程度l不受极端值的影响l四分位差越小,说明中间的数据越集中,四分位差越大,说明中间的数据越分散。lP36例题第二节 分布离散程度的度量 第三章第二节统计学统计学n78 80 82 85 89 87 90 86 79 88 84 81 78 80 82 85 89
6、87 90 86 79 88 84 81 的四分位差是多少?的四分位差是多少?把数据从小到大排列 并分为4组:78 79 80,81 82 84,85 86 87,88 89 90 其中第一四分位数为:80 第三四分位数:88 所以四分位差为:88-80=810统计学统计学n三、平均差:总体所有单位的标志值与其平均数的离差绝对值的算术平均数。l用未分组的资料计算平均差,其计算公式为:l用分组的资料计算平均差,其计算公式为:第二节 分布离散程度的度量 第三章第二节统计学统计学n四、方差与标准差 n(一)总体数量标志的方差与标准差l1.数量标志方差与标准差的计算公式:u未分组的情况:u分组的情况:
7、第二节 分布离散程度的度量 第三章第二节统计学统计学按交易额分组按交易额分组组中值组中值频数频数50以下257-94.1762071.53501007525-44.1748767.36100150125125.83408.33150200175755.8321821.532002502254105.8344802.782503002753155.8372852.08300以上3252205.8384734.72合计60390.8333584.3313方差计算表方差计算表统计学统计学l2.总方差、组间方差和组内方差第二节 分布离散程度的度量组间方差反映组间方差反映组平均数对总平均数组平均数对总平
8、均数的方差;的方差;组内方差反映组内方差反映组内标志值对组平均数组内标志值对组平均数的方差。的方差。统计学统计学l2.总方差、组间方差和组内方差 利用这个关系式,可以分析总体变异中,有多少是由于分组标志引起的变异(用 表示),有多少是其他因素引起的变异(用 表示)。通常是通过计算经验相关比指数来反映分组因素对总体变异的影响程度。经验相关比指数的取值范围在01之间。第二节 分布离散程度的度量统计学统计学第二节 分布离散程度的度量n3、标准分数 变量值与其平均数的离差除以标准差后的值称为标准分数,也称标准化值或z分数。标准分数给出了一组数据中各数值的相对位置。16统计学统计学第二节 分布离散程度的
9、度量n经验法则 当一组数据对称分布时,经验法则表明:约有68%的数据在平均数1个标准差的范围内。约有95%的数据在平均数2个标准差的范围内。约有99%的数据在平均数3个标准差的范围内。在3个标准差之外的数据,在统计上称为离群点。17统计学统计学第二节 分布离散程度的度量n契比雪夫不等式 当一组数据不是对称分布时,经验法则不再适用,这时可用契比雪夫不等式,它对任何分布形状的数据都适用。根据契比雪夫不等式,至少有(1-1/k2)的数据落在k个标准差之内。对于k=2,3,4,该不等式的含义是:约有75%的数据在平均数2个标准差的范围内。约有89%的数据在平均数3个标准差的范围内。约有94%的数据在平
10、均数4个标准差的范围内。18统计学统计学l4.方差与标准差的数学性质u变量的方差等于变量平方的平均数减去变量平均数的平方。即:u变量对算术平均数的方差小于对任意常数的方差。un个同性质独立变量和的方差等于各个变量方差的和。第二节 分布离散程度的度量 第三章第二节统计学统计学l4.方差与标准差的数学性质un个同性质独立变量平均数的方差等于各变量方差平均数的1/n。u变量线性变换的方差等于变量的方差乘以变量系数的平方。第二节 分布离散程度的度量 第三章第二节统计学统计学n(二)是非标志的方差与标准差 第二节 分布离散程度的度量 第三章第二节品质标志品质标志标志值标志值次数次数是是1 1N N1 1
11、(1-p)(1-p)2 2N N1 1非非0 0N N0 0(0-p)(0-p)2 2N N0 0合计合计N N统计学统计学 l【例3-18】已知某产品的合格率为95%,求其合格率的方差和标准差。=p(1-p)=95%5%=4.75%=21.79%第二节 分布离散程度的度量 第三章第二节统计学统计学n五、变异系数 极差、四分位差、标准差,都是反映总体各单位标志值变异的绝对指标。这些变异指标的大小不仅取决于总体的变异程度,还与标志值绝对水平高低有关。所以不同现象或具有不同水平的单位,不宜直接用变异指标来比较他们它们的变异程度,而应该采用标志值变异的相对指标,变异系数。第二节 分布离散程度的度量
12、第三章第二节统计学统计学n五、变异系数 变异系数也称离散系数,是各变异指标与其算术平均数的比值。例如:极差与其平均数对比得到极差系数;标准差与其平均数对比得到标准差系数。第二节 分布离散程度的度量 第三章第二节统计学统计学l【例3-19】某学校男子体操队5名队员的体重分别为55、54、52、52、51公斤;女子体操队6名队员的体重分别为46、45、44、44、43、42公斤。试比较哪个队的队员体重更均匀。第二节 分布离散程度的度量 第三章第二节统计学统计学l【例3-20】某投资者想购买在沪市证券交易所上市的股票A和股票B中的一种。从前几个月两种股票的收盘价格可以发现两者的标准差差别很大,。两种
13、股票收盘价格的平均数分别为 。试问该投资者为规避投资风险应怎样决策投资股票品种?第二节 分布离散程度的度量 第三章第二节统计学统计学n六、箱线图(boxplot)在统计描述中的运用l箱线图也称盒须图,由一个箱子(或盒子)和两条线段组成。其绘制的方法是,求出总体的五个数量特征值:极大值、极小值、中位数、上四分位数、下四分位数,连接上四分位数和下四分位数画出箱体,再将两个极值点与箱体相连。第二节 分布离散程度的度量 第三章第二节统计学统计学l【例3-21】某大学统计学专业60名学生8门专业主干课考试成绩分布的特征值如表3-9所示。表表3-9 83-9 8门专业主干课考试成绩的特征值门专业主干课考试
14、成绩的特征值 课程名称 极大值 上四分位数 中位数 下四分位数 极小值 高等数学 90 82 71 63 56 概率论 93 81 75 66 60 统计学 94 82 71 69 60 计量经济学 88 80 78 66 58 抽样技术 80 78 68 67 62 贝叶斯统计 81 77 70 59 58 多元统计学 82 77 70 62 59 时间序列分析85 82 76 69 55第二节 分布离散程度的度量 第三章第二节统计学统计学 第三章第二节解:8门专业主干课考试成绩的箱线图统计学统计学30箱线图在存在多个同类现象时,可以将不同总体的数在存在多个同类现象时,可以将不同总体的数据用
15、箱线图并列起来,进行分布特征的中位数、据用箱线图并列起来,进行分布特征的中位数、离散程度和集中程度的比较。离散程度和集中程度的比较。统计学统计学 第三章第三节统计学统计学n一、统计动差:l原点动差:l以频数分配各组标志值xi对平均数 的k阶中心动差,第三节 分布的偏度和峰度 第三章第三节统计学统计学n偏度偏度1.1.数据分布偏斜程度的测量数据分布偏斜程度的测量2.2.偏度系数偏度系数=0=0为对称分布为对称分布3.3.偏度系数偏度系数00为右偏分布为右偏分布4.4.偏度系数偏度系数000时,表示频数分布比正态分布更集中,分布呈时,表示频数分布比正态分布更集中,分布呈尖峰状态,平均数的代表性更大
16、;尖峰状态,平均数的代表性更大;4.4.00时表示频数分布比正态分布更分散,分布呈平时表示频数分布比正态分布更分散,分布呈平坦峰,平均数的代表性较小。坦峰,平均数的代表性较小。37统计学统计学小结节节主要内容主要内容知识要点知识要点第二节第二节分布的离分布的离散程度散程度变异指标的含义与作变异指标的含义与作用用掌握:变异指标的含义掌握:变异指标的含义理解:变异指标的作用理解:变异指标的作用极差与四分位差极差与四分位差熟记:极差的含义和计算方法熟记:极差的含义和计算方法掌握:四分位差的含义、特点与实际应用掌握:四分位差的含义、特点与实际应用平均差平均差掌握:平均差的含义、特点与实际应用掌握:平均
17、差的含义、特点与实际应用方差与标准差方差与标准差熟记:方差和标准差的含义、特点与计算方法熟记:方差和标准差的含义、特点与计算方法掌握:总方差、组间方差与组内方差的关系掌握:总方差、组间方差与组内方差的关系理解:方差与标准差的数学性质理解:方差与标准差的数学性质掌握:是非标志的方差与标准差的含义与计算掌握:是非标志的方差与标准差的含义与计算方法方法变异系数变异系数熟记:变异系数的含义与计算公式熟记:变异系数的含义与计算公式理解:变异系数的实际应用理解:变异系数的实际应用箱线图在统计描述中箱线图在统计描述中的应用的应用理解:箱线图的含义、绘制方法及其实际应用理解:箱线图的含义、绘制方法及其实际应用
18、38统计学统计学小结节节主要内容主要内容知识要点知识要点第三节第三节分布的偏度和峰度分布的偏度和峰度统计动差统计动差理解:统计动差的含义与分类理解:统计动差的含义与分类偏度偏度掌握:偏度的含义、计算方法掌握:偏度的含义、计算方法峰度峰度掌握:峰度的含义、计算方法掌握:峰度的含义、计算方法39统计学统计学习题1、用标准差比较分析两个同类总体平均指标的代表性,其基本的前提条件是()A.两个总体的标准差应相等 B.两个总体的平均数应该相等 C.两个总体的单位数应该相等 D.两个总体的离差之和应相等40统计学统计学2、某数列变量值平方的平均数等于9,而变量值平均数的平方等于5,则标准差为()A.B.4
19、 C.D.241统计学统计学3.某地区GDP的平均增长速度;2005-2007年为13%,2008-2009年为9%,则这5年的平均增长速度为()A.(13%*3+9%*2)/5 B.C.(113%*3+109%*2)/5-100%D.42统计学统计学4、众数()A 总是小于算术平均数B 是分布数列中标志值最大的数C 是分布数列中最大的频数D 不受分布数列变量值大小变动的影响43统计学统计学5、若篮球运动员的平均身高198cm,标准差2.6cm,小学生的平均身高100cm,标准差1.8cm。则根据该资料判断()A 篮球运动员组的身高较均匀B 小学生组的身高较均匀C 两组的身高不能进行比较D 无法判断44统计学统计学6、数量标志的方差()A 具有非负性B 一般大于平均差C 会受到极端值的影响D 具有平移不变的性质E 可以反映现象发展过程的均衡性45统计学统计学7、下列关于权数的描述,不正确的有()A 权数是衡量相应的变量对总次数作用的强度B 权数起作用在于次数占总次数的比重大小C 权数起作用在于次数本身绝对值的大小D 权数起作用的前提之一是各组的变量值必须互相有差异E 权数就是频数46
限制150内