集中趋势和离中趋势的度量 课件.ppt
集中趋势和离中趋势集中趋势和离中趋势的度量的度量 第1页,此课件共93页哦第五章第五章 集中趋势和集中趋势和离中趋势的度量离中趋势的度量第一节 集中趋势指标概述第二节 数值平均数第三节 位置平均数第四节 离中趋势的度量第五节 偏度与峰度-略,自学第2页,此课件共93页哦数据分布的特征数据分布的特征集中趋势集中趋势集中趋势集中趋势 (位置位置位置位置)离中趋势离中趋势离中趋势离中趋势 (分散程度分散程度分散程度分散程度)偏态和峰度偏态和峰度偏态和峰度偏态和峰度(形状)(形状)(形状)(形状)第3页,此课件共93页哦数据分布的特征和测度数据分布的特征和测度数据的特征和测度数据的特征和测度分布的形状分布的形状集中趋势集中趋势离散程度离散程度众众众众众众 数数数数数数中位数中位数中位数中位数中位数中位数均均均均均均 值值值值值值离散系数离散系数离散系数离散系数离散系数离散系数方差和标准差方差和标准差方差和标准差方差和标准差方差和标准差方差和标准差峰峰峰峰峰峰 度度度度度度四分位差四分位差四分位差四分位差四分位差四分位差异众比率异众比率异众比率异众比率异众比率异众比率偏偏偏偏偏偏 态态态态态态第4页,此课件共93页哦 集中趋势的测度集中趋势的测度一一.定类数据:众数定类数据:众数二二.定序数据:中位数和分位数定序数据:中位数和分位数三三.定距和定比数据:均值定距和定比数据:均值四四.众数、中位数和均值的比较众数、中位数和均值的比较第5页,此课件共93页哦第一节第一节 集中趋势指标概述第6页,此课件共93页哦第一节第一节 集中趋势指标概述集中趋势指标概述一、集中趋势指标及其特点(一)概念集中趋势平均指标第7页,此课件共93页哦集中趋势集中趋势(Central tendency)1.1.一组数据向其中心值靠拢的倾向和程度一组数据向其中心值靠拢的倾向和程度2.2.测度集中趋势就是寻找数据一般水平的代表值或中心值测度集中趋势就是寻找数据一般水平的代表值或中心值3.3.不同类型的数据用不同的集中趋势测度值不同类型的数据用不同的集中趋势测度值4.4.低层次数据的集中趋势测度值适用于高层次的测量数据,反过来,高低层次数据的集中趋势测度值适用于高层次的测量数据,反过来,高层次数据的集中趋势测度值并不适用于低层次的测量数据层次数据的集中趋势测度值并不适用于低层次的测量数据5.5.选用哪一个测度值来反映数据的集中趋势,要根据所掌握的数据的类选用哪一个测度值来反映数据的集中趋势,要根据所掌握的数据的类型来确定型来确定第8页,此课件共93页哦(一一)平均指标的概念平均指标的概念 是一种综合指标,是在同度质总体内将各单位数量差异抽象化,用以反映总体在一定时间、地点、条件下的一般水平.第9页,此课件共93页哦(二)特点1.是一个代表值,代表总体各个单位某一数量标志的一般水平;2.把某一数量标志在总体单位之间数值差异抽象化了.反映总体各单位标志值分布的集中趋势.是总体分布的重要特征值.第10页,此课件共93页哦二、作用1.比较分析作用2.说明事物的发展过程和变化趋势3.可以作为论断事物的一种数量标准或参考4.可以进行数量上的推断三、种类:包括算术平均数、调和平均数、几何平均数、中位数、分位数和众数.第11页,此课件共93页哦第二节数值平均数第12页,此课件共93页哦第一部分第一部分算术平均数(均值均值)第13页,此课件共93页哦均值均值(概念要点概念要点)1.集中趋势的测度值之一2.最常用的测度值3.一组数据的均衡点所在4.易受极端值的影响5.用于数值型数据,不能用于定类数据和定序数据第14页,此课件共93页哦 一、算术平均数的基本公式 注意:分子、分母必须是属于同一总体的.二、简单算术平均数-未分组资料 应用条件:公式:第15页,此课件共93页哦简单均值简单均值(算例算例)原始数据:10591368第16页,此课件共93页哦三、加权算术平均数-分组资料设分组后的数据为:相应的频数为:公式:权数系数公式:第17页,此课件共93页哦加权均值加权均值(算例)(算例)某车间某车间某车间某车间5050名工人日加工零件均值计算表名工人日加工零件均值计算表名工人日加工零件均值计算表名工人日加工零件均值计算表按零件数分组按零件数分组组中值(组中值(Xi)频数(频数(Fi)XiFi105110110115115120120125125130130135135140107.5112.5117.5122.5127.5132.5137.5358141064322.5562.5940.01715.01275.0795.0550.0合计合计506160.0【例例例例】计算计算50 50 名工人日加工零件数的均值名工人日加工零件数的均值第18页,此课件共93页哦加权均值加权均值(权数对均值的影响权数对均值的影响)甲乙两组各有甲乙两组各有1010名学生,他们的考试成绩及其分布数据如下名学生,他们的考试成绩及其分布数据如下 甲组:甲组:甲组:甲组:考试成绩(考试成绩(考试成绩(考试成绩(X X):0 20 100 0 20 100 人数分布(人数分布(人数分布(人数分布(F F):):):):1 1 81 1 8 乙组:乙组:乙组:乙组:考试成绩(考试成绩(考试成绩(考试成绩(X X):0 20 100 0 20 100 人数分布(人数分布(人数分布(人数分布(F F):):):):8 1 18 1 1X X X甲甲甲01+201+100801+201+100801+201+1008 ff f 101010 XfXfXf 828282828282(分)(分)(分)(分)(分)(分)X X X乙乙乙08+201+100108+201+100108+201+1001 ff f 101010 XfXfXf 121212121212(分)(分)(分)(分)(分)(分)第19页,此课件共93页哦qf权数qxf加权q注意:1.两种情况权数不起作用 第20页,此课件共93页哦2.各组权数f是通过 大小对平均数发生作用.例 投资项目评估市场情况市场情况年利润(万元)年利润(万元)(x x)频率频率(%)(%)(f/f)(f/f)X(f/f)景气一般不景气200120505030201003610合计100146第21页,此课件共93页哦3.xf3.xf要具有标志值总量的实际意义要具有标志值总量的实际意义.例例 某公司所属企业资金利润率资金利润资金利润(%)(%)组中值组中值(%)(%)企业数企业数(个个)企业资金企业资金(万元万元)-10-100 00 010101010202020203030-5-55 51515252510105 53 32 28080100100500500800800合合 计计202014801480第22页,此课件共93页哦均值均值(数学性质数学性质)1.各变量值与均值的离差之和等于零 2.各变量值与均值的离差平方和最小第23页,此课件共93页哦第二部分第二部分 调和平均数调和平均数一、概念:是各标志值倒数的算术平均数的倒数是各标志值倒数的算术平均数的倒数,又称倒又称倒数平均数数平均数.例关系关系:互为倒数互为倒数 第24页,此课件共93页哦二、计算方法(一)简单调和平均数适用未分组资料【例】工人劳动生产率水平正指标正指标(件件/小时小时)逆指标(分/件)A AB BC CD DE E101012121515202030306 65 54 43 32 2第25页,此课件共93页哦【计算】1.根据正指标:2.根据逆指标:第26页,此课件共93页哦【公式】教材P99例总体2.223kg总体3.00kg适用于未分组资料或逆指标第27页,此课件共93页哦(二)加权调和平均数分组资料时权数为特定形式:m=xf调和平均数可做为算术平均数的变形使用加权算术平均数的权数为f加权调和平均数的权数为m各组标志总量 一般应用于没有直接提供被平均值的相应单位数的场合.第28页,此课件共93页哦调和平均数调和平均数(概念要点概念要点)1.集中趋势的测度值之一2.均值的另一种表现形式3.易受极端值的影响4.用于定比数据5.不能用于定类数据和定序数据6.计算公式为原来只是计原来只是计算时使用了算时使用了不同的数据不同的数据!第29页,此课件共93页哦举例举例若P99例中,早市买180元,午市买160元,晚市买150元,求均价?则:基本思路:均价=花了多少钱买了多少菜第30页,此课件共93页哦调和平均数调和平均数(算例算例)某日三种蔬菜的批发成交数据某日三种蔬菜的批发成交数据某日三种蔬菜的批发成交数据某日三种蔬菜的批发成交数据蔬菜蔬菜名称名称批发价格批发价格(元元)x成交额成交额(元元)m成交量成交量(公斤公斤)f(m/x)甲甲乙乙丙丙1.200.500.801800012500640015000250008000合计合计3690048000【例例例例】某某蔬蔬菜菜批批发发市市场场三三种种蔬蔬菜菜的的日日成成交交数数据据如如下下表表,计计算算三三种种蔬菜该日的平均批发价格蔬菜该日的平均批发价格第31页,此课件共93页哦四、由相对数或平均数四、由相对数或平均数计算平均数计算平均数例例P113P113表表5-4 5-4 某公司产值计划完成情况某公司产值计划完成情况产值计划完成产值计划完成程度程度(%)(%)组中值组中值(%)x(%)x企业数企业数(个个)计划产值计划产值(万元万元)f)f实际产值实际产值(万元万元)xf)xf80-9080-9090-10090-100100-110100-110110-120110-120858595951051051151152 23 310103 38008002500250017200172004400440068068023752375180601806050605060合合 计计181824900249002617526175求:公司平均产值计划完成程度已知分母推算分子第32页,此课件共93页哦四、由相对数或平均数四、由相对数或平均数计算平均数计算平均数q关键确定谁是变量x(求谁谁是x)找出权数(根据x的内涵)如:x已知需推算第33页,此课件共93页哦例例P113 表表5-4 某公司产值计划完成情况某公司产值计划完成情况产值计划完成产值计划完成程度程度(%)(%)组中值组中值(%)x(%)x企业数企业数(个个)实际产值实际产值(万元万元)m)m计划产值计划产值(万元万元)80-9080-9090-10090-100100-110100-110110-120110-120858595951051051151152 23 310103 36806802375237518060180605060506080080025002500172001720044004400合合 计计181826175261752490024900求:公司平均产值计划完成程度已知分子推算分母第34页,此课件共93页哦x已知推算 同一数据,两种计算方法结果完全相同,只是所采用的权类不同罢了.第35页,此课件共93页哦结论结论 根据基本公式(P105公式5.1):己知分母推算分子时,用加权算术平均法;己知分子推算分母时,用加权调和平均法第36页,此课件共93页哦第三部分第三部分 几何平均数几何平均数一、概念:n n个变量值乘积的个变量值乘积的 n n 次方根次方根 集中趋势的测度值之一集中趋势的测度值之一 适用于特殊的数据,只适用于定比数据只适用于定比数据,定距数据不定距数据不 宜宜使用使用.主要用于计算平均发展速度主要用于计算平均发展速度例例毛坯车间粗加工车间精加工车间装配车间合格率:99%98%96.5%98.7%1009997.0293.62成品92.41第37页,此课件共93页哦二、计算方法(一)简单几何平均数未分组资料如上例:可看作是均值的一种变形:几何平均数的对数是各变量几何平均数的对数是各变量值对数的算术平均值对数的算术平均.第38页,此课件共93页哦几何平均数几何平均数(算例算例)【例例例例】一一位位投投资资者者持持有有一一种种股股票票,19961996年年、19971997年年、19981998年和19991999年年收收益益率率分分别别为为4.5%4.5%、2.0%、3.5%、5.4%5.4%。计算该投资者在这四年内的平均收益率。计算该投资者在这四年内的平均收益率。平均收益率平均收益率103.84%-1=3.84%第39页,此课件共93页哦(二)加权几何平均数分组资料时例-P114例5-9年利率(增长速度%)环比发展速度(%)时间(权数f年)566.4105106108334第40页,此课件共93页哦第三节第三节位置平均数第41页,此课件共93页哦一、众数一、众数(概念要点概念要点)1.集中趋势的测度值之一2.出现次数最多的变量值3.不受极端值的影响4.可能没有众数或有几个众数5.主要用于定类数据,也可用于定序数据和数值型数据第42页,此课件共93页哦众数众数(众数的不唯一性众数的不唯一性)无众数无众数原始数据原始数据:10 5 9 12 6 8一个众数一个众数原始数据:6 5 9 8 5 5多于一个众数多于一个众数原始数据:25 :25 28 28 36 42 4242 42第43页,此课件共93页哦定类数据的众数定类数据的众数(算例算例)某城市居民关注广告类型的频数分布某城市居民关注广告类型的频数分布某城市居民关注广告类型的频数分布某城市居民关注广告类型的频数分布 广告类型广告类型人数人数(人人)比例比例频率频率(%)商品广告商品广告 服务广告服务广告 金融广告金融广告 房地产广告房地产广告 招生招聘广告招生招聘广告 其他广告其他广告112519161020.5600.2550.0450.0800.0500.01056.025.54.58.05.01.0合计合计2001100【例例例例】根据表中的数据,计算众数根据表中的数据,计算众数解解解解:这这里里的的变变量量为为“广广告告类类型型”,这这是是个个定定类类变变量量,不不同同类类型型的的广广告告就就是是变变量量值值。我我们们看看到到,在在所所调调查查的的200200人人当当中中,关关注注商商品品广广告告的的人人数数最最多多,为为112112人人,占占总总被被调调查查人人数数的的56%56%,因因此此众众数数为为“商商品品广广告告”这这一一类类别别,即即 MMo o商品广告商品广告商品广告商品广告第44页,此课件共93页哦定序数据的众数定序数据的众数(算例算例)【例例例例】根据表中的数据,计算众数根据表中的数据,计算众数解解解解:这这里里的的数数据据为为定定序序数数据据。变变量量为为“回回答答类类别别”。甲甲城城市市中中对对住住房房表表示示不不满满意意的的户户数数最最多多,为为108108户户,因因此此众众数数为为“不满意不满意”这一类别,即这一类别,即 MMo o不满意不满意不满意不满意 甲城市家庭对住房状况评价的频数分布甲城市家庭对住房状况评价的频数分布甲城市家庭对住房状况评价的频数分布甲城市家庭对住房状况评价的频数分布回答类别回答类别甲城市甲城市户数户数 (户户)百分比百分比 (%)非常不满意非常不满意 不满意不满意 一般一般 满意满意 非常满意非常满意24108934530836311510合计合计300100.0第45页,此课件共93页哦数值型分组数据的众数数值型分组数据的众数(要点及计算公式要点及计算公式)1.1.众数的值与相邻两组频数的分布有关众数的值与相邻两组频数的分布有关4.4.该公式假定众数组的频数在众数组内均匀分布该公式假定众数组的频数在众数组内均匀分布2.2.2.相邻两组的频数相等时,众数组的组中值即为众数相邻两组的频数相等时,众数组的组中值即为众数相邻两组的频数相等时,众数组的组中值即为众数M MMooo3.3.相邻两组的频数不相等时,众数采用下列近相邻两组的频数不相等时,众数采用下列近似公式计算似公式计算M MMoooM MMooo第46页,此课件共93页哦数值型分组数据的众数数值型分组数据的众数(算例算例)某车间某车间某车间某车间5050名工人日加工零件数分组表名工人日加工零件数分组表名工人日加工零件数分组表名工人日加工零件数分组表按零件数分组按零件数分组频数(人)频数(人)累积频数累积频数105110110115115120120125125130130135135140358141064381630404650合计合计50【例例例例4.14.1】根根据据表表中中的的数数据据,计计算算5050名名 工工 人人 日日加加 工工 零零 件件数的众数数的众数第47页,此课件共93页哦二、中位数二、中位数(概念要点概念要点)1.1.集中趋势的测度值之一集中趋势的测度值之一2.2.排序后处于中间位置上的值排序后处于中间位置上的值MMe e50%50%3.3.不受极端值的影响不受极端值的影响4.4.主要用于定序数据,也可用数值型数据,但不能用于定类主要用于定序数据,也可用数值型数据,但不能用于定类数据数据5.5.各变量值与中位数的离差绝对值之和最小,即各变量值与中位数的离差绝对值之和最小,即第48页,此课件共93页哦中位数中位数(位置的确定位置的确定)未分组数据:未分组数据:组距分组数据:组距分组数据:第49页,此课件共93页哦未分组数据的中位数未分组数据的中位数(计算公式计算公式)第50页,此课件共93页哦定序数据的中位数定序数据的中位数(算例算例)【例例例例】根根据据表表中中的的数数据据,计计算算甲甲城城市市家家庭对住房满意状况评价的中位数庭对住房满意状况评价的中位数解:解:解:解:中位数的位置为:中位数的位置为:300/2300/2150150从从累累计计频频数数看看,中中位位数数的的在在“一一般般”这这一一组组别别中中。因此因此 MMe e一般一般一般一般 甲城市家庭对住房状况评价的频数分布甲城市家庭对住房状况评价的频数分布甲城市家庭对住房状况评价的频数分布甲城市家庭对住房状况评价的频数分布回答类别回答类别甲城市甲城市户数户数 (户户)累计频数累计频数 非常不满意非常不满意 不满意不满意 一般一般 满意满意 非常满意非常满意2410893453024132225270300合计合计300第51页,此课件共93页哦数值型未分组数据的中位数数值型未分组数据的中位数(5个数据的算例个数据的算例)原始数据原始数据:24 22 21 26 20排排 序序:20 21 22 24 26位位 置置:1 2 3 4 5中位数中位数 22第52页,此课件共93页哦数值型未分组数据的中位数数值型未分组数据的中位数(6个数据的算例个数据的算例)原始数据原始数据:10 5 9 12 6 8排排 序序:5 6 8 9 10 12位位 置置:1 2 3 4 5 6位置位置N+126+123.5中位数中位数 8+928.5第53页,此课件共93页哦1.根据位置公式确定中位数所在的组2.2.采用下列近似公式计算:采用下列近似公式计算:4.该公式假定中位数组的频数在该组内均匀分布数值型分组数据的中位数数值型分组数据的中位数(要点及计算公式要点及计算公式)第54页,此课件共93页哦数值型分组数据的中位数数值型分组数据的中位数(算例算例)表表表表3-5 3-5 某车间某车间某车间某车间5050名工人日加工零件数分组表名工人日加工零件数分组表名工人日加工零件数分组表名工人日加工零件数分组表按零件数分组按零件数分组频数(人)频数(人)累积频数累积频数105110110115115120120125125130130135135140358141064381630404650合计合计50【例例例例4 4】根根据据表表中中的的数数据据,计计算算50 50 名名工工人人日日加加工工零零件件数数的的中位数中位数第55页,此课件共93页哦补充补充 各种平均数的相互各种平均数的相互关系及应用原则关系及应用原则一、算术平均数、调和平均数和几何平均数的关系根据同一资料计算的三种平均数的数量关系:例结论:实证第56页,此课件共93页哦二、算术平均数、中位数和众数的关系决定于总体内部的次数分布状况(一)总体是对称钟形分布时对称分布对称分布对称分布对称分布对称分布对称分布 均值均值均值均值均值均值=中位数中位数中位数中位数中位数中位数=众数众数众数众数众数众数x 1 2 3 4 5f 1 2 3 2 1【例】第57页,此课件共93页哦(二)总体是非对称钟形分布时同一组数据计算,三者之间存在差别,差别程度与非对称程度呈正比.原因?来自数据中的极端数值(极大值或极小值).均值受极端数值影响最大;中位数受极端数值位置影响,但不受其数值影响;众数则完全不受极端数值的影响.第58页,此课件共93页哦1.右偏态时:数据中存在极大值,必然拉动均值向极大值一方靠.【例】右偏分布右偏分布右偏分布右偏分布右偏分布右偏分布众数众数众数众数众数众数 中位数中位数中位数中位数中位数中位数 均值均值均值均值均值均值x 1 2 3 4 5f 2 4 3 2 1第59页,此课件共93页哦2.左偏态时:数据中存在极小值,必然拉动均值向极小值一方靠.【例】左偏分布左偏分布左偏分布左偏分布左偏分布左偏分布均值均值均值均值均值均值 中位数中位数中位数中位数中位数中位数 众数众数众数众数众数众数x 1 2 3 4 5f 1 2 3 4 2第60页,此课件共93页哦关系在次数分布呈微偏斜情况下,(英)皮尔逊经验公式:试2/31/3【例】自动包装机包装某产品,质量标准1000克/袋,3克.经实测,平均每袋为1001克,中位数为999克.试研究该包装机是否合格?解:第61页,此课件共93页哦数据类型与集中趋势测度值数据类型与集中趋势测度值表表4-4 数据类型和所适用的集中趋势测度值数据类型和所适用的集中趋势测度值数据类型数据类型定类数据定类数据 定序数据定序数据定距数据定距数据定比数据定比数据适适用用的的测测度度值值众数众数中位数中位数均值均值均值均值四分位数四分位数众数众数调和平均数调和平均数众数众数中位数中位数几何平均数几何平均数四分位数四分位数 中位数中位数四分位数四分位数众数众数为该数据类型最适合用的测度值.第62页,此课件共93页哦三、平均指标的应用原则三、平均指标的应用原则(一)平均指标只能应用于同质总体(一)平均指标只能应用于同质总体(二)用组平均数补充说明总平均数(二)用组平均数补充说明总平均数(三)用次数分配资料补充说明总平均数(三)用次数分配资料补充说明总平均数例例按计划完成按计划完成%分组分组企业数企业数计划数计划数(万元万元)实际数实际数(万元万元)100100以下以下100100100100以上以上10105 55 55005008008005000500030030080080060006000合合 计计 20206300630071007100计划完成%为7100/6300=112.7%,但尚有10个企业没完成计划.第63页,此课件共93页哦第四节第四节 离中趋势的度量离中趋势的度量 标志变异指标标志变异指标第64页,此课件共93页哦一、离中趋势一、离中趋势1.1.数据分布的另一个重要特征数据分布的另一个重要特征2.2.离中趋势的各测度值是对数据离散程度所作的描述离中趋势的各测度值是对数据离散程度所作的描述3.3.反映各变量值远离其中心值的程度,因此也称为离中趋势反映各变量值远离其中心值的程度,因此也称为离中趋势4.4.从另一个侧面说明了集中趋势测度值的代表程度从另一个侧面说明了集中趋势测度值的代表程度5.5.不同类型的数据有不同的离散程度测度值不同类型的数据有不同的离散程度测度值第65页,此课件共93页哦数据的特征和测度数据的特征和测度(本章位置)(本章位置)第66页,此课件共93页哦标志变异指标的标志变异指标的概念和作用概念和作用离中趋势指标(标志变异指标)的概念又称标志变动度,是反映总体各单位标志值差异程度的统计指标.反映总体各单位标志值分布的离中趋势.作用是衡量平均数代表性的尺度:标志变动度与平均数的代表性成反比关系.第67页,此课件共93页哦是反映社会经济活动过程均衡性的一个重要指标.判断:实际完成数=计划数(均值)均衡 实际完成数计划数(均值)不均衡【例】分析:甲车间均衡地完成全月生产计划.是统计分析的一个基本指标.种类车间计划完成%上旬中旬下旬全月甲乙31.716.733.333.335.050.0100.0100.0第68页,此课件共93页哦二、二、极差极差(全距全距)第69页,此课件共93页哦二、全距二、全距(极差极差)(概念要点及计算公式概念要点及计算公式)1.1.一组数据的最大值与最小值之差一组数据的最大值与最小值之差2.2.离散程度的最简单测度值离散程度的最简单测度值3.易受极端值影响易受极端值影响4.4.未考虑数据的分布未考虑数据的分布7 8 9 107 8 9 10未分组数据未分组数据 .=组距分组数据组距分组数据 R 最高组上限-最低组下限5.计算公式为计算公式为第70页,此课件共93页哦三、平均差三、平均差(概念要点及计算公式概念要点及计算公式)1.1.离散程度的测度值之一离散程度的测度值之一2.2.各变量值与其均值离差绝对值的平均数各变量值与其均值离差绝对值的平均数3.3.能全面反映一组数据的离散程度能全面反映一组数据的离散程度4.4.数学性质较差,实际中应用较少数学性质较差,实际中应用较少5.5.计算公式为计算公式为未分组数据未分组数据未分组数据未分组数据组距分组数据组距分组数据组距分组数据组距分组数据第71页,此课件共93页哦平均差平均差(计算过程及结果)(计算过程及结果)【例例例例】根据表中的数据,计算工人日加工零件数的平均差根据表中的数据,计算工人日加工零件数的平均差 某车间某车间某车间某车间5050名工人日加工零件标准差计算表名工人日加工零件标准差计算表名工人日加工零件标准差计算表名工人日加工零件标准差计算表按零件数分组按零件数分组组中值组中值(Xi)频数频数(Fi)|Xi-X|Xi-X|Fi105110110115115120120125125130130135135140107.5112.5117.5122.5127.5132.5137.535814106415.710.75.70.74.39.314.347.153.545.69.843.055.857.2合计合计50312第72页,此课件共93页哦四、方差和标准差第73页,此课件共93页哦(一一)方差和标准差的计算方差和标准差的计算(概念要点概念要点)1.离散程度的测度值之一2.最常用的测度值3.反映了数据的分布4.反映了各变量值与均值的平均差异5.根据总体数据计算的,称为总体方差或标准差;根据样本数据计算的,称为样本方差或标准差4 6 8 10 12X=8.3第74页,此课件共93页哦标准差的计算公式标准差的计算公式1.简单平均式未分组资料2.加权平均式分组资料(公式5.27)(公式5.28)第75页,此课件共93页哦总体方差和标准差总体方差和标准差(计算公式计算公式)未分组数据:未分组数据:组距分组数据:组距分组数据:未分组数据:未分组数据:组距分组数据:组距分组数据:方差的计算公式方差的计算公式标准差的计算公式标准差的计算公式标准差的计算公式标准差的计算公式第76页,此课件共93页哦总体标准差总体标准差(计算过程及结果)(计算过程及结果)某车间某车间某车间某车间5050名工人日加工零件标准差计算表名工人日加工零件标准差计算表名工人日加工零件标准差计算表名工人日加工零件标准差计算表按零件数分组按零件数分组组中值组中值(Xi)频数频数(Fi)(Xi-X)2(Xi-X)2Fi105110110115115120120125125130130135135140107.5112.5117.5122.5127.5132.5137.5358141064246.49114.4932.490.4918.4986.49204.49739.47572.45259.926.86184.90518.94817.96合计合计503100.5【例例例例】根据表中的数据,计算工人日加工零件数的标准差根据表中的数据,计算工人日加工零件数的标准差第77页,此课件共93页哦样本方差和标准差样本方差和标准差(计算公式计算公式)未分组数据:未分组数据:组距分组数据:组距分组数据:未分组数据:未分组数据:组距分组数据:组距分组数据:方差的计算公式方差的计算公式方差的计算公式方差的计算公式标准差的计算公式标准差的计算公式标准差的计算公式标准差的计算公式注意:注意:注意:样本方差用自样本方差用自样本方差用自由度由度由度n-1n-1n-1去除去除去除!第78页,此课件共93页哦样本方差样本方差自由度自由度(degree of freedom)1.1.一组数据中可以自由取值的数据的个数一组数据中可以自由取值的数据的个数2.2.当当样样本本数数据据的的个个数数为为 n n 时时,若若样样本本均均值值 x x 确确定定后后,只只有有n n-1 1个数据可以自由取值,其中必有一个数据则不能自由取值个数据可以自由取值,其中必有一个数据则不能自由取值3.3.例例如如,样样本本有有3 3个个数数值值,即即x x1 1=2=2,x x2 2=4=4,x x3 3=9=9,则则 x x =5 5。当当 x x =5 5 确确定定后后,x x1 1,x x2 2和和x x3 3有有两两个个数数据据可可以以自自由由取取值值,另另一一个个则则不不能能自自由由取取值值,比比如如x x1 1=6=6,x x2 2=7=7,那那么么x x3 3则则必必然取然取2 2,而不能取其他值,而不能取其他值4.4.样样本本方方差差用用自自由由度度去去除除,其其原原因因可可从从多多方方面面来来解解释释,从从实实际际应应用用角角度度看看,在在抽抽样样估估计计中中,当当用用样样本本方方差差去去估计总体方差估计总体方差 2 2时,它是时,它是 2 2的无偏估计量的无偏估计量第79页,此课件共93页哦样本方差样本方差(算例算例)原始数据:10 5 9 13 6 8第80页,此课件共93页哦样本标准差样本标准差(算例算例)样本标准差样本标准差原始数据:10 5 9 13 6 8第81页,此课件共93页哦方差方差(简化计算公式简化计算公式)样本方差样本方差总体方差总体方差第82页,此课件共93页哦二、方差二、方差(数学性质数学性质)各变量值对均值的方差小于对任意值的方差各变量值对均值的方差小于对任意值的方差各变量值对均值的方差小于对任意值的方差各变量值对均值的方差小于对任意值的方差设设X X0 0为不等于为不等于X X 的任意数,D D2 2为对X X0 0的方差,则的方差,则第83页,此课件共93页哦标准化值标准化值(概念要点和计算公式概念要点和计算公式)1.也称标准分数2.给出某一个值在一组数据中的相对位置给出某一个值在一组数据中的相对位置3.可用于判断一组数据是否有离群点4.用于对变量的标准化处理5.计算公式为第84页,此课件共93页哦(二二)是非标志的标准差是非标志的标准差1.概念是非标志,又称交替标志具有某一标志值的单位 “是”或“有”不具有某一标志值的单位 “非”或“无”令“是”1;“非”0,可称为“10”型变量2.指标(1)是非标志的成数:第85页,此课件共93页哦 设变量值为“1”的单位数为 变量值为“0”的单位数为 则总体单位数为:N=+(2)是非标志的平均数和标准差第86页,此课件共93页哦第87页,此课件共93页哦五、离散五、离散(变异变异)系数系数(一)为什么要计算离散(变异)系数标准差是反映标志变动度的绝对指标,有名数.此时必须计算相对变异指标离散系数第88页,此课件共93页哦(二二)离散系数离散系数(概念要点和计算公式概念要点和计算公式)1.标准差与其相应的均值之比2.消除了数据水平高低和计量单位的影响3.测度了数据的相对离散程度4.用于对不同组别数据离散程度的比较5.计算公式为第89页,此课件共93页哦离散系数离散系数(实例和计算过程)(实例和计算过程)某管理局所属某管理局所属某管理局所属某管理局所属8 8家企业的产品销售数据家企业的产品销售数据家企业的产品销售数据家企业的产品销售数据企业编号企业编号产品销售额(万元)产品销售额(万元)X1销售利润(万元)销售利润(万元)X21234567817022039043048065095010008.112.518.022.026.540.064.069.0【例例例例】某某管管理理局局抽抽查查了了所所属属的的8 8家家企企业业,其其产产品品销销售售数数据据如如表表4.74.7。试试比比较产品销售额与销售利润的离散程度较产品销售额与销售利润的离散程度第90页,此课件共93页哦离散系数离散系数(计算结果计算结果)X X1 1=536.25536.25(万元)(万元)S S1 1=309.19309.19(万元)(万元)V V1 1=536.25536.25309.19309.19=0.5770.577S S2 2=23.0923.09(万元)(万元)V V2 2=32.521532.521523.0923.09=0.7100.710X X2 2=32.521532.5215(万元)(万元)结结结结论论论论:计计算算结结果果表表明明,V V1 1V V2 2,说明产品销售额的离散程度小于销售利润的离散程度 第91页,此课件共93页哦数据类型与离散程度测度值数据类型与离散程度测度值 数据类型和所适用的离散程度测度数据类型和所适用的离散程度测度数据类型和所适用的离散程度测度数据类型和所适用的离散程度测度值值数据类型数据类型定类数据定类数据 定序数据定序数据定距数据或定比数据定距数据或定比数据适适用用的的测测度度值值异众比率异众比率四分位差四分位差 方差或标准差方差或标准差 异众比率异众比率 离散系数(比较时用)离散系数(比较时用)平均差平均差 极差极差 四分位差四分位差 异众比率异众比率第92页,此课件共93页哦结结 束束第93页,此课件共93页哦