第四章集中趋势测量法课件.ppt
《第四章集中趋势测量法课件.ppt》由会员分享,可在线阅读,更多相关《第四章集中趋势测量法课件.ppt(89页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、第四章第四章集中趋势测量法集中趋势测量法主要内容算术平均数中位数众数几何平均数和调和平均数1集中趋势图示集中趋势集中趋势集中趋势集中趋势(位置位置位置位置)2集中趋势(Central tendency)1.一组数据向其中心值靠拢的倾向和程度2.测度集中趋势就是寻找数据水平的代表值或中心值3.不同类型的数据用不同的集中趋势测度值4.低层次数据的测度值适用于高层次的测量数据,但高层次数据的测度值并不适用于低层次的测量数据3统计分析统计分析首先要解决的问题,就是寻求首先要解决的问题,就是寻求一个简单数值以代表搜集所得的资料。一个简单数值以代表搜集所得的资料。平均指标平均指标就是表明同质总体在一定条件
2、就是表明同质总体在一定条件下某一数量标志所达到的一般水平。下某一数量标志所达到的一般水平。平均指标平均指标把总体各单位之间的差异加以把总体各单位之间的差异加以抽象概括,其中个别标志值的偶然性被抽象概括,其中个别标志值的偶然性被相互抵消,从而反映出总体分布的集中相互抵消,从而反映出总体分布的集中趋势。趋势。4下面是一个小故事:一个人到某公司求职,经过调查,得出关于该公司工资的一些数据,如果是你,应该如何选择?5挠头的数值挠头的数值公司公司员工的月薪如下:工的月薪如下:员工工经理理副副经理理职员A职员B职员C职员D职员E职员F职员G月薪月薪(元)(元)60004000170013001200110
3、0110011005006我们有三种方法选择集中趋势:(1)根据频数:哪个变量值出现次数越多,就选择哪个变量值,比如民主决策的表决机制。(2)根据居中:比如一个城镇居民的生活水平,居中的是小康家庭,那么就用小康家庭来代表该城镇的生活水平。(3)根据平均:用平均数来代表变量的平均水平。7集中趋势的测度集中趋势的测度一、算术平均数(均值)一、算术平均数(均值)(mean)1.集中趋势的测度值之一集中趋势的测度值之一2.最常用的测度值最常用的测度值3.一组数据的均衡点所在一组数据的均衡点所在4.易受极端值的影响易受极端值的影响5.用于数值型数据,不能用于分类数据和顺用于数值型数据,不能用于分类数据和
4、顺序数据序数据8简单均值(simple mean)设一组数据为:设一组数据为:x x1 1,x x2 2,x xn n(x xN N)样本均值样本均值样本均值样本均值总体均值总体均值总体均值总体均值9加权均值(weighted mean)设各组的组中值为:设各组的组中值为:MM1 1,MM2 2,MMk k 相应的频数为:相应的频数为:f f1 1,f f2 2,f fk k样本样本样本样本加权均值加权均值总体总体总体总体加权均值加权均值10频数分布表的编制频数分布表的编制(实例)(实例)某某某某 生生生生 产产产产 车车车车 间间间间 5050名名名名工工工工人人人人日日日日加加加加工工工工
5、零零零零件件件件数数数数如如如如下下下下(单单单单位位位位:个个个个)。试试试试采采采采用用用用单单单单变变变变量量量量值值值值对对对对数数数数据据据据进进进进行分组。行分组。行分组。行分组。11某车间某车间50名工人日加工零件均值计算表名工人日加工零件均值计算表按零件数分组按零件数分组组中值(组中值(Xi)频数(频数(Fi)XiFi105110110115115120120125125130130135135140107.5112.5117.5122.5127.5132.5137.5358141064322.5562.5940.01715.01275.0795.0550.0合计合计50616
6、0.012加权均值加权均值 (例题分析例题分析)在过去的几年里,许多公司参与到长途电话行业的竞争中。在过去的几年里,许多公司参与到长途电话行业的竞争中。某公司想知道新客户与本公司签约后的第一个月的帐单情况。某公司想知道新客户与本公司签约后的第一个月的帐单情况。因此,该公司记录了因此,该公司记录了5050个固定电话新客户第一个月的电话清单,个固定电话新客户第一个月的电话清单,根据此表资料计算平均电话费用。根据此表资料计算平均电话费用。电话费用(元)用(元)户数(户)组中值20元以下元以下2102020-4083024040-60165080060-802070140080元以上元以上490360
7、合合计50282013加权均值加权均值(例题分析例题分析)14算术平均数的性质算术平均数的性质各变量值与算术平均数的离差之和等于各变量值与算术平均数的离差之和等于0。各变量值对算术平均数的平方和,小于它们对任各变量值对算术平均数的平方和,小于它们对任何他数偏差的平方和何他数偏差的平方和算术平均数受抽样变动影响较小。算术平均数受抽样变动影响较小。分组资料如遇有开放组距时,不经特殊处理分组资料如遇有开放组距时,不经特殊处理不能进行算术平均数的计算。不能进行算术平均数的计算。受极端值影响较大。受极端值影响较大。15二、调和平均数(harmonic mean)1.均值的另一种表现形式2.易受极端值的影
8、响3.计算公式为原来只是计算时使用了不同的数据!16调和平均数调和平均数(算例)【例例例例】某某某某蔬蔬蔬蔬菜菜菜菜批批批批发发发发市市市市场场场场三三三三种种种种蔬蔬蔬蔬菜菜菜菜的的的的日日日日成成成成交交交交数数数数据据据据如如如如表表表表4-24-2,计计计计算算算算三种蔬菜该日的平均批发价格三种蔬菜该日的平均批发价格三种蔬菜该日的平均批发价格三种蔬菜该日的平均批发价格某日三种蔬菜的批发成交数据某日三种蔬菜的批发成交数据蔬菜蔬菜名称名称批发价格批发价格(元元)Xi成交额成交额(元元)XiFi成交量成交量(公斤公斤)Fi甲甲乙乙丙丙1.200.500.8018000125006400150
9、00250008000合计合计369004800017三、几何平均数三、几何平均数(geometric mean)1.集中趋势的测度值之一集中趋势的测度值之一2.N 个变量值乘积的个变量值乘积的N 次方根次方根3.适用于特殊的数据适用于特殊的数据4.主要用于计算平均发展速度主要用于计算平均发展速度6.6.可看作是均值的一种变形可看作是均值的一种变形可看作是均值的一种变形可看作是均值的一种变形l 5.计算公式为计算公式为18几何平均数几何平均数(算例算例)【例例】一一位位投投资资者者持持有有一一种种股股票票,1996年年、1997年年、1998年年和和1999年年收收益益率率分分别别为为4.5%
10、、2.0%、3.5%、5.4%。计算该投资者在这四年内的平均收益率。计算该投资者在这四年内的平均收益率。平均收益率平均收益率103.6%-1=3.6%103.6%-1=3.6%19四、位置平均数四、位置平均数众数众数(mode)1.集中趋势的测度值之一集中趋势的测度值之一2.出现次数最多的变量值出现次数最多的变量值3.不受极端值的影响不受极端值的影响4.可能没有众数或有几个众数可能没有众数或有几个众数20众数(不唯一性)无众数原始数据:10 5 9 12 6 8一个众数一个众数原始数据:6 59 8 55多于一个众数多于一个众数原始数据:25 282836 42422122甲城市家庭对住房状况
11、评价的频数分布甲城市家庭对住房状况评价的频数分布回答类别回答类别甲城市甲城市户数户数(户户)百分比百分比(%)向上累积向上累积向下累积向下累积户数户数(户户)百分比百分比(%)户数户数(户户)百分比百分比(%)非常不满意非常不满意不满意不满意一般一般满意满意非常满意非常满意24108934530836311510241322252703008447590100300276168753010092562510合计合计300100.0231.单项数列确定众数。单项数列确定众数。只需要直接判断哪一组的次数最多,该组的变只需要直接判断哪一组的次数最多,该组的变量值即为众数,用量值即为众数,用M Mo
12、o表示。表示。2.2.组距式分组资料计算众数组距式分组资料计算众数 在组距式分组资料中,众数的计算就带有一定在组距式分组资料中,众数的计算就带有一定的假定性。先根据数列次数最多的组确定为众数所的假定性。先根据数列次数最多的组确定为众数所在组,再利用插补法求其众数近似值。形成了两个在组,再利用插补法求其众数近似值。形成了两个计算公式,即上限公式和下限公式:计算公式,即上限公式和下限公式:2425式中:式中:Mo表示众数表示众数 L表示众数所在组的下限表示众数所在组的下限 U表示众数所在组的上限表示众数所在组的上限 1是众数所在组的次数是众数所在组的次数f2与其下限邻近组的次数与其下限邻近组的次数
13、f1之差之差 2是众数所在组的次数是众数所在组的次数f2与其上限邻近组的次数与其上限邻近组的次数f3之差之差 i表示众数所在组的组距表示众数所在组的组距 M MMoooM MMoooM MMooo26某车间某车间50名工人日加工零件数分组表名工人日加工零件数分组表按零件数分组按零件数分组频数(人)频数(人)累积频数累积频数105110110115115120120125125130130135135140358141064381630404650合计合计5027五、中位数五、中位数(median)1.集中趋势的测度值之一集中趋势的测度值之一2.排序后处于中间位置上的值排序后处于中间位置上的值3
14、.不受极端值的影响不受极端值的影响不受极端值的影响不受极端值的影响4.主要用于顺序数据,也可用数值型数据,但主要用于顺序数据,也可用数值型数据,但主要用于顺序数据,也可用数值型数据,但主要用于顺序数据,也可用数值型数据,但不能用于分类数据不能用于分类数据不能用于分类数据不能用于分类数据5.各变量值与中位数的离差绝对值之和最小,各变量值与中位数的离差绝对值之和最小,各变量值与中位数的离差绝对值之和最小,各变量值与中位数的离差绝对值之和最小,即即即即281.1.未分组资料确定中位数未分组资料确定中位数 在资料未分组情况下,将总体各单位的标志值在资料未分组情况下,将总体各单位的标志值按其大小顺序排列
15、,确定标志值数列的中间位置点,按其大小顺序排列,确定标志值数列的中间位置点,即中位数位置即中位数位置(N+1)/2当N为奇数时当N为偶数时292.2.单项式分配数列的中位数计算单项式分配数列的中位数计算 在单项式分配数列情况下,先计算各组的累计次数,在单项式分配数列情况下,先计算各组的累计次数,然后根据中点的位次然后根据中点的位次(f/2)所在的组来确定中位数所在组所在的组来确定中位数所在组,中中位数所在组的标志值就是中位数。位数所在组的标志值就是中位数。按日产量分组按日产量分组(件件)工人数工人数(人人)累计次数累计次数(以以下下)xff 4 567898 22423817 3 8 30 7
16、2110127130合计合计130303.3.组距式分组资料的中位数计算组距式分组资料的中位数计算 对于组距数列资料,首先要确定中位数所在组,对于组距数列资料,首先要确定中位数所在组,再利用其上限公式或下限公式计算:再利用其上限公式或下限公式计算:31式中:式中:Me为中位数;为中位数;i为中位数所在组的组距;为中位数所在组的组距;L为中位数所在组的下限;为中位数所在组的下限;U为中位数所在组的上限;为中位数所在组的上限;fm为中位数所在组的次数;为中位数所在组的次数;Sm-1为中位数组下限的邻近组及以下各组的累计次数;为中位数组下限的邻近组及以下各组的累计次数;Sm+1为中位数组上限的邻近组
17、及以上各组的累计次数为中位数组上限的邻近组及以上各组的累计次数32某车间某车间50名工人日加工零件数分组表名工人日加工零件数分组表按零件数分组按零件数分组频数(人)频数(人)累积频数累积频数105110110115115120120125125130130135135140358141064381630404650合计合计5033六、四分位数六、四分位数(quartile)1.集中趋势的测度值之一集中趋势的测度值之一2.排序后处于排序后处于25%和和75%位置上的值位置上的值3.3.不受极端值的影响不受极端值的影响不受极端值的影响不受极端值的影响4.4.主要用于顺序数据,也可用于数值型数据,但
18、不主要用于顺序数据,也可用于数值型数据,但不主要用于顺序数据,也可用于数值型数据,但不主要用于顺序数据,也可用于数值型数据,但不能用于分类数据能用于分类数据能用于分类数据能用于分类数据QQL LQQMMQQU U25%25%25%25%34四分位数位置的确定四分位数位置的确定未分组数据未分组数据未分组数据未分组数据下四分位数下四分位数下四分位数下四分位数(QQL L)位置位置位置位置=N+N+1 14 4上四分位数上四分位数上四分位数上四分位数(QQU U)位置位置位置位置=3(3(N+N+1)1)4 4组距分组数据组距分组数据组距分组数据组距分组数据下四分位数下四分位数下四分位数下四分位数(
19、QQL L)位置位置位置位置=N N4 4上四分位数上四分位数上四分位数上四分位数(QQL L)位置位置位置位置=3N3N4 435数值型未分组数据的四分位数数值型未分组数据的四分位数(7个数据的算例个数据的算例)原始数据原始数据:23 21 30 32 28 25 26排排序序:21 23 25 26 28 30 32位位置置:1 2 3 4 5 6 7 7+7+1 1QQL L位置位置=4 4=4 4=2=2QQU U位置位置=3(3(N+N+1)1)4 43(73(7+1)1)4 4=6=6QL=23QU QU=30=3036数值型未分组数据的四分位数数值型未分组数据的四分位数(6个数据
20、的算例个数据的算例)原始数据原始数据:23 21 30 28 25 26排排序序:21 23 25 26 28 30位位置置:1 2 34 5 6QQL L位置位置=N+N+1 14 4=6+6+1 14 4=1.75=1.75QQU U位置位置=3(3(N+N+1)1)4 43(63(6+1)1)4 4=5.25=5.25QQL L=21+0.75(23-21)=21+0.75(23-21)=22.522.5Q QU U=28+0.25(30-28)=28+0.25(30-28)=28.528.537数值型分组数据的四分位数(计算示例)计算计算计算计算5050名工人日加工零件数的四分位数名工
21、人日加工零件数的四分位数名工人日加工零件数的四分位数名工人日加工零件数的四分位数某车间某车间50名工人日加工零件数分组表名工人日加工零件数分组表按零件数分组按零件数分组频数(人)频数(人)累积频数累积频数1051101101151151201201251251301301351351403 35 58 8141410106 64 43 38 8161630304040464650合计合计5038QL位置位置50/412.5QUQU位置位置位置位置350/4350/437.537.539众数、中位数和均值的关系众数、中位数和均值的关系根据英国统计学家皮尔逊的经验,在轻微偏态情根据英国统计学家皮尔
22、逊的经验,在轻微偏态情况下,算术平均数与中位数的距离约为算术平况下,算术平均数与中位数的距离约为算术平均数与众数距离的均数与众数距离的1/3,即有:,即有:左偏分布左偏分布左偏分布左偏分布左偏分布左偏分布均值均值均值均值均值均值 中位数中位数中位数中位数中位数中位数 众数众数众数众数众数众数右偏分布右偏分布右偏分布右偏分布右偏分布右偏分布众数众数众数众数众数众数 中位数中位数中位数中位数中位数中位数 均值均值均值均值均值均值对称分布对称分布对称分布对称分布对称分布对称分布 均值均值均值均值均值均值=中位数中位数中位数中位数中位数中位数=众数众数众数众数众数众数 2(Mex)=MoMe40众数、
23、中位数和均值的特点和应用众数、中位数和均值的特点和应用1.众数众数不受极端值影响不受极端值影响具有不唯一性具有不唯一性数据分布偏斜程度较大时应用数据分布偏斜程度较大时应用2.中位数中位数不受极端值影响不受极端值影响数据分布偏斜程度较大时应用数据分布偏斜程度较大时应用3.均值均值易受极端值影响易受极端值影响数学性质优良数学性质优良数据对称分布或接近对称分布时应用数据对称分布或接近对称分布时应用41关于集中趋势的一个故事吉斯莫先生有一个小工厂,生产超级小玩意儿。管理人员由吉斯莫先生、他的弟弟、六个亲戚组成。工作人员由5个领工和10个工人组成。工厂经营得很顺利,现在需要一个新工人。现在吉斯莫先生正在
24、接见萨姆,谈工作问题。42吉斯莫:我们这里报酬不错。平均薪金是每周300美元。你在学徒期间每周得75美元,不过很快就可以加工资。萨姆工作了几天之后,要求见厂长。萨姆;你欺骗我!我已经找其他工人核对过了,没有一个人的工资超过每周100元。平均工资怎么可能是一周300元呢?吉斯莫:啊,萨姆,不要激动。平均工资是300元。我要向你证明这一点。43吉斯莫:这是我每周付出的酬金。我得2400元,我弟弟得1000元,我的六个亲戚每人得250元,五个领工每人得200元,10个工人每人100元。总共是每周6900元,付给23个人,对吧?萨姆:对,对,对!你是对的,平均工资是每周300元。可你还是蒙骗了我。吉斯
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 第四 集中 趋势 测量 课件
限制150内