《四章节集中趋势测量法.ppt》由会员分享,可在线阅读,更多相关《四章节集中趋势测量法.ppt(39页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、四章节集中趋势测量法 Still waters run deep.流静水深流静水深,人静心深人静心深 Where there is life,there is hope。有生命必有希望。有生命必有希望n n统计分析统计分析首先要解决的问题,就是寻求首先要解决的问题,就是寻求一个简单数值以代表搜集所得的资料。一个简单数值以代表搜集所得的资料。n n平均指标平均指标就是表明同质总体在一定条件就是表明同质总体在一定条件下某一数量标志所达到的一般水平。下某一数量标志所达到的一般水平。n n平均指标平均指标把总体各单位之间的差异加以把总体各单位之间的差异加以抽象概括,其中个别标志值的偶然性被抽象概括,其
2、中个别标志值的偶然性被相互抵消,从而反映出总体分布的集中相互抵消,从而反映出总体分布的集中趋势。趋势。2n n下面是一个小故事:一个人到某公司求职,经过调查,得出关于该公司工资的一些数据,如果是你,应该如何选择?3挠头的数值挠头的数值公司公司员员工的月薪如下:工的月薪如下:员员工工经经理理副副经经理理职员职员A职员职员B职员职员C职员职员D职员职员E职员职员F职员职员G月薪月薪(元)(元)60004000170013001200110011001100500我们有三种方法选择集中趋势:我们有三种方法选择集中趋势:(1 1)根据频数:哪个变量值出现次数越)根据频数:哪个变量值出现次数越多,就选择
3、哪个变量值,比如民主决策的表决多,就选择哪个变量值,比如民主决策的表决机制。机制。(2 2)根据居中:比如一个城镇居民的生活)根据居中:比如一个城镇居民的生活水平,居中的是小康家庭,那么就用小康家庭水平,居中的是小康家庭,那么就用小康家庭来代表该城镇的生活水平。来代表该城镇的生活水平。(3 3)根据平均:用平均数来代表变量的)根据平均:用平均数来代表变量的平均水平。平均水平。5关于集中趋势的一个故事关于集中趋势的一个故事n n吉斯莫先生有一个小工厂,生产超级小玩意儿。n n管理人员由吉斯莫先生、他的弟弟、六个亲戚组成。工作人员由5个领工和10个工人组成。工厂经营得很顺利,现在需要一个新工人。n
4、 n现在吉斯莫先生正在接见萨姆,谈工作问题。6n n吉斯莫:我们这里报酬不错。平均薪金是每周300美元。你在学徒期间每周得75美元,不过很快就可以加工资。n n萨姆工作了几天之后,要求见厂长。n n萨姆;你欺骗我!我已经找其他工人核对过了,没有一个人的工资超过每周100元。平均工资怎么可能是一周300元呢?n n吉斯莫:啊,萨姆,不要激动。平均工资是300元。我要向你证明这一点。7n n吉斯莫:这是我每周付出的酬金。我得2400元,我弟弟得1000元,我的六个亲戚每人得250元,五个领工每人得200元,10个工人每人100元。总共是每周6900元,付给23个人,对吧?n n萨姆:对,对,对!你
5、是对的,平均工资是每周300元。可你还是蒙骗了我。n n吉斯莫;我不同意!你实在是不明白。我已经把工资列了个表,并告诉了你,工资的中位数是200元,可这不是平均工资,而是中等工资。8n n萨姆:每周100元又是怎么回事呢?n n吉斯莫:那称为众数,是大多数人挣的工资。n n吉斯莫:老弟,你的问题是出在你不懂平均数、中位数和众数之间的区别。n n萨姆:好,现在我可懂了。我我辞职!9第一节 算术平均数(MEAN)用总体标志总量除以总体单位数即得算术平均数(Arithematic mean)。算术平均数是反映集中趋算术平均数是反映集中趋势最常用、最基本的平均指标,势最常用、最基本的平均指标,也被称为
6、均值。它只适用于定也被称为均值。它只适用于定距以上的变量。距以上的变量。10 例:某小区例:某小区例:某小区例:某小区350350户家庭共有居民户家庭共有居民户家庭共有居民户家庭共有居民11901190人。在人。在人。在人。在这个例子中,家庭总数这个例子中,家庭总数这个例子中,家庭总数这个例子中,家庭总数350350户是总体单位数,居户是总体单位数,居户是总体单位数,居户是总体单位数,居民总数民总数民总数民总数11901190人是该总体的标志总量。根据算术人是该总体的标志总量。根据算术人是该总体的标志总量。根据算术人是该总体的标志总量。根据算术平均数的定义平均数的定义平均数的定义平均数的定义
7、户均人口户均人口户均人口户均人口 3.4 3.4(人)(人)(人)(人)11 1.1.对于未分组资料对于未分组资料对于未分组资料对于未分组资料 注意:对求和符号,此时流动脚标的变动范围是注意:对求和符号,此时流动脚标的变动范围是注意:对求和符号,此时流动脚标的变动范围是注意:对求和符号,此时流动脚标的变动范围是1,2,3,1,2,3,N N,NN是总体单位数。是总体单位数。是总体单位数。是总体单位数。例例例例 求求求求7474、8585、6969、9l 9l、8787、7474、6969这些数字的这些数字的这些数字的这些数字的算术平均数。算术平均数。算术平均数。算术平均数。解解解解 78.47
8、8.4 12 2.2.对于分组资料对于分组资料对于分组资料对于分组资料 注意:对求和符号,此时流动脚标的变动范围是注意:对求和符号,此时流动脚标的变动范围是注意:对求和符号,此时流动脚标的变动范围是注意:对求和符号,此时流动脚标的变动范围是1,2,3 ,1,2,3 ,n n,n n是组数,而不是总体单位数。是组数,而不是总体单位数。是组数,而不是总体单位数。是组数,而不是总体单位数。很显然,算术平均数不仅受各变量值很显然,算术平均数不仅受各变量值很显然,算术平均数不仅受各变量值很显然,算术平均数不仅受各变量值(X X)大小的影大小的影大小的影大小的影响,而且受各组单位数响,而且受各组单位数响,
9、而且受各组单位数响,而且受各组单位数(频数频数频数频数)的影响。由于对于总体的影的影响。由于对于总体的影的影响。由于对于总体的影的影响。由于对于总体的影响要由频数响要由频数响要由频数响要由频数(f f)大小所决定,所以大小所决定,所以大小所决定,所以大小所决定,所以 f f 也被称为权数。值得也被称为权数。值得也被称为权数。值得也被称为权数。值得注意的是,在统计计算中,权数不仅用来衡量总体中各标注意的是,在统计计算中,权数不仅用来衡量总体中各标注意的是,在统计计算中,权数不仅用来衡量总体中各标注意的是,在统计计算中,权数不仅用来衡量总体中各标志值在总体中作用,同时反映了指标的结构,所以它有两志
10、值在总体中作用,同时反映了指标的结构,所以它有两志值在总体中作用,同时反映了指标的结构,所以它有两志值在总体中作用,同时反映了指标的结构,所以它有两种表现形式:绝对数(频数)和相对数(频率)。这样一种表现形式:绝对数(频数)和相对数(频率)。这样一种表现形式:绝对数(频数)和相对数(频率)。这样一种表现形式:绝对数(频数)和相对数(频率)。这样一来,在统计学中,凡对应于分组资料的计算式,都被称为来,在统计学中,凡对应于分组资料的计算式,都被称为来,在统计学中,凡对应于分组资料的计算式,都被称为来,在统计学中,凡对应于分组资料的计算式,都被称为加权式。加权式。加权式。加权式。13 例例例例 求下
11、表求下表求下表求下表(单项数列单项数列单项数列单项数列)所示数据的算术平所示数据的算术平所示数据的算术平所示数据的算术平均数均数均数均数 。人口数(人口数(人口数(人口数(X X)户数户数户数户数(f)(f)频率频率频率频率(P)(P)2 23 34 45 56 67 78 85 58 8161610106 64 41 10.100.100.160.160.320.320.200.200.120.120.080.080.020.02合计合计合计合计50501.001.0014 对于对于对于对于组距数列组距数列组距数列组距数列,要用每一组的组中值权充该,要用每一组的组中值权充该,要用每一组的组中
12、值权充该,要用每一组的组中值权充该组统一的变量值。组统一的变量值。组统一的变量值。组统一的变量值。例例例例 求下表所示数据的的算术平均数求下表所示数据的的算术平均数求下表所示数据的的算术平均数求下表所示数据的的算术平均数 间距间距频数(频数(f f)组中值(组中值(X)X)148152148152152156152156156160156160160164160164164168164168168172168172172176172176176180176180180184180184184188184188188192188192192196192196 1 1 2 2 5 51010191
13、9252517171212 5 5 3 3 0 0 1 1 150 150154154158158162162166166170170174174178178182182186186190190194194合计合计 100 100 153.算术平均数算术平均数算术平均数算术平均数的性质的性质各变量值与算术平均数的离差之和等于各变量值与算术平均数的离差之和等于0。各变量值对算术平均数的平方和,小于它们对任各变量值对算术平均数的平方和,小于它们对任何他数偏差的平方和何他数偏差的平方和算术平均数受抽样变动影响较小。算术平均数受抽样变动影响较小。分组资料如遇有开放组距时,不经特殊处理分组资料如遇有开放
14、组距时,不经特殊处理不能进行算术平均数的计算。不能进行算术平均数的计算。受极端值影响较大。受极端值影响较大。16第二节第二节 中位数(中位数(Median)把总体单位某一数量标志的各个数值按大小把总体单位某一数量标志的各个数值按大小把总体单位某一数量标志的各个数值按大小把总体单位某一数量标志的各个数值按大小顺序排列,位于正中处的变量值,即为中位数,顺序排列,位于正中处的变量值,即为中位数,顺序排列,位于正中处的变量值,即为中位数,顺序排列,位于正中处的变量值,即为中位数,用用用用MMd d表示。表示。表示。表示。M Md d可用于定序、定距、定比资料。可用于定序、定距、定比资料。171.1.对
15、未分组资料对未分组资料对未分组资料对未分组资料 (1)(1)、先把所有数据按大小顺序排、先把所有数据按大小顺序排、先把所有数据按大小顺序排、先把所有数据按大小顺序排列,如果总体单位数为奇数,则取列,如果总体单位数为奇数,则取列,如果总体单位数为奇数,则取列,如果总体单位数为奇数,则取第(第(第(第(N+1N+1)/2/2 位上的变量值为中位位上的变量值为中位位上的变量值为中位位上的变量值为中位数数数数;(2 2)、如果总体单位数为偶数。)、如果总体单位数为偶数。)、如果总体单位数为偶数。)、如果总体单位数为偶数。因为居中的数值不存在,按惯例,因为居中的数值不存在,按惯例,因为居中的数值不存在,
16、按惯例,因为居中的数值不存在,按惯例,取第取第取第取第 N/2 N/2位和第(位和第(位和第(位和第(N+1N+1)/2/2 位上的位上的位上的位上的两个变量值的平均作为中位数。两个变量值的平均作为中位数。两个变量值的平均作为中位数。两个变量值的平均作为中位数。18n n例 求54,65,78,66,43这些数字的中位数。n n例、求54,65,78,66,43,38 这些数字的中位数。你会吗?19 2.对于分组资料对于分组资料 (1)单项数列单项数列 根据根据N/2在累计频数分布中找到中位数所在组,在累计频数分布中找到中位数所在组,该组变量值就是该组变量值就是MMd d。中位数20(2 2)
17、组距数列组距数列按中位数所在组的下限:按中位数所在组的下限:按中位数所在组的下限:按中位数所在组的下限:按中位数所在组的上限:按中位数所在组的上限:按中位数所在组的上限:按中位数所在组的上限:当根据组距数列求中位数时,要采用所谓的比当根据组距数列求中位数时,要采用所谓的比例插值法:先根据例插值法:先根据N N2 2在累计频数分布中找到中位在累计频数分布中找到中位数所在组,然后假定该组中各变量值是均匀分布的,数所在组,然后假定该组中各变量值是均匀分布的,再用以下任何一种方法求出中位数再用以下任何一种方法求出中位数(注意:此处用注意:此处用的是向上累计的是向上累计)。21 例例例例 某年级学生身高
18、如下,求中位数某年级学生身高如下,求中位数某年级学生身高如下,求中位数某年级学生身高如下,求中位数22 解解 第一种方法第一种方法 168168 6 6 17117112(12(厘米厘米)请你用第二种方法来做一下233.中位数的性质中位数的性质 (1)各变量值对中位数之差的绝对值总和,各变量值对中位数之差的绝对值总和,小于它们对任何其他数的绝对值总和。小于它们对任何其他数的绝对值总和。(2)中位数不受极端值的影响。中位数不受极端值的影响。(3)分组资料有不确定组距时,仍可求得分组资料有不确定组距时,仍可求得中位数。中位数。(4)中位数受抽样变动的影响较算术平均中位数受抽样变动的影响较算术平均数
19、略大。数略大。24 4.4.四四四四分位数分位数 中位数所有单位被等分为两部分,因而被称为二分中位数所有单位被等分为两部分,因而被称为二分中位数所有单位被等分为两部分,因而被称为二分中位数所有单位被等分为两部分,因而被称为二分位数。类似于求中位数,我们还可求出位数。类似于求中位数,我们还可求出位数。类似于求中位数,我们还可求出位数。类似于求中位数,我们还可求出四分位数、十分四分位数、十分四分位数、十分四分位数、十分位数、百分位数。位数、百分位数。位数、百分位数。位数、百分位数。将总体中的各单位分割成相等的四部分,则这三个将总体中的各单位分割成相等的四部分,则这三个将总体中的各单位分割成相等的四
20、部分,则这三个将总体中的各单位分割成相等的四部分,则这三个分割的变量值就是四分位数。若以分割的变量值就是四分位数。若以分割的变量值就是四分位数。若以分割的变量值就是四分位数。若以QQ1 1、QQ2 2、QQ3 3分别代表分别代表分别代表分别代表第一、第二、第三四分位数。第一、第二、第三四分位数。第一、第二、第三四分位数。第一、第二、第三四分位数。QQ2 2 即中位数,即中位数,即中位数,即中位数,QQ1 1、QQ3 3的算的算的算的算法分别是法分别是法分别是法分别是25 请从下表中指出第一四分位数和第三四分位请从下表中指出第一四分位数和第三四分位请从下表中指出第一四分位数和第三四分位请从下表中
21、指出第一四分位数和第三四分位数数数数26 求出下表中的第一四分位数和第三四分数求出下表中的第一四分位数和第三四分数求出下表中的第一四分位数和第三四分数求出下表中的第一四分位数和第三四分数27第三节第三节 众数众数(Mode)众数是在一组资料中,出现次数众数是在一组资料中,出现次数众数是在一组资料中,出现次数众数是在一组资料中,出现次数(或频或频或频或频数数数数)呈现出呈现出呈现出呈现出“峰峰峰峰”值的那些变量值,用值的那些变量值,用值的那些变量值,用值的那些变量值,用MMo o表示。表示。表示。表示。众数只与次数有关,可以用于定类、定序、众数只与次数有关,可以用于定类、定序、定距、定比资料。定
22、距、定比资料。28 1.1.对于未分组资料对于未分组资料对于未分组资料对于未分组资料 直接观察直接观察 首先,将所有数据顺序排列;然后,只要首先,将所有数据顺序排列;然后,只要观察到某些变量值观察到某些变量值(与相邻变量值相比较与相邻变量值相比较)出现出现的次数的次数(或频数或频数)呈现呈现“峰峰”值,这些变量值就值,这些变量值就是是众数。众数。29 2.2.对于分组资料对于分组资料对于分组资料对于分组资料 单项式:单项式:单项式:单项式:观察频数分布观察频数分布(或频率分布或频率分布)组距式:组距式:组距式:组距式:Lo为众数组下限;为众数组频数与前一组频数之差;为众数组频数与后一组频数之差
23、;ho为众数组组距。30人口数(人口数(人口数(人口数(X X)户数户数户数户数(f)(f)频率频率频率频率(P)(P)2 23 34 45 56 67 78 85 58 8161610106 64 41 10.100.100.160.160.320.320.200.200.120.120.080.080.020.02合计合计合计合计50501.001.00求下表中的众数求下表中的众数众众数数31求下表中的众数求下表中的众数求下表中的众数求下表中的众数32 (1)(1)众数仅受上下相邻两组频数大小的影响,不受极众数仅受上下相邻两组频数大小的影响,不受极众数仅受上下相邻两组频数大小的影响,不受极
24、众数仅受上下相邻两组频数大小的影响,不受极端值影响,对开口组仍可计算众数;端值影响,对开口组仍可计算众数;端值影响,对开口组仍可计算众数;端值影响,对开口组仍可计算众数;(2)(2)受抽样变动影响大;受抽样变动影响大;受抽样变动影响大;受抽样变动影响大;(3)(3)众数不唯一确定。众数不唯一确定。众数不唯一确定。众数不唯一确定。(4)(4)众数标示为其峰值所对应的变量值,能很容易区众数标示为其峰值所对应的变量值,能很容易区众数标示为其峰值所对应的变量值,能很容易区众数标示为其峰值所对应的变量值,能很容易区分出单峰、多峰。因而具有明显偏态集中趋势的频数分分出单峰、多峰。因而具有明显偏态集中趋势的
25、频数分分出单峰、多峰。因而具有明显偏态集中趋势的频数分分出单峰、多峰。因而具有明显偏态集中趋势的频数分布,用众数最合适。布,用众数最合适。布,用众数最合适。布,用众数最合适。3.众数的性质众数的性质33第四节第四节 几何平均数、调和平均数(了解)几何平均数、调和平均数(了解)1.1.几何平均数几何平均数几何平均数几何平均数MMg g (geometric mean(geometric mean )NN个变量值连乘积的个变量值连乘积的个变量值连乘积的个变量值连乘积的NN次方根。次方根。次方根。次方根。(不能有变量值为不能有变量值为不能有变量值为不能有变量值为0 0)。适用于:)。适用于:)。适用
26、于:)。适用于:(1)(1)计算某种比率的平均数;计算某种比率的平均数;计算某种比率的平均数;计算某种比率的平均数;(2)(2)计算大计算大计算大计算大致具有几何级数关系的一组数字的平均数,如经济指标致具有几何级数关系的一组数字的平均数,如经济指标致具有几何级数关系的一组数字的平均数,如经济指标致具有几何级数关系的一组数字的平均数,如经济指标的平均发展速度。的平均发展速度。的平均发展速度。的平均发展速度。(1 1)简单几何平均数)简单几何平均数)简单几何平均数)简单几何平均数 对数式:对数式:对数式:对数式:34(2)(2)加权几何平均数加权几何平均数加权几何平均数加权几何平均数 对数式:对数
27、式:对数式:对数式:应该指出,用以计算几何平均数的各项数值必须应该指出,用以计算几何平均数的各项数值必须应该指出,用以计算几何平均数的各项数值必须应该指出,用以计算几何平均数的各项数值必须大于大于大于大于0 0,否则就不能计算几何平均数或计算结果无实,否则就不能计算几何平均数或计算结果无实,否则就不能计算几何平均数或计算结果无实,否则就不能计算几何平均数或计算结果无实际意义。际意义。际意义。际意义。35 例例例例 求求求求3 3,9 9,2727,8181,243243这些数字的几何平均这些数字的几何平均这些数字的几何平均这些数字的几何平均数。数。数。数。解解解解 (1 1)(2 2)36 2
28、.2.调和平均数调和平均数调和平均数调和平均数MMh h (harmonic mean)(harmonic mean)N N个变量值倒数算术平均数的倒数,也称倒数平均个变量值倒数算术平均数的倒数,也称倒数平均个变量值倒数算术平均数的倒数,也称倒数平均个变量值倒数算术平均数的倒数,也称倒数平均数。数。数。数。适用于适用于适用于适用于:掌握的情况是总体标志总量而缺少总体:掌握的情况是总体标志总量而缺少总体:掌握的情况是总体标志总量而缺少总体:掌握的情况是总体标志总量而缺少总体单位数的资料时。单位数的资料时。单位数的资料时。单位数的资料时。简单调和平均数简单调和平均数简单调和平均数简单调和平均数 加
29、权调和平均数加权调和平均数加权调和平均数加权调和平均数373.3.各种平均数的关系各种平均数的关系各种平均数的关系各种平均数的关系(1)(1)当总体呈正态分布时:当总体呈正态分布时:当总体呈正态分布时:当总体呈正态分布时:(2)(2)当总体呈偏态分布时:中位数总在均数和众数之间当总体呈偏态分布时:中位数总在均数和众数之间当总体呈偏态分布时:中位数总在均数和众数之间当总体呈偏态分布时:中位数总在均数和众数之间 正偏:正偏:正偏:正偏:负偏:负偏:负偏:负偏:n n(注:注:注:注:和和和和 合称位置平均数合称位置平均数合称位置平均数合称位置平均数)(3)(3)皮尔逊发现皮尔逊发现皮尔逊发现皮尔逊发现 ,在钟形分布的偏态不大显著时,在钟形分布的偏态不大显著时,在钟形分布的偏态不大显著时,在钟形分布的偏态不大显著时,、三者大致构成一个比较固定的关系:三者大致构成一个比较固定的关系:三者大致构成一个比较固定的关系:三者大致构成一个比较固定的关系:(4)(4)、和和和和 合称数值平均数合称数值平均数合称数值平均数合称数值平均数3839
限制150内