人大版,贾俊平,第五版,统计学 第4章 数据的概括性度量.ppt
《人大版,贾俊平,第五版,统计学 第4章 数据的概括性度量.ppt》由会员分享,可在线阅读,更多相关《人大版,贾俊平,第五版,统计学 第4章 数据的概括性度量.ppt(50页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、第4章 数据的概括性度量1集中趋势的度量集中趋势的度量2离散程度的度量离散程度的度量3偏态与峰态的度量偏态与峰态的度量4.1集中趋势的度量1.一组数据向其中心值靠拢的倾向和程度2.测度集中趋势就是寻找数据一般水平的代表值或中心值3.不同类型的数据用不同的集中趋势测度值4.低层次数据的集中趋势测度值适用于高层次的测量数据,反过来,高层次数据的集中趋势测度值并不适用于低层次的测量数据5.选用哪一个测度值来反映数据的集中趋势,要根据所掌握的数据的类型来确定集中趋势集中趋势(位置位置)4.1.1 分类数据:众数1.集中趋势的测度值之一2.出现次数最多的变量值3.不受极端值的影响4.可能没有众数或有几个
2、众数5.主要用于定类数据,也可用于定序数据和数值型数据1.根据第三章例3.3中的数据,计算众数2.根据第三章例3.5中的数据,计算众数3.数值型分组数据的众数算例算例某车间某车间50名工人日加工零件数分组表名工人日加工零件数分组表按零件数分组按零件数分组频数(人)频数(人)累积频数累积频数105110110115115120120125125130130135135140358141064381630404650合计合计504.1.2 顺序数据:中位数和分位数1.中位数集中趋势的测度值之一排序后处于中间位置上的值不受极端值的影响主要用于定序数据,也可用数值型数据,但不能用于定类数据各变量值与中
3、位数的离差绝对值之和最小,即计算公式未分组数据的中位数数值型分组数据的中位数原始数据原始数据:24 22 21 26 20位位 置置:1 2 3 4 5中位数的计算中位数的计算排排 序序:20 21 22 24 26原始数据原始数据:10 5 9 12 6 8位位 置置:1 2 3 4 5 6排排 序序:5 6 8 9 10 12中位数=(8+9)/2=8.5某某车间50名工人日加工零件数分名工人日加工零件数分组表表按零件数分按零件数分组频数(人)数(人)累累积频数数105110331101155811512081612012514301251301040130135646135140450合
4、合计 50 中位数的位置=50/2=25,即中位数在120125这一组,L=120,Sm 1=16,U=125,Sm+1=20,fm=14,d=5,根据中位数公式得:2.四分位数人们经常会将数据划分为4个部分,每一个部分大约包含有1/4即25的数据项。QLQMQU25%25%25%25%1.集中趋势的测度值之一2.排序后处于25%和75%位置上的值3.不受极端值的影响4.主要用于定序数据,也可用于数值型数据,但不能用于定类数据四分位数四分位数(位置的确定位置的确定)未分组数据:未分组数据:组距分组数据:组距分组数据:下四分位数(QL)位置=N+14上四分位数(QU)位置=3(N+1)4下四分位
5、数(QL)位置=N4上四分位数(QL)位置=3N4甲城市家庭对住房状况评价的频数分布甲城市家庭对住房状况评价的频数分布回答类别回答类别甲城市甲城市户数户数 (户户)累计频数累计频数 非常不满意非常不满意 不满意不满意 一般一般 满意满意 非常满意非常满意2410893453024132225270300合计合计300计算甲城市家庭对住房满意状况评价的四分位数解:下四分位数(QL)的位置为:QL位置(300)/475 上四分位数(QL)的位置为:QU位置(3300)/4225从累计频数看,QL在“不满意”这一组别中;QU在“一般”这一组别中。因此 QL 不满意 QU 一般原始数据原始数据:23
6、21 30 32 28 25 26排排 序序:21 23 25 26 28 30 32位位 置置:1 2 3 4 5 6 7 QL=23N+17+1QL位置=4=4=2QU位置=3(N+1)43(7+1)4=6QU=30数值型未分组数据的四分位数原始数据原始数据:23 21 30 28 25 26排排 序序:21 23 25 26 28 30位位 置置:1 2 34 5 6QL=21+0.75(23-21)=22.5QL位置=N+14=6+14=1.75QU位置=3(N+1)43(6+1)4=5.25QU=28+0.25(30-28)=28.5数值型分组数据的四分位数(计算公式)上四分位数上四
7、分位数上四分位数上四分位数:下四分位数下四分位数下四分位数下四分位数:计算50 名工人日加工零件数的四分位数某车间50名工人日加工零件数分组表按零件数分组频数(人)累积频数105110110115115120120125125130130135135140358141064381630404650合计50QL位置位置50/412.5QU位置位置350/437.54.1.3 数值型数据:平均值1.集中趋势的测度值之一2.最常用的测度值3.一组数据的均衡点所在4.易受极端值的影响5.用于数值型数据,不能用于定类数据和定序数据均值(计算公式)设一组数据为:X1,X2,XN 简单均值简单均值的计算公式
8、为设分组后的数据为:X1,X2,XK 相应的频数为:F1,F2,FK加权均值加权均值的计算公式为简单均值(算例)原始数据:10591368加权均值(算例4.7)加权均值(权数对均值的影响)甲乙两组各有10名学生,他们的考试成绩及其分布数据如下 甲组:考试成绩(X):0 20 100 人数分布(F):1 1 8 乙组:考试成绩(X):0 20 100 人数分布(F):8 1 1X X甲甲01+201+100801+201+1008n n 1010i i=1=1 X Xi i 82828282(分)(分)(分)(分)X X乙乙08+201+100108+201+1001n n 1010i i=1=
9、1 X Xi i 12121212(分)(分)(分)(分)均值(数学性质)1.各变量值与均值的离差之和等于零 2.各变量值与均值的离差平方和最小几何平均数(概念要点)1.集中趋势的测度值之一2.N 个变量值乘积的 N 次方根3.适用于特殊的数据4.主要用于计算平均发展速度5.计算公式为6.可看作是均值的一种变形几何平均数(算例)【例例4.10】一位投资者持有一种股票,2001-2004年收益率分别为4.5%、2.1%、25.5%、1.9%。计算该投资者在这四年内的平均收益率。平均收益率108.0787%-1=8.0787%4.1.4众数、中位数和均值的比较1.众数、中位数和均值的关系对称分布对
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 人大版 贾俊平 第五版 统计学 第4章 数据的概括性度量 人大 贾俊平 第五 统计学 数据 概括性 度量
限制150内