第四章数据分布特征的测度优秀课件.ppt
《第四章数据分布特征的测度优秀课件.ppt》由会员分享,可在线阅读,更多相关《第四章数据分布特征的测度优秀课件.ppt(66页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、第四章数据分布特征的测度第1页,本讲稿共66页 教教学学重重点点与与难难点点:重点为各种平均指标和变异指标的概念、特点、应用条件、应用范围和计算方法。难点是不同条件下平均指标和变异指标的计算。第2页,本讲稿共66页 统计数据经过整理和显示后,对数据分布的形状和特征就可以有一个大致的了解。为进一步掌握数据分布的特征和规律,进行更深入的分析,还需要找到反映数据分布特征的各个代表值。第3页,本讲稿共66页 对一组数据分布的特征,可以从三个方面进行测度和描述:一是分布的集中趋势,反映各数据向其中心值靠拢和聚集的程度;二是分布的离散程度,反映各数据远离中心值的趋势;三是分布偏态和峰态,反映数据分布的形状
2、。这三个方面分别反映了数据分布特征的不同侧面。第4页,本讲稿共66页第一节第一节 集中趋势的测度集中趋势的测度 集中趋势是指一组数据向某一中心值靠拢的倾向,它反映了一组数据中心点的位置所在。测度集中趋势也就是寻找数据一般水平的代表值或中心值。低层次数据的集中趋势测度值适用于高层次的测量数据,反过来,高层次数据的集中趋势测度值并不适用于低层次的测量数据。因此,选用哪一个测度值来反映数据的集中趋势,要根据所掌握的数据的类型和特点来确定。第5页,本讲稿共66页 一、分类数据:众数(一、分类数据:众数(Mo)众数众数是指一组数据中出现次数最多的变量值。出现次数最多的变量值 不受极端值的影响 一组数据可
3、能没有众数或有几个众数 主要用于分类数据,也可用于顺序数据和数值型数据 第6页,本讲稿共66页无众数无众数无众数无众数原始数据原始数据:10 5 9 12 6 8:10 5 9 12 6 8一个众数一个众数一个众数一个众数原始数据原始数据:6 :6 5 5 9 8 9 8 5 55 5多多多多于于于于一一一一个个个个众众众众数数数数原始数据原始数据:25 :25 28 28 28 28 36 36 42 4242 42 从分布的角度看,众数是具有明显集中趋势点的数值,一组数据分布的最高峰点所对应的数值即为众数。当然,如果数据的分布没有明显的集中趋势或最高峰点,众数也可能不存在;如果有两个最高峰
4、点,也可以有两个众数,见P78图4-1。第7页,本讲稿共66页 二、顺序数据:中位数(二、顺序数据:中位数(Me)和分位数)和分位数 (一)中位数(一)中位数 中位数是一组数据排序排序后,处于中间位置上的变量值。中位数是一个位置代表值,它主要用于测度顺序数据的集中趋势,当然也适用于作为数值型数据的集中趋势,但不适用于分类数据。第8页,本讲稿共66页 根据未分组数据计算中位数时,要先对数据进行排序,然后确定中位数的位置,其公式为:中位数位置第9页,本讲稿共66页 对于分类型数据分类型数据,中位数的位置为:中位数位置若项数为奇数,则居于中间位置的那个标志值即为中位数。若项数为偶数,则居于中间位置的
5、两项数值的平均数即为中位数。第10页,本讲稿共66页【例】:【例】:【例】:【例】:9 9个家庭的人均月收入数据个家庭的人均月收入数据原始数据原始数据原始数据原始数据:1500 750 780 1080 850 960 2000 1250 16301500 750 780 1080 850 960 2000 1250 1630排排排排 序序序序:750 780 850 960 750 780 850 960 1080 1080 1250 1500 1630 2000 1250 1500 1630 2000位位位位 置置置置:1 2 3 4 1 2 3 4 5 5 6 7 8 9 6 7 8 9
6、 位置位置=(n+1)=(n+1)2=(9+1)2=(9+1)2=5 2=5 中位数中位数=1080=1080【例】【例】【例】【例】:1010个家庭的人均月收入数据个家庭的人均月收入数据排排排排 序序序序:660660 750 780 850 750 780 850 960 1080960 1080 1250 1500 1630 2000 1250 1500 1630 2000位位位位 置置置置:1 2 3 4 1 2 3 4 5 6 5 6 7 8 9 10 7 8 9 10 位置位置=(n+1)=(n+1)2=(10+1)2=(10+1)2=5.5 2=5.5 中位数中位数=(960+1
7、080960+1080)2=10202=1020对于数值型数据数值型数据,也可以计算中位数:第11页,本讲稿共66页(二)分位数(二)分位数 四分位数、十分位数和百分位数分别是用3个点、9个点和99个点将数据4等分、10等分和100等分后各分位点上的值。四分位数,“四分位点”,是通过三个点将全部数据等分为四部分,其中每部分包含25的数据,处在分位点上的数值就是四分位数。25%25%25%25%25%25%25%25%QQMMQQU UQQL L下四分位数中位数上四分位数第12页,本讲稿共66页对于分类数据,各四分位数的位置分别为:当四分位数的位置不在某一个数值上时,可根据四分位数的位置,按比例
8、分摊四分位数位置两侧数值的差值。第13页,本讲稿共66页【例】:【例】:【例】:【例】:9 9个家庭的人均月收入数据个家庭的人均月收入数据原始数据原始数据原始数据原始数据:1500 750 780 1080 850 960 2000 1250 16301500 750 780 1080 850 960 2000 1250 1630排排排排 序序序序:750 780 850 960 1080 1250 1500 1630 2000750 780 850 960 1080 1250 1500 1630 2000位位位位 置置置置:1 1 2 32 3 4 5 6 4 5 6 7 87 8 9 9Q
9、QL LQQL LQQL LQQL LQQU UQQU UQQU UQQU U【例】:【例】:【例】:【例】:1010个家庭的人均月收入数据个家庭的人均月收入数据排排排排 序序序序:660660 750 780 850 960 1080 1250 1500 1630 2000750 780 850 960 1080 1250 1500 1630 2000位位位位 置置置置:1 1 2 32 3 4 4 5 6 7 5 6 7 8 98 9 10 10 第14页,本讲稿共66页 三、数值型数据:均值三、数值型数据:均值均值均值也称为算术平均数,是全部数据的算术平均。均值在统计学中具有重要的地位,
10、是集中趋势的最主要测度值,它主要适用于数值型数据,而不适用于分类和顺序数据。根据所掌握数据的不同,均值有不同的计算形式和计算公式。第15页,本讲稿共66页 (一)算术平均数的基本形式(一)算术平均数的基本形式算术平均数第16页,本讲稿共66页 (二)简单算术平均数(二)简单算术平均数当掌握的资料是未分组未分组的总体各单位的标志值时,则将各单位的标志值简单相加得出标志总量,然后各单位的标志值简单相加得出标志总量,然后在除以总体单位数之和,这种计算平均数的方法称为简单算术平均数。第17页,本讲稿共66页其公式为:第18页,本讲稿共66页 (三)加权算术平均数(三)加权算术平均数当掌握的资料已经分组
11、,且各组出现的次数不同时,则采用加权算术平均数。各组的组中值为:M1,M2,Mk第19页,本讲稿共66页例:某企业某车间工人每天生产产品资料如表4-1:表表4-1按每人生产件数分组工人数(人)产品数(件)xfxf18192021221013382415180247760504330合计1002021根据上表资料,计算平均每人生产产品件数:第20页,本讲稿共66页简单算术平均数的数值大小只与变量值的大小有关。加权算术平均数的数值大小不仅受各组组中值大小的影响,而且受各组变量值出现的频数及权数大小的影响。如果某一组的权数较大,说明该组的数据较多,那么该组数据的大小对均值的影响就越大,反之则越小。第
12、21页,本讲稿共66页 加权算术平均数应注意几个问题:加权算术平均数应注意几个问题:1、加权算术平均数的权数可以是绝对数,亦可以是比重;上例的权数为绝对数。现举例说明比重权数,例如下表资料:第22页,本讲稿共66页表4-2按每人生产件数分组x工人比重()181920212210133824151.802.477.605.043.30合计10020.21平均每人生产产品件数=第23页,本讲稿共66页2、根据组距数列计算加权算术平均数例某企业某车间工人生产产品资料如表4-3:表4-3按每人生产产品数量分组(公斤)工人数f组中值xxf20-3030-4040-5050以上20708030253545
13、55500245036001650合计2008200第24页,本讲稿共66页 用组中值计算出来的平均数,只能是平均数的近似值,而不是平均数的真值。第25页,本讲稿共66页3、若各组单位数相等,即f1=f2=fn,则加权算术平均数计算公式与简单算术平均数存在下面关系:可见,简单算术平均数是加权算术平均数的一个特例。第26页,本讲稿共66页 (四)算术平均数的数学性质(四)算术平均数的数学性质均值在统计学中具有重要的地位,它是进行统计分析和统计推断的基础。首先,从统计思想上看,均值是一组数据的重心所在,是数据误差相互抵消后的必然性结果。比如对同一事物进行多次测量,若所得结果不一致,可能是由于测量误
14、差所致,也可能是其他因素的偶然影响,利用均值作为其代表值,则可以使误差相互抵消,反映出事物必然性的数量特征。其次,均值具有下面一些重要的数学性质,这些数学性质在实际中有着广泛的应用,体现了均值的统计思想。第27页,本讲稿共66页算术平均数最重要的两个数学性质是:1.各变量值与平均数的离差之和等于零,即:简单算术平均数:加权算术平均数:第28页,本讲稿共66页 2.各变量值与平均数的离差的平方和为最小值,即:简单算术平均数:加权算术平均数:证明见P84。第29页,本讲稿共66页(五)均值的另一种表现形式:调和平均数(五)均值的另一种表现形式:调和平均数调和平均数是算术平均数的另一种表现形式,用表
15、示。在实际工作中,由于所获得的数据的不同,有时不能直接采用均值的计算公式来计算平均数,这就需要使用调和平均数的形式进行计算,二者实质上是相同的,而仅有形式上的区别。第30页,本讲稿共66页其计算公式为:需要注意的是,当数据中出现“0”时不宜计算调和平均数。第31页,本讲稿共66页例如,某企业工人月奖金额如表4-4:表4-4按月奖金等级分组奖金额(元/人)(x)奖金总额(元)(m)工人数(人)(m/x)一等二等三等220180100220007560028000100420280合计125600800第32页,本讲稿共66页 (六)一种特殊的均值:几何平均数(六)一种特殊的均值:几何平均数统计几
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 第四 数据 分布 特征 测度 优秀 课件
限制150内