用样本的数字特征估计总体的数字特征--中位数、众数、平均数.ppt
-
资源ID:65373023
资源大小:889.50KB
全文页数:20页
- 资源格式: PPT
下载积分:10金币
快捷下载
会员登录下载
微信登录下载
三方登录下载:
微信扫一扫登录
友情提示
2、PDF文件下载后,可能会被浏览器默认打开,此种情况可以点击浏览器菜单,保存网页到桌面,就可以正常下载了。
3、本站不支持迅雷下载,请使用电脑自带的IE浏览器,或者360浏览器、谷歌浏览器下载即可。
4、本站资源下载后的文档和图纸-无水印,预览文档经过压缩,下载后原文更清晰。
5、试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓。
|
用样本的数字特征估计总体的数字特征--中位数、众数、平均数.ppt
一一、求求极差极差,即数据中最大值与最小值的差,即数据中最大值与最小值的差二、决定二、决定组距组距与组数与组数 :组数:组数=极差极差/组距组距三、分组三、分组,通常对组内数值所在区间,通常对组内数值所在区间,取取左闭右开左闭右开区间区间,最后一组取闭区间最后一组取闭区间四、登记四、登记频数频数,计算计算频率频率,列出列出频率分布表频率分布表五、画出五、画出频率分布直方图频率分布直方图(纵轴表示(纵轴表示频率组距频率组距)复习回顾复习回顾画频率分布直方图的步骤画频率分布直方图的步骤:连接频率分布直方图中各小长方形上端的中点连接频率分布直方图中各小长方形上端的中点,得到得到频率分布折线图频率分布折线图总总体体密密度度曲曲线线反反映映了了总总体体在在各各个个范范围围内内取取值值的的百百分分比比,精精确确地地反反映映了了总总体体的的分分布布规规律律。是是研研究究总总体体分布的工具分布的工具.画茎叶图的步骤画茎叶图的步骤:(1)(1)将每个数据分为茎将每个数据分为茎(高位高位)和叶和叶(低位低位)两部分两部分;(2)(2)将最小茎和最大茎之间的数按大小次序排成一列将最小茎和最大茎之间的数按大小次序排成一列,写在一侧写在一侧;(3)(3)将各个数据的叶按大小次序写在其茎的另一侧将各个数据的叶按大小次序写在其茎的另一侧.中位数中位数:将一组数据按大小依次排列,把处在:将一组数据按大小依次排列,把处在最中间位置的一个数据(或最中间两个数据的最中间位置的一个数据(或最中间两个数据的平均数)叫做这组数据的中位数平均数)叫做这组数据的中位数 众数众数:在一组数据中,出现次数最多的数据叫:在一组数据中,出现次数最多的数据叫做这组数据的众数做这组数据的众数 二、众数、中位数、平均数与频率二、众数、中位数、平均数与频率分布直方图的关系分布直方图的关系问题问题:在上一节抽样调查的在上一节抽样调查的100位居民位居民的月均用水量的数据中,我们如何得的月均用水量的数据中,我们如何得知这一组样本数据的众数、中位数和知这一组样本数据的众数、中位数和平均数?平均数?取最高矩形下取最高矩形下端端中点的横坐标中点的横坐标2.25作为众数作为众数.因为在频率分布直方图中,各小长方形的面积表示相应各组的频率,也显示出样本数据落在各小组的比例的大小,所以从图中可以看到,在区间2,2.5)的小长方形的面积最大,即这组的频率是最大的,也就是说月均用水量在区间2,2.5)内的居民最多,即众数就是在区间2,2.5)内.众数在样本数据的频率分布直方图中,就是最高矩形的中点的横坐标.频率频率组距组距0.10.20.30.40.5O 0.5 1 1.5 2 2.5 3 3.5 4 4.5 月平均用水量(t)分析:在样本数据中,有分析:在样本数据中,有的个体小于或等于中位数,的个体小于或等于中位数,也有的个体大于或等于中也有的个体大于或等于中位数位数.因此因此,在频率分布直方在频率分布直方图中图中,矩形的面积大小正好矩形的面积大小正好表示频率的大小,即中位表示频率的大小,即中位数左边和右边的直方图的数左边和右边的直方图的面积应该相等面积应该相等.频率频率组距组距0.10.20.30.40.5O 0.5 1 1.5 2 2.5 3 3.5 4 4.5 月平均用水量(t)频率频率组距组距0.10.20.30.40.5O 0.5 1 1.5 2 2.5 3 3.5 4 4.5 月平均用水量(t)思考七、思考七、将频率分将频率分布直方图中每个小布直方图中每个小矩形的面积与小矩矩形的面积与小矩形底边中点的横坐形底边中点的横坐标之积相加,就是标之积相加,就是样本数据的估值平样本数据的估值平均数均数.由此估计总体由此估计总体的平均数是什么?的平均数是什么?频率分布直方图损失了一些样本数据,得到的是一个频率分布直方图损失了一些样本数据,得到的是一个估计值,且所得估值与数据分组有关估计值,且所得估值与数据分组有关.注:注:在只有样本频率分布直方图的情况下,我们可以按上述方在只有样本频率分布直方图的情况下,我们可以按上述方法估计众数、中位数和平均数,并由此估计总体特征法估计众数、中位数和平均数,并由此估计总体特征.思考九、思考九、一组数据的中位数一般不受少数几个极端值一组数据的中位数一般不受少数几个极端值的影响,这在某些情况下是一个优点,但它对极端值的影响,这在某些情况下是一个优点,但它对极端值的不敏感有时也会成为缺点,你能举例说明吗?的不敏感有时也会成为缺点,你能举例说明吗?如:样本数据收集有个别差错不影响中位数;如:样本数据收集有个别差错不影响中位数;大学毕业生凭工资中位数找单位可能收入较低大学毕业生凭工资中位数找单位可能收入较低.思考十、思考十、样本数据的平均数大于(或小于)中位数样本数据的平均数大于(或小于)中位数说明什么问题?说明什么问题?平均数大于(或小于)中位数,说明样本数据中存在许多较大平均数大于(或小于)中位数,说明样本数据中存在许多较大(或较小)的极端值(或较小)的极端值.思考十一、思考十一、怎样理解怎样理解“我们单位的收入水平比别的单位高我们单位的收入水平比别的单位高”这这句话的含义?句话的含义?这句话具有模糊性甚至蒙骗性,其中收入水平是员工工资这句话具有模糊性甚至蒙骗性,其中收入水平是员工工资的某个中心点,它可以是众数、中位数或平均数的某个中心点,它可以是众数、中位数或平均数.对众数,中位数,平均数估计总体数字特征的认识:对众数,中位数,平均数估计总体数字特征的认识:1 1、样本众数通常用来表示分类变量的中心值,比较容易计算,但是它只能表、样本众数通常用来表示分类变量的中心值,比较容易计算,但是它只能表示样本数据中的很少一部分信息示样本数据中的很少一部分信息.2 2、中位数不受少数几个极端值的影响,容易计算,它仅利用了数据排在中间、中位数不受少数几个极端值的影响,容易计算,它仅利用了数据排在中间的数据的信息的数据的信息.3 3、样本平均数与每个样本数据有关,所以,任何一个样本数据的改变都会引、样本平均数与每个样本数据有关,所以,任何一个样本数据的改变都会引起平均数的改变起平均数的改变.这是中位数,众数都不具有的性质,也正因为这个原因,与这是中位数,众数都不具有的性质,也正因为这个原因,与众数,中位数比较起来,平均数可以反映出更多的关于样本数据全体的信息众数,中位数比较起来,平均数可以反映出更多的关于样本数据全体的信息.例:某公司的33名职工的月工资(单位:元)如下表:(1)求该公司职工月工资的平均数、中位数、众数.(2)若董事长、副董事长的工资分别从5500元、5000元提升到30000元、20000元,那么公司职工新的平均数、中位数和众数又是什么?(3)你认为哪个统计量更能反映这个公司员工的工资水平?职务 董事长副董事长 董事总经理 经理管理职员人数11215320工资5500500035003000250020001500解析:(1)公司职工月工资的平均数约为2091(元),若把所有数据从大到小排序,则得到:中位数是1500元,众数是1500元.(2)若董事长、副董事长的工资提升后,职工月工资的平均数约为:3288(元),中位数是1500元,众位是1500元.(3)在这个问题中,中位数和众数都能反映出这个公司员工的工资水平,因为公司少数人的工资额与大多数人的工资额差别较大,这样导致平均数与中位数偏差较大,所以平均数不能反映这个公司员工的工资水平.课堂练习:课堂练习:应该采用平均数来表示每一个国家项目的平均金额,应该采用平均数来表示每一个国家项目的平均金额,因为它能反映所有项目的信息。但平均数会受到极因为它能反映所有项目的信息。但平均数会受到极端数据端数据2200万元的影响,所以大多数项目投资金额万元的影响,所以大多数项目投资金额都和平均数相差比较大。都和平均数相差比较大。1 1、众数:在样本数据的频率分布直方图中,就是最、众数:在样本数据的频率分布直方图中,就是最高矩形的中点的横坐标。高矩形的中点的横坐标。2 2、特点、特点:众数体现了样本数据的最大集中点,但它对其它数众数体现了样本数据的最大集中点,但它对其它数据信息的忽视使得无法客观地反映总体特征据信息的忽视使得无法客观地反映总体特征.3 3、中位数:左边和右边的直方图的面积应该相等,、中位数:左边和右边的直方图的面积应该相等,由此可以估计中位数的值。由此可以估计中位数的值。4 4、特点:、特点:中位数易计算,能较好地表现数据信息;中位数易计算,能较好地表现数据信息;中位中位数不受少数几个极端值的影响;数不受少数几个极端值的影响;常用于计算数据质量较差时。常用于计算数据质量较差时。5 5、平均数:是频率分布直方图的、平均数:是频率分布直方图的“重心重心”,等于频率分布,等于频率分布直方图中每个小矩形的面积乘以小矩形底边中点横坐标之和。直方图中每个小矩形的面积乘以小矩形底边中点横坐标之和。课堂小结:课堂小结:6 6、特点:、特点:平均数与每一个样本的数据有关,所以任何一个平均数与每一个样本的数据有关,所以任何一个样本数据的改变都会引起平均数的改变;样本数据的改变都会引起平均数的改变;平均数可以反映出平均数可以反映出更多的关于样本数据全体的信息;更多的关于样本数据全体的信息;平均数受数据中的极端值平均数受数据中的极端值的影响较大,使平均数在估计时可靠性降低。的影响较大,使平均数在估计时可靠性降低。三种数字特征的优缺点三种数字特征的优缺点:1 1、众数体现了样本数据的最大集中点,但它对其它、众数体现了样本数据的最大集中点,但它对其它数据信息的忽视使得无法客观地反映总体特征数据信息的忽视使得无法客观地反映总体特征.2 2、中位数它不受少数几个极端值的影响,这在某些情况下是、中位数它不受少数几个极端值的影响,这在某些情况下是优点,但它对极端值的不敏感有时也会成为缺点。优点,但它对极端值的不敏感有时也会成为缺点。3 3、由于平均数与每一个样本的数据有关,所以任何、由于平均数与每一个样本的数据有关,所以任何一个样本数据的改变都会引起平均数的改变,这是众一个样本数据的改变都会引起平均数的改变,这是众数、中位数都不具有的性质。也正因如此数、中位数都不具有的性质。也正因如此 ,与众数、,与众数、中位数比较起来,平均数可以反映出更多的关于样本中位数比较起来,平均数可以反映出更多的关于样本数据全体的信息,但平均数受数据中的极端值的影响数据全体的信息,但平均数受数据中的极端值的影响较大,使平均数在估计时可靠性降低。较大,使平均数在估计时可靠性降低。