《用样本的数字特征估计总体的数字特征1.ppt》由会员分享,可在线阅读,更多相关《用样本的数字特征估计总体的数字特征1.ppt(14页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、 第二章第二章 统计统计2.2.2 2.2.2 用样本的数字特征估计用样本的数字特征估计 总体的数字特征总体的数字特征一、众数、中位数、平均数一、众数、中位数、平均数1、众数众数 在一组数据中,出现次数最多的数据叫做在一组数据中,出现次数最多的数据叫做这一组数据的众数。这一组数据的众数。2 2、中位数中位数 将一组数据按大小依次排列,把处在最将一组数据按大小依次排列,把处在最中间位置的一个数据(或两个数据的平均数)叫做中间位置的一个数据(或两个数据的平均数)叫做这组数据的中位数。这组数据的中位数。3、平均数平均数 (1)x = 1/n(xx = 1/n(x1 1+x+x2 2+x+xn n)
2、) 练习练习: : 在一次中学生田径运动会上,参加男子跳高在一次中学生田径运动会上,参加男子跳高的的1717名运动员的成绩如下表所示:名运动员的成绩如下表所示:成绩成绩(单位:单位:米米)1.50 1.60 1.65 1.70 1.75 1.80 1.85 1.90人数人数23234111分别求这些运动员成绩的众数,中位数与平均数分别求这些运动员成绩的众数,中位数与平均数 解:在解:在1717个数据中,个数据中,1.751.75出现了出现了4 4次,出现的次数最次,出现的次数最多,即这组数据的众数是多,即这组数据的众数是1.751.75上面表里的上面表里的1717个数据可看成是按从小到大的顺序
3、排个数据可看成是按从小到大的顺序排列的,其中第列的,其中第9 9个数据个数据1.701.70是最中间的一个数据,即这是最中间的一个数据,即这组数据的中位数是组数据的中位数是1.701.70;这组数据的平均数是这组数据的平均数是答:答:1717名运动员成绩的众数、中位数、平均数依次是名运动员成绩的众数、中位数、平均数依次是1.751.75(米)、(米)、1.701.70(米)、(米)、1.691.69(米)(米). . 二二 、众数、中位数、平均数与频率分布直、众数、中位数、平均数与频率分布直 方图的关系方图的关系1 1、众数在样本数据的频率分布直方图中,就是最高矩众数在样本数据的频率分布直方图
4、中,就是最高矩形的中点的横坐标。形的中点的横坐标。 例如,在上一节调查的例如,在上一节调查的100100位居民的月均用水量的位居民的月均用水量的问题中,从这些样本数据的频率分布直方图可以看出,问题中,从这些样本数据的频率分布直方图可以看出,月均用水量的众数是月均用水量的众数是2.25t.2.25t.如图所示:如图所示:频率分布直方图如下频率分布直方图如下:月均用水量月均用水量/t频率频率组距组距0.100.200.300.400.500.511.5 22.533.544.5点)众数(最高的矩形的中 2 2、在样本中,有在样本中,有5050的个体小于或等于中的个体小于或等于中位数,也有位数,也有
5、5050的个体大于或等于中位数的个体大于或等于中位数,因此,因此,在频率分布直方图中,中位数左边和右边的直方图在频率分布直方图中,中位数左边和右边的直方图的面积应该相等的面积应该相等,由此可以估计中位数的值。下图,由此可以估计中位数的值。下图中虚线代表居民月均用水量的中位数的估计值,此中虚线代表居民月均用水量的中位数的估计值,此数据值为数据值为2.02t. 2.02t. 频率分布直方图如下频率分布直方图如下:月均用水量月均用水量/t频率频率组距组距0.100.200.300.400.500.511.5 22.533.544.5中位数说明说明: :2.022.02这个中位数的估计值这个中位数的估
6、计值, ,与样本的中位数值与样本的中位数值2.02.0不一样不一样, ,这是因为样本数据的频率分布直方图这是因为样本数据的频率分布直方图, ,只只是直观地表明分布的形状是直观地表明分布的形状, ,但是从直方图本身得不但是从直方图本身得不出原始的数据内容出原始的数据内容, ,所以由频率分布直方图得到的所以由频率分布直方图得到的中位数估计值往往与样本的实际中位数值不一致中位数估计值往往与样本的实际中位数值不一致. . 3. 3. 可以从频率分布直方图中估计平均数可以从频率分布直方图中估计平均数 平均数的估计值平均数的估计值= =频率分布直方图中每个小矩形的面积频率分布直方图中每个小矩形的面积乘以小
7、矩形底边中点的横坐标之和乘以小矩形底边中点的横坐标之和三、众数、中位数、平均数的简单应用三、众数、中位数、平均数的简单应用例例1. 1. 某工厂人员及工资构成如下:某工厂人员及工资构成如下:人员人员经理经理 管理人员管理人员 高级技工高级技工 工人工人学徒学徒 合计合计周工资周工资22002200 250250220220200200100100人数人数1 16 65 510101 12323合计合计22002200 15001500110011002000200010010069006900(1 1)指出这个问题中周工资的众数、中位数、平均数)指出这个问题中周工资的众数、中位数、平均数(2
8、2)这个问题中,工资的平均数能客观地反映该厂)这个问题中,工资的平均数能客观地反映该厂的工资水平吗?为什么?的工资水平吗?为什么?分析:分析:(1 1)众数为众数为200200,中位数为,中位数为220220,平均数为,平均数为300300。(2 2)因平均数为)因平均数为300300,由表格中所列出的数据可,由表格中所列出的数据可见,只有经理在平均数以上,其余的人都在平均见,只有经理在平均数以上,其余的人都在平均数以下,故用平均数不能客观真实地反映该工厂数以下,故用平均数不能客观真实地反映该工厂的工资水平。的工资水平。思考:一组数据的中位数一般不受少数几个极端值的影思考:一组数据的中位数一般
9、不受少数几个极端值的影响,这在某些情况下是一个优点,但它对极端值的不敏响,这在某些情况下是一个优点,但它对极端值的不敏感有时也会成为缺点,你能举例说明吗?样本数据的平感有时也会成为缺点,你能举例说明吗?样本数据的平均数大于(或小于)中位数说明什么问题?你怎样理解均数大于(或小于)中位数说明什么问题?你怎样理解“我们单位的收入水平比别的单位高我们单位的收入水平比别的单位高”这句话的含义?这句话的含义? 如:样本数据收集有个别差错不影响中位数;大学如:样本数据收集有个别差错不影响中位数;大学毕业生凭工资中位数找单位可能收入较低毕业生凭工资中位数找单位可能收入较低. . 平均数大于(或小于)中位数,说明样本数据平均数大于(或小于)中位数,说明样本数据中存在许多较大(或较小)的极端值中存在许多较大(或较小)的极端值. . 这句话具有模糊性甚至蒙骗性,其中收入水平这句话具有模糊性甚至蒙骗性,其中收入水平是员工工资的某个中心点,它可以是众数、中位数是员工工资的某个中心点,它可以是众数、中位数或平均数或平均数. .
限制150内