用样本的数字特征估计总体的数字特征第一课时.ppt





《用样本的数字特征估计总体的数字特征第一课时.ppt》由会员分享,可在线阅读,更多相关《用样本的数字特征估计总体的数字特征第一课时.ppt(30页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、用样本的数字特征估计总体的数字特征第一课时 Still waters run deep.流静水深流静水深,人静心深人静心深 Where there is life,there is hope。有生命必有希望。有生命必有希望一、众数、中位数、平均数一、众数、中位数、平均数1、众数众数 在一组数据中,出现次数最多的数在一组数据中,出现次数最多的数据叫做这一组数据的众数。据叫做这一组数据的众数。2、中位数中位数 将一组数据按大小依次排列,将一组数据按大小依次排列,把处在最中间位置的一个数据(或两个数据把处在最中间位置的一个数据(或两个数据的平均数)叫做这组数据的中位数。的平均数)叫做这组数据的中位数
2、。3、平均数平均数 (1)x=1/n(x1+x2+xn)练习练习:在一次中学生田径运动会上,在一次中学生田径运动会上,参加男子跳高的参加男子跳高的17名运动员的成绩如下名运动员的成绩如下表所示:表所示:成成绩绩(单单位:米位:米)1.50 1.60 1.651.701.751.801.851.90人数人数23234111分别求这些运动员成绩的众数,中位数与分别求这些运动员成绩的众数,中位数与平均数平均数 解:在解:在17个数据中,个数据中,1.75出现了出现了4次,出现的次,出现的次数最多,即这组数据的众数是次数最多,即这组数据的众数是1.75上面表里的上面表里的17个数据可看成是按从小到大的
3、个数据可看成是按从小到大的顺序排列的,其中第顺序排列的,其中第9个数据个数据1.70是最中间的一是最中间的一个数据,即这组数据的中位数是个数据,即这组数据的中位数是1.70;这组数据的平均数是这组数据的平均数是答:答:17名运动员成绩的众数、中位数、平均数名运动员成绩的众数、中位数、平均数依次是依次是1.75(米)、(米)、1.70(米)、(米)、1.69(米)(米).二二、众数、中位数、平均数众数、中位数、平均数与频率分布直方图的关系与频率分布直方图的关系 1、众数在样本数据的频率分布直方图众数在样本数据的频率分布直方图中,就是最高矩形的中点的横坐标。中,就是最高矩形的中点的横坐标。例如,在
4、上一节调查的例如,在上一节调查的100位居民的月位居民的月均用水量的问题中,从这些样本数据的频率均用水量的问题中,从这些样本数据的频率分布直方图可以看出,月均用水量的众数是分布直方图可以看出,月均用水量的众数是2.25t.如图所示:如图所示:频率分布直方图如下频率分布直方图如下:月均用水量月均用水量/t频率频率组距组距0.100.200.300.400.500.511.5 22.533.544.5 2、在样本中,有在样本中,有50的个体小于或等于中位数,也有的个体小于或等于中位数,也有50的的个体大于或等于中位数个体大于或等于中位数,因此,因此,在频率分布直方图中,中位数左在频率分布直方图中,
5、中位数左边和右边的直方图的面积应该相等边和右边的直方图的面积应该相等,由此可以估计中位数的值。,由此可以估计中位数的值。下图中虚线代表居民月均用水量的中位数的估计值,此数据值为下图中虚线代表居民月均用水量的中位数的估计值,此数据值为2.02t.月均用水量月均用水量/t频率频率组距组距0.100.200.300.400.500.511.5 22.533.544.5说明说明:2.03这个中位数的估计值这个中位数的估计值,与样本与样本的中位数值的中位数值2.0不一样不一样,这是因为样本数这是因为样本数据的频率分布直方图据的频率分布直方图,只是直观地表明只是直观地表明分布的形状分布的形状,但是从直方图
6、本身得不出但是从直方图本身得不出原始的数据内容原始的数据内容,所以由频率分布直方所以由频率分布直方图得到的中位数估计值往往与样本的图得到的中位数估计值往往与样本的实际中位数值不一致实际中位数值不一致.3.可以从频率分布直方图中估计平均数可以从频率分布直方图中估计平均数 平均数是频率分布直方图中每个小矩形的面积乘以小矩形底边平均数是频率分布直方图中每个小矩形的面积乘以小矩形底边中点的横坐标之和中点的横坐标之和月均用水量月均用水量/t频率频率组距组距0.100.200.300.400.500.511.5 22.533.544.50.250.04+0.750.08+1.250.15+1.750.25
7、0.04+0.750.08+1.250.15+1.750.22+2.250.25+2.750.14+3.25 0.22+2.250.25+2.750.14+3.25 0.06+3.750.04+4.250.02=2.020.06+3.750.04+4.250.02=2.02(t t).平均数是平均数是2.02.2.02.平均数与中位数相等,是必然还是巧合?平均数与中位数相等,是必然还是巧合?0.250.25,0.750.75,1.251.25,1.751.75,2.252.25,2.752.75,3.253.25,3.753.75,4.25.4.25.频率分布直方图如下频率分布直方图如下:月均
8、用水量月均用水量/t频率频率组距组距0.100.200.300.400.500.511.5 22.533.544.5三三 三种数字特征的优缺点三种数字特征的优缺点 1、众数体现了样本数据的最大集中、众数体现了样本数据的最大集中点,但它对其它数据信息的忽视使得无点,但它对其它数据信息的忽视使得无法客观地反映总体特征法客观地反映总体特征.如上例中众数是如上例中众数是2.25t,它告诉我们它告诉我们,月均用水量为月均用水量为2.25t的的居民数比月均用水量为其它数值的居民居民数比月均用水量为其它数值的居民数多数多,但它并没有告诉我们多多少但它并没有告诉我们多多少.2、中位数是样本数据所占频率、中位数
9、是样本数据所占频率的等分线,它不受少数几个极端值的的等分线,它不受少数几个极端值的影响,这在某些情况下是优点,但它影响,这在某些情况下是优点,但它对极端值的不敏感有时也会成为缺点。对极端值的不敏感有时也会成为缺点。如上例中假设有某一用户月均用水量如上例中假设有某一用户月均用水量为为10t,那么它所占频率为,那么它所占频率为0.01,几乎几乎不影响中位数不影响中位数,但显然这一极端值是不但显然这一极端值是不能忽视的。能忽视的。3、由于平均数与每一个样本的、由于平均数与每一个样本的数据有关,所以任何一个样本数据的数据有关,所以任何一个样本数据的改变都会引起平均数的改变,这是众改变都会引起平均数的改
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 样本 数字 特征 估计 总体 第一 课时

限制150内