9.2 用样本估计总体 -(人教A版2019选择性必修第二、三册)(教师版).docx
《9.2 用样本估计总体 -(人教A版2019选择性必修第二、三册)(教师版).docx》由会员分享,可在线阅读,更多相关《9.2 用样本估计总体 -(人教A版2019选择性必修第二、三册)(教师版).docx(15页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、用样本估计总体知识剖析1总体取值规律的估计频率直方图(1)画频率直方图的步骤求极差-决定组距与组数-将数据分组-列频率分布表-画频率分布直方图.(2)小长方形的面积=频率 (3)在直方图中,各小长方形的面积之和等于1.2总体百分位数的估计第p百分位数的概念 一般地,一组数据的第p百分位数是这样一个值,它使得这组数据中至少有p%的数据小于或等于这个值,且 至少有(100 - p)%的数据大于或等于这个值.计算一组九个数据的第p百分位数 第一步:按从小到大排列原始数据;第二步:计算i = nxp%;第三步:若i不是整数,而大于i的比邻整数为则第P百分位数为第7项数据;若i是整数,则第p百分位数为
2、第i项与第。+ 1)项数据的平均数.四分位数的概念 四分位数:包含第25百分位数,第50百分位数,第75百分位数.中位数相当于第50百分位数,第25百分位数也称为第一四分位数或下四分位数,第75百分位数也称为第三 四分位数或上四分位数.3总体集中趋势的估计般来说,对一个单峰的频率分布直方图来说,如果直方图的形状是对称的,那么平均数和中位数应该大体 上差不多;如果直方图在右边“拖尾”,那么平均数大于中位数;如果直方图在左边“拖尾”,那么平均数小于 中位数.,中位数要平分直方图的面积,. 0.4 + 0.03(% - 70) = 0.5 解得k73.即中位数为73. 频率最大的是70,80组,则众
3、数是75; 利用组中值估算抽样学生的平均分为:45Tl + 55/2 + 65/3 + 75f4 + 85% + 95人45 x 0.1 + 55 x 0.15 + 65 x 0.15 + 75 x 0.3 + 85 x 0.25 + 95 x 0.05 = 71估计这次考试的平均分是71(分).方 差 S2 = (45 - 71)2 x 0.1 +(55 71)2 x 0.15 + (65 - 71)2 x 0.15 + (75 - 71)2 x 0.3 +(85 71)2 x 0.25 + (95 - 71)2 x 0.05 = 194.【点拨】 利用频率之和为1,得到所有矩形面积之和为1
4、;在频率直方图中 众数=最高那组的组中值;平均数=每组的组中值x每组的面积之和;方差=(每组的组中值-平均数X每组的概率之和;中位数:设中位数为小,则直线X能够把所有矩形的面积平分,即在直线 =血左边的矩形面积为05巩固练习1. ()为了 了解某种进口茶叶的质量(单位:克),从中抽取若干包进行检查,获得样本的频率分布直方图如 图所示.若已知样本中质量在1555160.5)内的茶叶有10包,则样本容量为()C. 70C. 70D. 50【答案】D【解析】,样本中质量在1555160.5)内的茶叶有10包,由频率分布直方图得质量在1555160.5)内的频率为0.04 x 5 = 0.2,.样本容
5、量几=竺=50.故选:D.0.22. ()某市高三数学抽样考试中,对90分以上(含90分)的成绩进行统计,其频率分布图如图所示,若 130140分数段的人数为90人,则90100分数段的人数为()【答案】C【解析】根据频率分布直方图,得,130140分数段的人数为90人,对应的频率是0.05,.样本容量是a=1800;.90100分数段的人数1800 X 0.40 = 720.故选:C.3.(*)某市要对辖区内的中学教师的年龄进行调查,现从中随机抽出200名教师,已知抽到的教师年龄都 在25, 50)岁之间,根据调查结果得出教师的年龄情况残缺的频率分布直方图如图所示,利用这个残缺的频 率分布直
6、方图估计该市辖区内中学教师的年龄的中位数大约是()嫉一0307060504030201。1 1 1 OOOOOOOO赢勿25 30 35 40 45 50 年机岁)A. 37.1 岁 B. 38.1 岁 C. 38.7 岁 D. 43.1 岁【答案】B【解析】根据频率和等于1,得;年龄在30,35)岁之间的频率为1 - (0.01 + 0.08 + 0.05 + 0.02) x 5 = 0.2 , 0.01 x 5 + 0.2 = 0.25 0.5, 令0.25 + 0.08xx = 0.5,解得x = 3.125; .该市辖区内中学教师的年龄的中位数大约35 + 3.125 x 38.1岁.
7、故选:B.4.()(多选)为了解某地农村经济情况,对该地农户家庭年收入进行抽样调查,将农户家庭年收入的调A.估计该地农户家庭年收入不低于8.5万元的农户比例为30%B.估计该地农户家庭年收入的第三四分位数为9万元C.估计该地农户家庭年收入的平均值不超过6.5万元D.估计该地农户家庭年收入的中位数为8万元【答案】AB【解析】对于4 该地农户家庭年收入不低于8.5万元的农户比例为(0.1 X 2 + 0.04 + 0.02 x 3) x 1 = 0.3 = 30%,故人正确;对于从该地农户家庭年收入的第三四分位数为血万元,则0.02 + 0.04 + 0.1 + 0.14 + 0.20 X 2 +
8、 0,10 x (m - 8.5) = 0.75, 解得租=9.0,故8正确;对于C,该地农户家庭所收入的平均值为:3 x 0.02 + 4 x 0.04 + 5 x 0.10 + 6 x 0.14 + 7 x 0.2 + 8 x 0.2 4- 9 x 0.1 + 10 x 0.1 + 11 x 0.04 + 12 x 0.02 + 13 x 0.02 + 14 x 0.02 = 7.68,故C错误;对于D 设该地农户家庭年收入的中位数为万元,则0.02 + 0.04 + 0.10 + 0.14 + 0.2 = 0.5,即 = 7.5,则中位数为7.5,故。错误.故选:AB.5.J*)(多选)
9、习近平总书记强调,要坚持健康第一的教育理念,加强学校体育工作,推动青少年文化学习 和体育锻炼协调发展.某学校对高一和高二年级每周在校体育锻炼时长进行了统计,得到数据(单位: 小时)如表:高一年级在校体育锻炼时长高二年级在校体育锻炼时长A.高一年级时长的众数比高二年级的大B.高一年级时长的平均数比高二年级的小C.高一年级时长的中位数比高二年级的大D.高一年级时长的方差比高二年级的大【答案】BD【解析】对于高一年级,由表可进行下列计算:时长众数为3.5,时长平均数为2.5 x 0.25 + 3.5 x 0.3 + 4.5 x 0.2 + 5.5 x 0.25 = 3.95,时长中位数为3+竺士”=
10、* 0.36222时长方差为(2.5 -3.95)x 0.25+(3.5 -3.95)x 0.30 +(4.5 -3.95)x 0.20/、2+(5.5 -3.95)x 0.25 = 1.2475;对于高二年级,由频率分布直方图可进行下列计算:时长众数为4.5,时长平均数为2.5 x 0.15 + 3.5 x 0.25 + 4.5 x 0.35 + 5.5 x 0.25 = 4.2,时长中位数为4 +哼萨二*222时长方差为(2.5 -4,2)x 0.15 +(3.5 -4.2)x 0.25 +(4.5 -4.2)x 0.35/、2+(5.5 -4.2)x 0.25 = 0.5693.1 Q
11、O O 由上可知:3.5V4,5, 3.95 4,2, - 0.5693, 67故选:BD.$()为对考生的月考成绩进行分析,某地区随机抽查了 10000名考生的成绩,根据所得数据画了如下的 样本频率分布直方图.求成绩在600, 650)的频率;根据频率分布直方图算出样本数据的中位数;为了分析成绩与班级、学校等方面的关系,必须按成绩再从这10000人中用分层抽样方法抽出20人作进一步分析,则成绩在550, 600)的这段应抽多少人?:基率/的距0.0050.0040.0030.002成绩(分效)成绩(分效)0.001400 450 500 550 600 6S0 700【答案】0.15 (2)
12、 540(3) 5【解析】根据频率分布直方图,得;成绩在600,650)的频率为0.003 X (650 -600) = 0.15;.(2)因为0.002 X(450 -400)= 0.1, 0.004 X(500 -450)= 0.2, 0.005 X(550 - 500)= 0.25,且0.1 + 0.2 + 0.25 = 0.55 0.5,所以,样本数据的中位数为500 +空黑产 =500 + 40 = 540(分);U U U。(3)成绩在550,600)的频率为0.005 x (600 -550) = 0.25,所以10000名考生中成绩在550, 600)的人数为0.25 x 10
13、000 = 2500(人),再从10000人用分层抽样方法抽出20人,则成绩在550, 600)的这段应抽取20 x就舒=5人.7. ()某学校1800名学生在一次百米测试中,成绩全部介于13秒与18秒之间,抽取其中50个样本, 将测试结果按如下方式分成五组:第一组13, 14,第二组14, 15),第五组17, 18,如图是按上述分组方 法得到的频率分布直方图.若成绩小于15秒认为良好,求该样本在这次百米测试中成绩良好的人数;请估计学校1800名学生中,成绩属于第四组的人数;请根据频率分布直方图,求样本数据的众数、中位数、平均数和方差.【解析】(1)样本在这次百米测试中成绩良好的人数是:1
14、x 0.06 x 50 + 1 x 0.16 x 50 = 3 + 9 = 11(人);(2)学校1800名学生中,成绩属于第四组的人数1 x 0.32 x 1800 = 576(A);(3)由图可知众数落在第三组15,16),是竺15.5,因为数据落在第一、二组的频率=1 x 0.06 + 1 x 0.16 = 0.22 0,5,所以中位数一定落在第三组15,16)中,假设中位数是,所以 1 x 0.06 + 1 x 0.16 + (% - 15) x 0.38 = 0.5,解得中位数 = 15.7368 x 15.74.19一般地,对数值型数据(如用水量,身高,收入,产量等)集中趋势的描述
15、,可以用平均数、中位数;而对分 类型数据(如校服规格、性别、产品质量等级等)集中趋势的描述,可以用众数.4总体离散程度的估计 方差,标准差的概念假设一组数据是与/2Xn,用元表示这组数据的平均数,我们称nS2 = - VCXj - X)2九乙1=1这组数据的方差,为了计算方便也可以用3?忆1必-32标准差是S = 飙=式/一元)2方差,标准差的意义方差越大,表明数据波动越大,越不稳定;方差越小,表明数据波动越小,越稳定.经典例题【题型一】常见统计数据【典题1】 某地一年之内12个月的月降水量从小到大分别为:46, 51, 48, 53, 56, 53, 56, 64, 58,56, 66, 7
16、1,则该地区的月降水量20%分位数和75%分位数为()A. 51, 58B. 51, 61C. 52, 58D. 52, 61【解析】该组数据从小到大排列为:46, 48, 51, 53, 53, 56, 56, 56, 58, 64, 66, 71因为20% x 12 = 2.4,计算结果不是整数,所以20%分位数为第3项数据,即51;因为75% x 12 = 9,计算结果是整数,所以75%分位数为第9项和第10项数据的平均数,即二丝=61.【点拨】计算一组几个数据的第P百分位数的步骤:(1)按从小到大排列原始数据;(2)计算i = n x p%;若i不是整数,而大于i的比邻整数为j,则第P
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 9.2 用样本估计总体 -人教A版2019选择性必修第二、三册教师版 样本 估计 总体 人教 2019 选择性 必修 第二 教师版
限制150内