2024版高考数学一轮总复习第9章统计与统计案例第2节用样本估计总体.docx





《2024版高考数学一轮总复习第9章统计与统计案例第2节用样本估计总体.docx》由会员分享,可在线阅读,更多相关《2024版高考数学一轮总复习第9章统计与统计案例第2节用样本估计总体.docx(19页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、第二节用样本估计总体考试要求:结合实例,能够利用样本估计总体的集中趋势以及离散程度,掌握分层随机抽样的样本均值和样本方差一、教材概念结论性质重现1频率分布直方图(1)频率分布表的画法第一步:求极差,极差最大值最小值;第二步:决定组数和组距,组距极差组数;第三步:将数据分组,通常对组内数值所在区间取左闭右开区间,最后一组取闭区间;第四步:登记频数,计算频率,列出频率分布表(2)频率分布直方图:反映样本频率分布的直方图(如图)横轴表示样本数据,纵轴表示频率组距,每个小长方形的面积表示样本落在该组内的频率1频率分布直方图可以利用频率分布直方图估计总体的取值规律2频率分布直方图中的常见结论(1)众数的
2、估计值为最高的小长方形的中点对应的横坐标(2)平均数的估计值等于频率分布直方图中每个小长方形的面积乘小长方形底边中点的横坐标之和(3)中位数的估计值的左边和右边的小长方形的面积和是相等的2中位数、众数、平均数(1)中位数:将一组数据按大小依次排列,处于最中间位置的一个数据(或最中间两个数据的平均数)叫做这组数据的中位数(2)众数:一组数据中出现次数最多的数据称为这组数据的众数(3)平均数:一组数据的算术平均数即为这组数据的平均数,n个数据x1,x2,xn的平均数x1n(x1x2xn)3百分位数(1)第p百分位数的定义:一般地,一组数据的第p百分位数是这样一个值,它使得这组数据中至少有p%的数据
3、小于或等于这个值,且至少有(100p)%的数据大于或等于这个值(2)计算一组n个数据的第p百分位数的步骤:第1步,按从小到大排列原始数据第2步,计算inp%第3步,若i不是整数,而大于i的比邻整数为j,则第p百分位数为第j项数据;若i是整数,则第p百分位数为第i项与第(i1)项数据的平均数4样本的数字特征如果有n个数据x1,x2,xn,那么平均数为x1n(x1x2xn),标准差为s1nx1x2+x2x2+xnx2,方差为s21n(x1x)2(x2x)2(xnx)2(1)若数据x1,x2,xn的平均数为x,则mx1a,mx2a,mx3a,mxna的平均数是mxa.(2)若数据x1,x2,xn的方
4、差为s2,则数据ax1b,ax2b,axnb的方差为a2s2.二、基本技能思想活动经验1判断下列说法的正误,对的画“”,错的画“”(1)平均数、众数与中位数从不同的角度描述了一组数据的集中趋势()(2)一组数据的方差越大,说明这组数据越集中()(3)在频率分布直方图中,小长方形的面积越大,表示样本数据落在该区间的频率越大()2“幸福感指数”是指某个人主观评价他对自己目前生活状态满意程度的指标,常用区间0,10内的一个数来表示,该数越接近10表示满意度越高现随机抽取10位居民,他们的幸福感指数为5,6,6,6,7,7,8,8,9,10.则这组数据的第80百分位数是()A7.5B8 C8.5D9C
5、解析:因为1080%8,所以数据5,6,6,6,7,7,8,8,9,10的第80百分位数是12(89)8.5.3某工厂技术人员对三台智能机床的生产数据进行统计,发现甲车床每天生产次品数的平均数为1.4,标准差为1.08;乙车床每天生产次品数的平均数为11,标准差为0.85;丙车床每天生产次品数的平均数为1.1,标准差为0.78.由以上数据可以判断生产性能最好且较稳定的为()A无法判断B甲车床C乙车床D丙车床D解析:因为1.11.411,0.780.851.08,所以可以判断生产性能最好且较稳定的为丙车床4从某网络平台推荐的影视作品中抽取400部,统计其评分数据,将所得400个评分数据分为8组:
6、66,70),70,74),94,98,并整理得到如下的频率分布直方图,则评分在区间82,86)内的影视作品数量是()A20B40 C64D80D解析:由频率分布直方图知,评分在区间82,86)内的影视作品的频率为(8682)0.050.2,故评分在区间82,86)内的影视作品数量是4000.280.5已知样本量为200,在样本的频率分布直方图中,共有n个小长方形若中间一个小长方形的面积等于其余(n1)个小长方形面积和的13,则该组的频数为_50解析:设除中间一个小长方形外的(n1)个小长方形面积的和为p,则中间一个小长方形面积为13p.由题意,得p13p1,所以p34,则中间一个小长方形的面
7、积为13p14,2001450,即该组的频数为50.考点1统计图表及其应用综合性习近平总书记强调:“一个忘记来路的民族必定是没有出路的民族,一个忘记初心的政党必定是没有未来的政党”某学校利用学习强国APP安排教职工(共120人)在线学习党史知识其教职工年龄情况和每周在线学习时长达3小时的情况分别如图(1)和图(2)所示,则下列说法正确的是()A该学校老年教职工在线学习党史时长达3小时的人数最多B该学校青年教职工在线学习党史时长达3小时的人数最多C该学校老年教职工在线学习党史时长达3小时和青年教职工在线学习党史时长达3小时的人数之和与中年教职工在线学习党史时长达3小时的人数相等D该学校在线学习党
8、史时长达3小时的人数占总人数的80%D解析:由图可知,该学校老年教职工在线学习党史时长达3小时的人数是12030%90%32.4,中年教职工在线学习党史时长达3小时的人数是120(130%30%)80%38.4,青年教职工在线学习党史时长达3小时的人数是12030%70%25.2.该学校在线学习党史时长达3小时的人数占总人数的比例为30%90%40%80%30%70%80%,故选项A、B、C错误,选项D正确电力工业是一个国家的经济命脉,它在国民经济和人民生活中占有极其重要的地位目前开发的电力主要是火电、水电、风电、核电、太阳能发电,其中,水电、风电、太阳能发电属于可再生能源发电如图所示的是20
9、22年各电力行业发电量及增幅的统计图,则下列说法错误的是()A其中火电发电量大约占全行业发电量的71%B在火电、水电、风电、核电、太阳能发电量中,比上一年增幅最大的是风电C火电、水电、风电、核电、太阳能发电的发电量的极差是7.28D以上可再生能源发电量的增幅均跑赢全行业整体增幅C解析:对于A,火电发电量大约占全行业发电量的5.287.4271%,故选项A正确;对于B,由折线图可知,风电增幅为10.50%,是增幅最大的,故选项B正确;对于C,火电、水电、风电、核电、太阳能发电的发电量的极差是5.280.145.14,故选项C错误;对于D,由折线图可得,可再生能源发电量的增幅均跑赢全行业整体增幅,
10、故选项D正确故选C统计图表问题的解决方法(1)首先要准确地识图,即要明确统计图表中纵轴、横轴及折线、区域等所表示的意义,尤其注意数字变化的趋势等(2)其次要准确地用图,会根据统计图表中的数字计算样本的数字特征,会用统计图表估计总体1(2022靖远模拟)如图是我国20112020年载货汽车产量及增长趋势统计图针对这10年的数据,下列说法错误的是()A与2019年相比较,2020年我国载货汽车产量同比增速不到15%B这10年中,载货汽车的同比增速有增有减C这10年我国载货汽车产量的极差超过150万辆D这10年我国载货汽车产量的中位数不超过340万辆D解析:对于A,2020年的同比增速为423.93
11、73.9373.9100%13.37%15%,故A正确;对于B,这10年中,载货汽车的同比增速有增有减,故B正确;对于C,由图知极差为423.9273.5150.4(万辆)150(万辆),故C正确;对于D,将这10年载货汽车产量由小到大排列,得:273.5,303.5,312.9,333.8,339.9,344.1,356.7,371.7,373.9,423.9,故中位数为339.9+344.12342(万辆),故D错误2(多选题)在疫情期间某企业对本企业1 644名职工关于复工的态度进行调查,调查结果如图所示下列结论成立的是()Ax0.384B从该企业中任取一名职工,该职工是倾向于在家办公的
12、概率为0.178C不到80名职工倾向于继续申请休假D倾向于复工后在家办公或在公司办公的职工超过986名BD解析:由图表知x%15.1%17.8%42.3%,得x34.8,故A错误由图表知在家办公的人员占17.8%,故B正确由1 6445.1%83.84480,所以超过80名职工倾向于继续申请休假,故C错误又1 644(17.8%42.3%)988.044986,所以超过986名职工倾向于在家办公或在公司办公,D正确综上可知,正确的结论为BD考点2频率分布直方图应用性一家保险公司决定对推销员实行目标管理,即给推销员确定一个具体的销售目标确定的销售目标是否合适,直接影响到公司的经济效益如果目标定得
13、过高,多数推销员完不成任务,会使推销员失去信心;如果目标定得太低,将不利于挖掘推销员的工作潜力该保险公司随机抽取50名保险推销员,统计了其2022年的月均推销额(单位:万元),将数据按照12,14),14,16),22,24分成6组,制成频率分布直方图如下,其中14,16)组比12,14)组的频数多4.(1)求频率分布直方图中a和b的值;(2)为调动推销员的积极性,公司设计了两种奖励方案方案一:奖励月均推销额进入前60%的员工;方案二:奖励月均推销额达到或超过平均数(同一组中的数据用该组区间中点值为代表)的员工你认为哪种方案更好?解:(1)由频率分布直方图的性质,得图中所有小长方形的面积之和等
14、于1.又因为14,16)组比12,14)组的频数多4,所以a+b+0.04+0.1+0.12+0.142=1,50b250a2=4, 解得a0.03,b0.07.(2)方案一,奖励月均推销额进入前60%的员工,因为样本量为50,所以能获得奖励员工人数为5060%30.方案二,奖励月均推销额达到或超过平均数,根据频率分布直方图,可得月均推销额的平均数为x0.032130.072150.122170.142190.12210.0422318.32.月均推销额低于18万的频率为2(0.030.070.12)0.44.因为本次抽样样本量为50名保险推销员,所以月均推销额低于18万的人数为500.442
15、2,所以月均推销额达到或超过18万的人数为28.综上所述,对比两种奖励方案,应选方案一,更多人员获得奖励1频率分布直方图的性质(1)小长方形的面积组距频率组距频率(2)各小长方形的面积之和等于1.(3)小长方形的高频率组距,所有小长方形的高的和为1组距.2要理解并记准频率分布直方图与众数、中位数、百分位数及平均数的关系1某校高三年级共有600名学生选修地理,某次考试地理成绩均在6090分之间,分数统计后绘成频率分布直方图,如图所示,则成绩在70,85)分的学生人数为()A380 B420 C450 D480C解析:成绩在70,85)分的学生人数为6005(0.040.060.05)450.故选
16、C2从某小区随机抽取100户居民进行月用电量调查,发现其用电量都在50到350度之间,频率分布直方图如图所示,由此可估计该小区居民户月用电量的平均值大约为_度186解析:设用电量在200到250度之间的频率为a,则有50(0.002 40.003 60.006a0.002 40.001 2)1,解得a0.004 4.由频率分布直方图可知,该小区居民户月用电的平均值为:50(750.002 41250.003 61750.00 62250.004 42750.002 43250.001 2)186(度)考点3总体集中趋势的估计综合性考向1百分位数、平均数、中位数及众数已知甲、乙两组按顺序排列的数
17、据,甲组:27,28,37,m,40,50;乙组:24,n,34,43,48,52.若这两组数据的第20百分位数、第50百分数分别对应相等,则mn等于()A127B107C87D67B解析:因为20%61.21,50%63,所以第20百分位数为n28,第50百分位数为37+m234+432,所以m40,所以mn4028107.故选B已知数据x11,x22,x33,x44,x55的平均数是23,则数据3x11,3x21,3x31,3x41,3x51的平均数是()A61B64 C67D70A解析:因为数据x11,x22,x33,x44,x55的平均数是23,所以x1x2x3x4x552315100
18、,所以(3x11)(3x21)(3x31)(3x41)(3x51)3(x1x2x3x4x5)5305,所以数据3x11,3x21,3x31,3x41,3x51的平均数是305561.故选A1求平均数时要注意数据的个数,不要重计或漏计2求中位数时一定要先对数据按大小排序,若最中间有两个数据,则中位数是这两个数据的平均数3若有两个或两个以上的数据出现得最多,且出现的次数一样,则这些数据都叫众数;若一组数据中每个数据出现的次数一样多,则没有众数4计算一组n个数据的第p百分位数的方法是:先按从小到大排列原始数据,再计算inp%.若i不是整数,而大于i的比邻整数为j,则第p百分位数为第j项数据;若i是整
19、数,则第p百分位数为第i项与第(i1)项数据的平均数考向2与频率分布直方图有关的数字特征的计算(多选题)某城市在创建文明城市的活动中,为了解居民对“创建文明城市”的满意程度,组织居民给活动打分(分数为整数,满分100分),从中随机抽取一个容量为100的样本,发现数据均在40,100内现将这些分数分成6组并画出样本的频率分布直方图,但不小心污损了部分图形,如图所示观察图形,则下列说法正确的是()A频率分布直方图中第三组的频数为10人B根据频率分布直方图估计样本的众数为75分C根据频率分布直方图估计样本的中位数为75分D根据频率分布直方图估计样本的平均数为75分ABC解析:分数在60,70)内的频
20、率为110(0.0050.0200.0300.0250.010)0.10,所以第三组60,70)的频数为1000.1010(人),故A正确因为众数的估计值是频率分布直方图中最高小长方形的中点,从图中可看出众数的估计值为75分,故B正确因为(0.0050.0200.010)100.350.5,所以中位数位于70,80),设中位数为x,则0.350.03(x70)0.5,解得x75,所以中位数的估计值为75,故C正确样本平均数的估计值为45100.00555100.02065100.01075100.0385100.02595100.0173(分),故D错误用样本估计总体是统计的基本方法:(1)最
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 2024 高考 数学 一轮 复习 统计 案例 节用 样本 估计 总体

限制150内