考点28统计(核心考点讲与练)-2024年高考数学一轮复习核心考点讲与练(新高考专用)(解析版).docx
《考点28统计(核心考点讲与练)-2024年高考数学一轮复习核心考点讲与练(新高考专用)(解析版).docx》由会员分享,可在线阅读,更多相关《考点28统计(核心考点讲与练)-2024年高考数学一轮复习核心考点讲与练(新高考专用)(解析版).docx(42页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、考点28 统计(核心考点讲与练)一、抽样与统计图表1.获取数据的基本途径获取数据的基本途径包括:统计报表和年鉴、社会调查、试验设计、普查和抽样、互联网等.(1)统计报表是指各级企事业、行政单位按规定的表格形式、内容、时间要求报送程序,自上而下统一布置,提供统计资料的一种统计调查方式.(2)年鉴是以全面、系统、准确地记述上年度事物运动、发展状况为主要内容的资料性工具书.汇辑一年内的重要时事、文献和统计资料,按年度连续出版的工具书.2.总体、样本、样本容量要考察的对象的全体叫做总体,每一个考察对象叫做个体,从总体中被抽取的考察对象的集体叫做总体的一个样本,样本中个体的数目叫做样本容量.3.简单随机
2、抽样(1)定义:从元素个数为N的总体中不放回地抽取容量为n的样本,如果每一次抽取时总体中的各个个体有相同的可能性被抽到,这种抽样方法叫做简单随机抽样.(2)最常用的简单随机抽样的方法:抽签法和随机数法.(3)应用范围:总体中的个体数较少.4.分层抽样(1)定义:在抽样时,将总体中各个个体按某种特征分成若干个互不重叠的几部分,每一部分叫做层,在各层中按层在总体中所占比例进行简单随机抽样或系统抽样,这种抽样方法叫做分层抽样. (2)应用范围:当总体是由差异明显的几个部分组成时,往往选用分层抽样.5.频率分布直方图(1)频率分布表的画法:第一步:求极差,决定组数和组距,组距;第二步:分组,通常对组内
3、数值所在区间取左闭右开区间,最后一组取闭区间;第三步:登记频数,计算频率,列出频率分布表.(2)频率分布直方图:反映样本频率分布的直方图(如图)横轴表示样本数据,纵轴表示,每个小矩形的面积表示样本落在该组内的频率.6.频率分布折线图和总体密度曲线(1)频率分布折线图:连接频率分布直方图中各小长方形上端的中点,就得到频率分布折线图.(2)总体密度曲线:随着样本容量的增加,作图时所分的组数增加,组距减小,相应的频率分布折线图就会越来越接近于一条光滑曲线,统计中称这条光滑曲线为总体密度曲线.7.样本的数字特征数字特征定义众数在一组数据中,出现次数最多的数据叫做这组数据的众数中位数将一组数据按大小依次
4、排列,把处在最中间位置的一个数据(或最中间两个数据的平均数)叫做这组数据的中位数平均数样本数据的算术平均数,即方差s2(x1)2(x2x)2(xnx)2,其中s为标准差8.百分位数如果将一组数据从小到大排序,并计算相应的累计百分位,则某一百分位所对应数据的值就称为这一百分位的百分位数.可表示为:一组n个观测值按数值大小排列.如,处于p%位置的值称第p百分位数.二、统计案例1.变量间的相关关系(1)常见的两变量之间的关系有两类:一类是函数关系,另一类是相关关系;与函数关系不同,相关关系是一种非确定性关系.(2)从散点图上看,点散布在从左下角到右上角的区域内,两个变量的这种相关关系称为正相关,点散
5、布在左上角到右下角的区域内,两个变量的相关关系为负相关.2.回归分析对具有相关关系的两个变量进行统计分析的方法叫回归分析.其基本步骤是:()画散点图;()求回归直线方程;()用回归直线方程作预报.(1)回归直线:如果散点图中点的分布从整体上看大致在一条直线附近,就称这两个变量之间具有线性相关关系,这条直线叫做回归直线.(2)回归直线方程的求法最小二乘法.设具有线性相关关系的两个变量x,y的一组观察值为(xi,yi)(i1,2,n),则回归直线方程x的系数为:称为样本点的中心.(3)相关系数计算相关系数r,r有以下性质:|r|1,并且|r|越接近1,线性相关程度越强;|r|越接近0,线性相关程度
6、越弱;|r|r0.05,表明有95%的把握认为变量x与y之间具有线性相关关系,回归直线方程有意义;否则寻找回归直线方程毫无意义.3.独立性检验(1)22列联表B总计An11n12n1An21n22n2总计n1n2n其中n1n11n12,n2n21n22,n1n11n21,n2n12n22,nn11n21n12n22.(2)2统计量2.(3)两个临界值:3.841与6.635当23.841时,有95%的把握说事件A与B有关;当26.635时,有99%的把握说事件A与B有关;当23.841时,认为事件A与B是无关的.1.解决分层抽样的常用公式先确定抽样比,然后把各层个体数乘以抽样比,即得各层要抽取
7、的个体数(1)抽样比;(2)层1的容量层2的容量层3的容量样本中层1的容量样本中层2的容量样本中层3的容量2.统计图表人类辨识影像的能力要优於辨识文字与数字的能力 ,因此我们采用图形的方式来展现数据时,常常不我们直接观察数据要来的快.3.平均数反映了数据取值的平均水平;标准差、方差描述了一组数据围绕平均数波动的大小标准差、方差越大,数据的离散程度越大,越不稳定;标准差、方差越小,数据的离散程度越小,越稳定4.独立性检验的一般步骤根据样本数据制成22列联表;根据公式K2计算K2的值;查表比较K2与临界值的大小关系,作出统计判断抽样1(2022福建莆田三模)已知某校有教职工560人,其中女职工24
8、0人,现按性别用分层抽样的方法从该校教职工中抽取28人,则抽取的男职工人数与抽取的女职工人数之差是()A2B4C6D8【答案】B【分析】根据分层抽样的抽取比例计算方法,分别求出抽取人数中的男女职工人数即可求解.【详解】抽取的女职工人数为:人抽取的男职工人数为:人则抽取的男职工人数与抽取的女职工人数之差为:人故选:B.2(2022安徽芜湖一中三模(文)某学校对高三年级800名学生进行系统抽样编号分别为001,002,800,若样本相邻的两个编号为028,068,则样本中编号最大的为()A778B780C782D788【答案】D【分析】根据样本中两个相邻编号求出组距和分组数,再根据系统抽样方法即可
9、求出样本编号最大的一个【详解】样本相邻的两个编号为028和068,故组距为682840,由8004020知样本容量为20,系统抽样时分为20组:001040,041080,760800,从第1组抽出的数据为028,从第20组抽出的数据为76028788故选:D3.(2021北京市通州区高三上期中)某单位有男职工56人,女职工42人,按性别分层,用分层随机抽样的方法从全体职工中抽出一个样本,如果样本按比例分配,男职工抽取的人数为16人,则女职工抽取的人数为( )A12 B20 C24 D28【答案】A【分析】根据题意,结合分层抽样的计算方法,即可求解.【详解】根据题意,设抽取的样本人数为,因男职
10、工抽取的人数为,所以,因此女职工抽取的人数为(人).故选:A.4(多选题)(2022福建南平三模)支气管炎患者会咳嗽失眠,给患者日常生活带来严重的影响.某医院老年患者治愈率为20%,中年患者治愈率为30%,青年患者治愈率为40%.该医院共有600名老年患者,500名中年患者,400名青年患者,则()A若从该医院所有患者中抽取容量为30的样本,老年患者应抽取12人B该医院青年患者所占的频率为C该医院的平均治愈率为28.7%D该医院的平均治愈率为31.3%【答案】ABC【分析】由分层抽样即可判断A选项;直接计算频率即可判断B选项;直接计算平均治愈率即可判断C、D选项.【详解】对于A,由分层抽样可得
11、,老年患者应抽取人,正确;对于B,青年患者所占的频率为,正确;对于C,平均治愈率为,正确;对于D,由C知错误.故选:ABC.统计图表1.(2021广东省广雅中学高三上10月月考)小张一星期的总开支分布如图所示,一星期的食品开支如图所示,则以下说法正确的是( )A. 储蓄金额为300元B. 日常开支比食品中的其他开支多150元C. 娱乐开支比通信开支多50元D. 肉类开支占总开支的【答案】ABC【分析】根据图表信息一一分析可得;【详解】解:由食品开支图,可知食品开支有元,所以一星期的总开支元,其中储蓄金额为元,故A正确;日常开支为元,故日常开支比食品中的其他开支多150元,故B正确;娱乐开支比通
12、信开支多元,故C正确;肉类开支占总开支的,故D错误;故选:ABC2.(2021四川省资阳市高三第一次诊断)我国在2020年如期完成了新时代脱贫攻坚目标任务,脱贫攻坚战取得全面胜利,历史性地解决了绝对贫困问题,并全面建成了小康社会现就20132019年年末全国农村贫困人口数进行了统计,制成如下散点图:据此散点图,下面个回归方程类型中最适宜作为年末贫困人数和年份代码的回归方程类型的是( )A. B. C. D. 【答案】A【分析】结合散点图中点的分布特征即可得出结果.【详解】由散点图可知所有的点几乎分布在一条直线上,结合选项可知选A,故选:A.3.(2021广东省部分学校高三上11月大联考)中国互
13、联网络信息中心(CNNIC)发布了第46次中国互联网络发展状况统计报告,报告公布了截至2020年6月的中国互联网状况数据与对比数据,根据下图,下面结论不正确的是( )A. 2020年6月我国网民规模接近9.4亿,相比2020年3月新增网民3625万B. 2020年6月我国互联网普及率达到67%,相比2020年3月增长2.5%C. 2018年12月我国互联网普及率不到60%,经过半年后普及率超过60%D. 2018年6月我国网民规模比2017年6月我国网民规模增加的百分比大于7%【答案】D【分析】结合图表直接判断和计算即可.【详解】对A,由图可知,新增网民数为:万,正确;对B,读图可直接判断正确
14、;对C,读图可直接判断正确;对D,2018年6月我国网民规模比2017年6月我国网民规模增加的比例为:,故D错误.故选:D4.(2021山西省长治市第八中学高三上阶段性测评)随着2022年北京冬奥会临近,中国冰雪产业快速发展,冰雪运动人数快速上升,冰雪运动市场需求得到释放,将引领相关户外用品行业市场增长下面是2013年至2020年中国雪场滑雪人次(万人次)与同比增长率(与上一年相比)的统计情况,则下面结论中正确的是( )A2013年至2020年,中国雪场滑雪人次的同比增长率逐年减少B2013年至2020年,中国雪场滑雪人次逐年增加C2013年至2020年,中国雪场滑雪人次的年增加量相近D201
15、3年到2020年,中国雪场滑雪人次在2020年首次出现负增长【答案】D【分析】根据图中条形统计图和折线图的实际意义分析逐个判定即可.【详解】对于A,由折线图可知,2013年至2020年,中国雪场滑雪人次的同比增长率先增长再减小,故A错误;对于B,由条形统计图知,2013年至2019年,中国雪场滑雪人次逐年增加,但2020年减少了,故B错误;对于C,由条形图知,2013年至2020年,中国雪场滑雪人次的年增加量不相近,故C错误;对于D,由条形图和折线图,明显看出2013年到2020年,中国雪场滑雪人次在2020年首次出现负增长,故D正确故选:D5.(2021河南省重点中学高三上模拟调研)茶叶源于
16、中国,至今中国仍然是茶叶最大生产国,下图为年全球主要茶叶生产国调查数据.年全球主要茶叶生产国产量分布根据该图,下列结论中不正确的是( )A. 年图中个国家茶叶产量的中位数为B. 年图中个国家茶叶产量比年增幅最大的是中国C. 年图中个国家茶叶总产量超过年D. 年中国茶叶产量超过其他个国家之和【答案】B【分析】根据统计图表提供的数据判断各选项【详解】图中,2019年的数据中间的一个是45.9,A正确;2020年图中个国家茶叶产量比年增幅最大的是肯尼亚,B错;2020年图中个国家茶叶总产量比年总产量的差是,C正确;年图中,D正确,故选:B.样本的数字特征1.(2021江苏苏州模拟)高铁、扫码支付、共
17、享单车、网购并称中国“新四大发明”,近日对全国100个城市的共享单车和扫码支付的使用人数进行大数据分析,其中共享单车使用的人数分别为x1,x2,x3,x100,它们的平均数为,方差为s2;其中扫码支付使用的人数分别为3x12,3x22,3x32,3x1002,它们的平均数为方差为s2,则s2分别为()A32,3s22 B3,3s2C32,9s2 D32,9s22【答案】C【解析】由平均数的计算公式,可得数据x1,x2,x100的平均数为(x1x2x3x100),数据3x12,3x22,3x1002的平均数为:(3x12)(3x22)(3x1002)3(x1x2x100)210032,数据x1,
18、x2,x100的方差为s2(x1)2(x2)2(x100)2,数据3x12,3x22,3x1002的方差为:(3x12)(32)2(3x22)(32)2(3x1002)(32)29(x1)29(x2)29(x100)29s2,故选C.2(2021河南省湘豫名校联盟高三上11月联考)某校为了解学生体能素质,随机抽取了名学生,进行体能测试.并将这名学生成绩整理得如下频率分布直方图.根据此频率分布直方图.下列结论中不正确的是( )A. 这名学生中成绩在内的人数占比为B. 这名学生中成绩在内的人数有人C. 这名学生成绩的中位数为D. 这名学生的平均成绩(同一组中的数据用该组区间的中点值做代表)【答案】
19、C【分析】利用频率分布直方图求解判断.【详解】根据此频率分布直方图,成绩在内的频率为,所以A正确;这名学生中成绩在内的人数为所以B正确;根据此频率分布直方图,可得这名学生成绩的中位数,所以C错误根据频率分布直方图的平均数的计算公式,可得:所以D正确.故选:C.线性回归方程1.(多选题)(2021山东师范大学附中高三上期中)已知变量,之间的经验回归方程为,且变量,的数据如表所示,则下列说法正确的是( )681012632A. 变量,之间呈正相关关系B. 变量,之间呈负相关关系C. 的值等于5D. 该回归直线必过点【答案】BCD【分析】将样本点中心代入回归直线方程,得出的值,再逐一判断即可.【详解
20、】因为,所以,故C正确;因为,所以变量,之间呈负相关关系,故A错误,B正确;因为,所以该回归直线必过点,故D正确;故选:BCD2.(2021福建省宁德市高三上期中联考)某电子产品的成本价格由两部分组成,一是固定成本,二是可变成本,为确定该产品的成本,进行5次试验,收集到的数据如表:产品数x个1020304050产品总成本(元)62688189由最小二乘法得到回归方程,则_.【答案】【分析】根据线性回归方程过样本中心点进行求解即可.【详解】,因为线性回归方程过样本中心点,所以,故答案为:3.(“超级全能生”2022届高三全国卷地区11月联考)自动驾驶汽车依靠、人工智能、视觉计算、雷达、监控装置和
21、全球定位系统协同合作,让电脑可以在没有任何人类主动的操作下,自动安全地操作机动车辆.近年来全球汽车行业达成共识,认为自动驾驶代表了未来汽车行业的发展方向.实现自动驾驶是一个渐进过程,国际通用的自动驾驶标准根据自动驾驶程度逐步提升可以分为级.级自动驾驶也是整个自动驾驶技术的分水岭.年全球渗透率(%)统计表及散点图如下.年份渗透率(%)(1)利用散点图判断,和(其中,为大于的常数)哪一个更适合作为渗透率和年份的回归方程模型(只要给出判断即可,不必说明理由);(2)令,求关于的回归方程;(3)根据(2)中回归模型回答下列问题:(i)估计年全球渗透率是多少?(ii)预计至少要到哪一年,全球渗透率能超过
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 考点 28 统计 核心 2024 年高 数学 一轮 复习 新高 专用 解析
链接地址:https://www.taowenge.com/p-96408507.html
限制150内