高考文科数学刷题练习考点十九统计与统计案例.doc
www.ks5u.com考点十九统计与统计案例一、选择题1对四组数据进行统计,获得如图所示的散点图,关于其相关系数的比较,正确的是()Ar2<r4<0<r3<r1 Br4<r2<0<r1<r3Cr4<r2<0<r3<r1 Dr2<r4<0<r1<r3答案A解析易知题中图(1)和图(3)是正相关,图(2)与图(4)是负相关,且图(1)与图(2)中的样本点集中分布在一条直线附近,则r2<r4<0<r3<r1.2(2019全国卷)演讲比赛共有9位评委分别给出某选手的原始评分,评定该选手的成绩时,从9个原始评分中去掉1个最高分、1个最低分,得到7个有效评分.7个有效评分与9个原始评分相比,不变的数字特征是()A中位数 B平均数 C方差 D极差答案A解析中位数是将9个数据从小到大或从大到小排列后,处于中间位置的数据,因而去掉1个最高分和1个最低分,不变的是中位数,平均数、方差、极差均受影响故选A.3(2019南阳市一中第九次目标考试)为考察A,B两种药物预防某疾病的效果,进行动物实验,分别得到如下等高条形图根据图中信息,在下列各项中,说法最佳的一项是()A药物B的预防效果优于药物A的预防效果B药物A的预防效果优于药物B的预防效果C药物A,B对该疾病均有显著的预防效果D药物A,B对该疾病均没有预防效果答案B解析由题图可得服用药物A的患病人数少于服用药物B的患病人数,而服用药物A的未患病人数多于服用药物B的未患病人数,所以药物A的预防效果优于药物B的预防效果故选B.4(2019沈阳市东北育才学校高三一模)甲、乙两名同学6次考试的成绩统计如图,甲、乙两名同学成绩的平均数分别为甲、乙,标准差分别为甲,乙,则()A.甲<乙,甲<乙 B.甲<乙,甲>乙C.甲>乙,甲<乙 D.甲>乙,甲>乙答案C解析甲、乙两名同学6次考试的成绩统计如图,甲、乙两名同学成绩的平均数分别为甲,乙,标准差分别为甲,乙,由折线图得甲>乙,甲<乙故选C.5(2019湖南张家界三模)已知变量x,y之间的线性回归方程为y0.7x10.3,且变量x,y之间的一组相关数据如表所示,则下列说法错误的是()x681012y6m32A变量x,y之间呈现负相关关系B可以预测,当x20时,y3.7Cm4D由表格数据可知,该回归直线必过点(9,4)答案C解析由题意得,由0.7<0,得变量x,y之间呈负相关,故A正确;当x20时,则0.72010.33.7,故B正确;由数据表格可知(681012)9,(6m32),则0.7910.3,解得m5,故C错误;由数据表易知,数据中心为(9,4),故D正确故选C.6通过随机询问110名性别不同的大学生是否爱好某项运动,得到如下的列联表:男女总计爱好402060不爱好203050总计6050110由K2算得,K27.8.附表:P(K2k0)0.0500.0100.001k03.8416.63510.828参照附表,得到的正确结论是()A有99%以上的把握认为“爱好该项运动与性别有关”B有99%以上的把握认为“爱好该项运动与性别无关”C在犯错误的概率不超过0.1%的前提下,认为“爱好该项运动与性别有关”D在犯错误的概率不超过0.1%的前提下,认为“爱好该项运动与性别无关”答案A解析由K27.8>6.635可知,我们有99%以上的把握认为“爱好该项运动与性别有关”7(2019湖南师大附中月考七)下列说法错误的是()A在回归模型中,预报变量y的值不能由解释变量x唯一确定B若变量x,y满足关系y0.1x1,且变量y与z正相关,则x与z也正相关C在残差图中,残差点分布的带状区域的宽度越狭窄,其模型拟合的精度越高D以模型ycekx去拟合一组数据时,为了求出回归方程,设zln y,将其变换后得到线性方程z0.3x4,则ce4,k0.3答案B解析对于A,y除了受自变量x的影响之外还受其他因素的影响,故A正确;对于B,变量x,y满足关系y0.1x1,则变量x与y负相关,又变量y与z正相关,则x与z负相关,故B错误;对于C,由残差图的意义可知正确;对于D,ycekx,两边取对数,可得ln yln (cekx)ln cln ekxln ckx,令zln y,可得zln ckx,z0.3x4,ln c4,k0.3,ce4.即D正确,故选B.8(2019福建泉州第二次质检)已知某样本的容量为50,平均数为70,方差为75.现发现在收集这些数据时,其中的两个数据记录有误,一个错将80记录为60,另一个错将70记录为90.在对错误的数据进行更正后,重新求得样本的平均数为,方差为s2,则()A.70,s2<75 B.70,s2>75C.>70,s2<75 D.<70,s2>75答案A解析70,设收集的48个准确数据分别记为x1,x2,x48,则75(x170)2(x270)2(x4870)2(6070)2(9070)2(x170)2(x270)2(x4870)2500,s2(x170)2(x270)2(x4870)2(8070)2(7070)2(x170)2(x270)2(x4870)2100<75,故选A.二、填空题9某同学一个学期内各次数学测验成绩的茎叶图如图所示,则该组数据的中位数是_答案83解析根据茎叶图可知,中位数是82与84的平均数,所以答案为83.10总体由编号为01,02,19,20的个体组成,利用下面的随机数表选取7个个体,选取方法是从随机数表第1行的第3列和第4列数字开始由左到右依次选取两个数,则选出的第7个个体的编号为_7816657208026314070243699728019832049234493582008623486969387481答案04解析由随机数表可看出所选的数字依次为16,08,02,14,07,02,01,04,去掉重复数字02,则第7个个体的编号为04,故答案为04.11(2019河南新乡三模)某校有高一学生n名,其中男生数与女生数之比为65,为了解学生的视力情况,现要求按分层抽样的方法抽取一个样本容量为的样本,若样本中男生比女生多12人,则n_.答案1320解析依题意可得12,解得n1320.12(2019河南安阳十一模)通常,满分为100分的试卷,60分为及格线,若某次满分为100分的测试卷,100人参加测试,将这100人的卷面分数按照24,36),36,48),84,96分组后绘制的频率分布直方图如图所示由于及格人数较少,某老师准备将每位学生的卷面分采用“开方乘以10取整”的方式进行换算以提高及格率(实数a的取整等于不超过a的最大整数),如:某位学生卷面49分,则换算成70分作为他的最终考试成绩,则按照这种方式,这次测试的及格率将变为_答案0.82解析先考虑不进行换算前36分以上(含36分)的学生的频率,该频率为10.015120.82,换算后,原来36分以上(含36分)的学生都算及格,故这次测试的及格率将变为0.82.三、解答题13(2019内蒙古一模)在某外国语学校举行的HIMCM(高中生数学建模大赛)中,参与大赛的女生与男生人数之比为13,且成绩分布在40,100,分数在80以上(含80)的同学获奖按女生、男生用分层抽样的方法抽取200人的成绩作为样本,得到成绩的频率分布直方图如图所示(1)求a的值,并计算所抽取样本的平均值(同一组中的数据用该组区间的中点值作代表);(2)填写下面的22列联表,并判断在犯错误的概率不超过0.05的前提下能否认为“获奖与女生、男生有关”女生男生总计获奖5不获奖总计200附表及公式:P(K2k0)0.100.050.0250.0100.0050.001k02.7063.8415.0246.6357.87910.828其中K2,nabcd.解(1)a1(0.010.0150.030.0150.005)100.025,450.1550.15650.25750.3850.15950.0569.(2)由频率分布直方图知样本中获奖的人数为40,不获奖的人数为160,22列联表如下:女生男生总计获奖53540不获奖45115160总计50150200因为K24.167>3.841,所以在犯错误的概率不超过0.05的前提下能认为“获奖与女生、男生有关”14(2019聊城市高三一模)某小学为了了解四年级学生的家庭作业用时情况,从本校四年级随机抽取了一批学生进行调查,并绘制了学生作业用时的频率分布直方图,如图所示(1)估算这批学生的作业平均用时情况;(2)作业用时不能完全反映学生学业负担情况,这与学生自身的学习习惯有很大关系,如果用时四十分钟之内评价为优异,一个小时以上为一般,其他评价为良好现从优异和良好的学生里面用分层抽样的方法抽取300人,其中女生有90人(优异20人)请完成列联表,并根据列联表分析能否在犯错误的概率不超过0.05的前提下认为学习习惯与性别有关系?男生女生合计良好优异合计附:K2,其中nabcd.P(K2k0)0.1000.0500.0250.0100.001k02.7063.8415.0246.63510.828解(1)10(350.01450.02550.03650.025750.01850.005)57.所以批学生作业用时的平均数为57.(2)优异学生数与良好学生数之比为0.01(0.020.03)15,按照分层抽样得300人中优异50人,良好250人;女生90人,男生210人;女生优异20,良好70人,男生优异30人,良好180人,列联表如下:男生女生合计良好18070250优异302050合计21090300K22.857<3.841,故不能在犯错误的概率不超过0.05的前提下认为学习习惯与性别有关系一、选择题1在一次数学测试中,数学老师对班上7名同学在20题(12分),21题(12分)的得分情况进行统计,得到的得分率如图所示,其中20题的得分率为图中虚线部分、21题的得分率为图中实线部分,记第20题、21题的平均得分分别为1,2,第20题、21题得分的标准差分别为s1,s2,则()A.1>2,s1>s2 B.1<2,s1>s2C.1>2,s1<s2 D.1<2,s1<s2答案C解析由于20题、21题的分值相同,且20题的得分率高于21题的得分率,则20题的得分高于21题的得分;又由图可知,21题的得分率离散程度相对较大,则21题得分的标准差大于20题得分的标准差,故1>2,s1<s2,故选C.2采用系统抽样方法从960人中抽取32人做问卷调查,为此将他们随机编号为1,2,960,分组后在第一组采用简单随机抽样的方法抽到的号码为9.抽到的32人中,编号落入1,450的人做问卷A,编号落入451,750的人做问卷B,其余的人做问卷C,则抽到的人中,做问卷B的人数为()A8 B10 C12 D14答案B解析由题意得系统抽样的抽样间隔为30,又因为第一组内抽取的号码为9,则由451930k750(kN*)得14.7k24.7,所以做问卷B的人数为10.3一个频率分布表(样本容量为30)不小心被损坏了一部分,只记得样本中数据在20,60)上的频率为0.8,则估计样本在40,50),50,60)内的数据个数共为()A19 B17 C16 D15答案D解析由题意得样本数据在20,60)内的频数为300.824,则样本在40,50)和50,60)内的数据个数之和为244515,故选D.4为了解学生在课外活动方面的支出情况,抽取了n个同学进行调查,结果显示这些学生的支出金额(单位:元)都在10,50,其中支出金额在30,50的学生有117人,频率分布直方图如图所示,则n()A180 B160 C150 D200答案A解析30,50对应的概率为1(0.010.025)100.65,所以n180.5已知x与y之间的几组数据如下表:x123456y021334假设根据上表数据所得线性回归方程为x,若某同学根据上表中的前两组数据(1,0)和(2,2),求得的直线方程为ybxa,则以下结论正确的是()A.>b,>a B.>b,<aC.<b,>a D.<b,<a答案C解析描出散点图,易观察出<b,>a,故选C.6(2019四川乐山第三次调研)某调查机构对全国互联网行业进行调查统计,得到整个互联网行业从业者年龄分布饼状图、90后从事互联网行业岗位分布条形图,则下列结论中不一定正确的是()注:90后指1990年及以后出生,80后指19801989年之间出生,80前指1979年及以前出生A互联网行业从业人员中90后占一半以上B互联网行业中从事技术岗位的人数超过总人数的20%C互联网行业中从事运营岗位的人数90后比80前多D互联网行业中从事技术岗位的人数90后比80后多答案D解析对于选项A,互联网行业从业人员中90后占56%,占一半以上,所以正确;对于选项B,互联网行业中90后从事技术岗位的人数占总人数的39.6%56%22.176%,超过总人数的20%,所以正确;对于选项C,互联网行业中从事运营岗位的人数90后占总人数的56%17%9.52%,比80前多,所以正确;对于选项D,互联网行业中从事运营岗位的人数90后占总人数的56%17%9.52%,80后占总人数的41%,所以互联网行业中从事运营岗位的人数90后不一定比80后多,所以不一定正确,故选D.7针对“中学生追星问题”,某校团委对“学生性别和中学生追星是否有关”作了一次调查,其中女生人数是男生人数的,男生追星的人数占男生人数的,女生追星的人数占女生人数的.若有95%的把握认为是否追星和性别有关,则男生至少有()A11人 B12人 C18人 D24人附表及公式:K2,nabcd.P(K2k0)0.0500.0250.0100.005k03.8415.0246.6357.879答案B解析设男生人数为x,依题意可得列联表如下:喜欢追星不喜欢追星总计男生x女生总计x若在犯错误的概率不超过95%的前提下认为是否喜欢追星和性别有关,则K2>3.841,由K2>3.841,解得x>10.24,为整数,若在犯错误的概率不超过95%的前提下认为是否喜欢追星和性别有关,则男生至少有12人,故选B.8(2019江西南昌一模)已知具有线性相关的五个样本点A1(0,0),A2(2,2),A3(3,2),A4(4,2),A5(6,4),用最小二乘法得到回归直线方程l1:ybxa,过点A1,A2的直线方程l2:ymxn,那么下列四个命题中:m>b,a>n;直线l1过点A3; (yibxia)2 (yimxin)2;|yibxia|yimxin|.正确命题有()A1个 B2个 C3个 D4个答案B解析由所给的数据计算可得3,2,回归方程为y0.6x0.2,过点A1,A2的直线方程为yx,逐一考查所给的结论:m>b,a>n,该说法正确;直线l1过点A3即回归方程过样本中心点,该说法正确; (yibxia)20.8, (yimxin)29,说法错误;|yibxia|1.6,|yimxin|5,说法错误,综上可得正确命题的个数有2个,故选B.二、填空题9空气质量指数(Air Quality Index,简称AQI)是定量描述空气质量状况的指数,空气质量按照AQI大小分为六级,050为优;51100为良;101150为轻度污染;151200为中度污染;201300为重度污染;大于300为严重污染一环保人士从当地某年的AQI记录数据中,随机抽取10个,用茎叶图记录如图根据该统计数据,估计此地该年AQI大于100的天数为_(该年为365天)答案146解析该样本中AQI大于100的频数为4,频率为,以此估计此地全年AQI大于100的频率为,故此地该年AQI大于100的天数约为365146.10某数学老师身高176 cm,他爷爷、父亲和儿子的身高分别是173 cm、170 cm和182 cm.因儿子的身高与父亲的身高有关,该老师用线性回归分析的方法预测他孙子的身高为_cm.答案185解析设父亲身高为x cm,儿子身高为y cm,则x173170176y170176182173,176,1, 17611733,所以x3,当x182时,185.11甲、乙两人要竞争一次大型体育竞技比赛射击项目的参赛资格,如图是在测试中甲、乙各射靶10次的条形图,则参加比赛的最佳人选为_答案乙解析甲的平均数140.250.170.380.190.2100.17.0,乙的平均数250.160.270.480.290.17.0,所以12;甲的方差s(74)22(75)21(77)23(78)21(79)22(710)214,乙的方差s(75)21(76)22(77)24(78)22(79)211.2,所以s>s,即参加比赛的最佳人选为乙12某学校开展一次“五四”知识竞赛活动,共有三个问题,其中第1、2题满分都是15分,第3题满分是20分每个问题或者得满分,或者得0分活动结果显示,每个参赛选手至少答对一道题,有6名选手只答对其中一道题,有12名选手只答对其中两道题答对第1题的人数与答对第2题的人数之和为26,答对第1题的人数与答对第3题的人数之和为24,答对第2题的人数与答对第3题的人数之和为22.则参赛选手中三道题全答对的人数是_;所有参赛选手得分的平均数是_答案229.5解析设x1,x2,x3分别表示答对第1题、第2题、第3题的人数,则有解得x114,x212,x310,又只答对一道题的人数为6,只答对两道题的人数为12,设答对三道题的人数为x,则全班人数为612x,611223x36,解得x2,三道题全答对的人数是2,所有参赛选手得分的平均数是(141512151020)29.5.三、解答题13(2019长沙一模)某互联网公司为了确定下一季度的前期广告投入计划,收集了近6个月广告投入量x(单位:万元)和收益y(单位:万元)的数据如下表:月份123456广告投入量/万元24681012收益/万元14.2120.3131.831.1837.8344.67他们用两种模型ybxa,yaebx分别进行拟合,得到相应的回归方程并进行残差分析,得到如图所示的残差图及一些统计量的值:xiyix7301464.24364(1)根据残差图,比较模型,的拟合效果,应选择哪个模型?并说明理由;(2)残差绝对值大于2的数据被认为是异常数据,需要剔除:()剔除异常数据后,求出(1)中所选模型的回归方程;()广告投入量x18时,(1)中所选模型收益的预报值是多少?附:对于一组数据(x1,y1),(x2,y2),(xn,yn),其回归直线x的斜率和截距的最小二乘估计分别为:, .解(1)应该选择模型,因为模型的残差点比较均匀地落在水平的带状区域中,且模型的带状区域比模型的带状区域窄,所以模型的拟合精度高,回归方程的预报精度高(2)()剔除异常数据,即3月份的数据后,得(766)7.2,(30631.8)29.64.xiyi1464.24631.81273.44,x36462328.3, 29.6437.28.04.所以y关于x的回归方程为3x8.04.()把x18代入()中所求回归方程得3188.0462.04,故预报值为62.04万元14(2019云南省第二次高三统一检测)在某市创建全国文明城市的过程中,创文专家组对该市的中小学进行了抽检,其中抽检的一个环节是对学校的教师和学生分别进行问卷测评下表是被抽检到的五所学校A,B,C,D,E的教师和学生的测评成绩(单位:分):学校ABCDE教师测评成绩x9092939496学生测评成绩y8789899293(1)建立y关于x的回归方程x;(2)现从A,B,C,D,E这五所学校中随机选两所派代表参加座谈,求A,B两所学校至少有一所被选到的概率P.附:, .解(1)依据题意计算得93,90, (xi)2(3)2(1)202123220, (xi)(yi)(3)(3)(1)(1)0(1)123321, 9093.所求回归方程为x.(2)从A,B,C,D,E这5所学校中随机选2所,具体情况为(A,B),(A,C),(A,D),(A,E),(B,C),(B,D),(B,E),(C,D),(C,E),(D,E),共有10种等可能的结果A,B两所学校至少有一所被选到的为(A,B),(A,C),(A,D),(A,E),(B,C),(B,D),(B,E),共有7种所以A,B两所学校至少有一所被选到的概率P.