名师原创高考数学专题卷:《统计与统计案例》.pdf
名师原创数学专题卷专题统计与统计案例考点:随机抽样与用样本估计总体(1-6题,13-16 题,17-20 题)考点:变量的相关性与统计案例(7-12题,21,22 题)考试时间:120 分钟满分:150 分说明:请将选择题正确答案填写在答题卡上,主观题写在答题纸上第 I 卷(选择题)一、选择题1.某厂共有64 名员工,准备选择4 人参加技术评估,现将这64 名员工编号,准备运用系统抽样的方法抽取,已知8 号、24号、56 号在样本中,那么样本中还有一个员工的编号是()A.35B.40C.45D.502.某单位有老年人28 人,中年人56 人,青年人 84 人,为了调查他们的身体状况的某项指标需从他们中间抽取一个容量为36 样本,则老年人、中年人、青年人分别各抽取的人数是()A.6,12,18B.7,11,19C.6,13,17D.7,12,173.一组数据共有7个数,记得其中有10,2,5,2,4,2,还有一个数没记清,但知道这组数的平均数、中位数、众数依次成等差数列,这个数的所有可能值的和为()A.9B.3C.17D.-114.为保障春节期间的食品安全,某市质量监督局对超市进行食品检查,如图所示是某品牌食品中微量元素含量数据的茎叶图,已知该组数据的平均数为11.75,则41ab的最小值为()A.9B.92C.3D.735.如图所示的茎叶图记录了甲乙两组各5名工人某日的产量数据(单位:件)。若这两组数据的中位数相等,且平均值也相等,则x和y的值分别为()A.3,5B.5,5C.3,7D.5,76.下图是民航部门统计的2017 年春运期间十二个城市售出的往返机票的平均价格以及相比去年同期变化幅度的数据统计图表,根据图表,下面叙述不正确的是(左起依次是:广州,深圳,北京,杭州,上海,天津,重庆,西安,南京,厦门,成都,武汉)()来源:学科网A.深圳的变化幅度最小,北京的平均价格最高B.深圳和厦门的春运期间往返机票价格同去年相比有所下降C.平均价格从高到低居于前三位的城市为北京、深圳、广州D.平均价格变化量从高到低居于前三位的城市为天津、西安、厦门7.下列说法错误的是()A.回归直线过样本点的中心,x yB.两个随机变量的线性相关性越强,则相关系数的绝对值就越接近于1C.对分类变量X与Y,随机变量2K的观测值k越大,则判断“X与Y有关系”的把握程度越小D.在回归直线方程0.2.8?0yx中,当解释变量x每增加1个单位时,预报变量?y平均增加0.2个单位8.登山族为了了解某山高y(km)与气温x()之间的关系,随机统计了4次山高与相应的气温,并制作了对照表:气温x()1813101y(km)24343864由表中数据,得到线性回归方程?2()?yxa aR,由 此估计山高为72 km处气温的度数为()A.-10 B.-8 C.-4 D.-6 9.某同学为了解秋冬季节用电量(y度)与气温(x)的关系曾由下表数据计算出回归直线方程2?60yx,现表中有一个数据被污损.则被污损的数据为()气温181310-1用电量(度)2434*64A.40B.39C.38D.3710.假设有两个分类变量X和Y的22列联表为:1y2y总计1xa1010a2xc3030c总计6040100总计总计对同一样本,以下数据能说明与有关系的可能性最大的一组为()A.45a,15cB.40a,20cC.35a,25cD.30a,30c11.某公司为确定明年投入某产品的广告支出,对近5年的广告支出x与销售额y(单位:百万元)进行了初步统计,得到下列表格中的数据:y3040m5070 x24568经测算,年广告支出x与年销售额y满足线性回归方程6.517 5?.yx,则m的值为()A.45B.50C.55D.6012.2015 年年岁史诗大剧芈月传风靡大江南北,影响力不亚于以前的甄嬛传.某记者调查了大量芈月传的观众,发现年龄段与爱看的比例存在较好的线性相关关系,年龄在10,14,15,19,20,24,25,29,30,34的爱看比例分别为10%,18%,20%,30%,%t.现用这5个年龄段的中间值x代表年龄段,如12代表10,14,17代表15,19,根据前四个数据求得x关于爱看比例y的线性回归方程为?4.68%ykx,由此可推测t的值为()A.33B.35C.37D.39二、填空题13.某校高一年级有900名学生,其中女生400名,按男女比例用分层抽样的方法,从该年级学生中抽取一个容量为 45 的样本,则应抽取的男生人数为 _14.已知一组数据12345,x xxxx的平均数是2,方差是13,那么另一组数据是1234532,32,32,32,32xxxxx的平均数和方差分别是_.15.总体由编号为01,02,19,20的 20 个个体组成,利用下面的随机数表选取5 个个体,选取方法是从随机数表第1行的第 9 列和第 10 列数字开始从左到右依次选取两个数字,则选出来的第 5 个个体的编号为 _.781665720802631407024369972801983204923449358200362348696938748116.阅 读下列材料,回答后面问题:在 2014 年 12 月 30 日13CCTV播出的“新闻直播间”节目中,主持人说:“加入此次亚航失联航班8501QZ被证实失事的话,2014年航空事故死亡人数将达到1320 人.尽管如此,航空安全专家还是提醒:飞机仍是相对安全的交通工具.世界卫生组织去年公布的数据显示,每年大约有124 万人死于车祸,而即使在航空事故死亡人数最多的一年,也就是1972 年,其死亡数字也仅为3346 人;截至 2014 年 9 月,每百万架次中有2.1 次(指飞机失事),乘坐汽车的百万人中其死亡人数在100 人左右.”对上述航空专家给出的、两段表述(划线部分),你认为不能够支持“飞机仍是相对安全的交通工具”的所有表述序号为_,你的理由是 _.三、解答题17.从某学校的800名男生中随机抽取50名测量身高,被测学生身高全部介于155cm和195cm之间,将测量结果按如下方式分成八组:第一组155,160,第二组160,165,第八组190,195,图是按上述分组方法得到的频率分布直方图的一部分,已知第一组与第八组人数相同,第六组的人数为4人1.求第七组的频率2.估计该校的800 名男生的身高的中位数3.若从身高属于第六组和第八组的所有男生中任取两名男生,记他们的身高分别为,x y,事件5Exy,求P E18.某地小吃“全羊汤”2008年被中国中医学会营养膳食协会评为“中华名吃”,2010年 12月被纳入市级非物质文化遗产名录,打造地方名片.当初向各地作广告推广,对销售收益产生额积极的影响.某年度在若干地区各投入4 万元广告费用后,将各地该年度的销售收益绘制成频率分布直方图(如图所示).由于工作人员操作失误,横轴的数据丢失,但可以确定横轴是从 0 开始计数的.1.根据频率分布直方图,计算图中各小长方形的宽度;2.根据频率分布直方图,估计投入4 万元广告费用之后,销售收益的平均值;(以各组区间中点值代表改组的取值)3.又在某一地区测的另外一些数据,并整理的得到下表:广告投入x(单位:万元)12345销售收益y(单位:百万元)2327请将 2 的结果填入空白栏,表中的数据x 与 y 之间存在线性相关关系.计算关于y 的 x 回归方程,并预测年度广告约投入多少万元时,年销售收益达到千万元?(结果精确达到0.1)19.某校在髙二数学竞赛初赛后,对90 分及以上的成绩进行统计,其频率分布直方图如图所示,若130,140 分数段的参赛学生人数为2.1.求该校成绩在 90,140 分数段的参赛学生人数;2.估计 90 分及以上的学生成绩的众数、中位数和平均数(结果保留整数).20.某公司为确定下一年度投入某种产品的宣传费,需了解年宣传费x(单位:千元)对年销售量y(单位:t)和年利润z(单位:千元)的影响.对近8年的年宣传费ix和年销售量1,2,8iy i数据作了初步处理,得到下面的散点图及一些统计量的值.xyw821()iixx821()iiww81()iiixxyy821()iiiwwyy46.65636.8289.81.61469108.8表中iiwx,8118iiww.1.根据散点图判断,yabx与ycdx哪一个适宜作为年销售量y关于年宣传费x的回归方程类型?(给出判断即可,不必说明理由)2.根据1的判断结果及表中数据,建立y关于x的回归方程.3.已知这种产品的年利润z与x,y的关系为0.2zyx.根据2的结果回答下列问题:年宣传费49x时,年销售量及年利润的预报值是多少?年宣传费x为何值时,年利润的预报值最大?附:对于一组数据11,u v,22,u v,nnuv其回归直线vu的斜率和截距的最小二乘估计分别为121?niiiniiuuvvuu,?vu.21.淡水养殖场进行某水产品的新、旧网箱养殖方法的产量对比,收获时各随机抽取了100个网箱,测量各箱水产品的产量(单位:kg),其频率分布直方图如下:1.设两种养殖方法的箱产量相互独立,记A表示事件:旧养殖法的箱产量低于50kg,新养殖法的箱产量不低于50kg,估计A的概率;2.填写下面列联表,并根据列联表判断是否有99%的把握认为箱产量与养殖方法有关:箱产量50kg箱产量50kg旧养殖法新养殖法3.根据箱产量的频率分布直方图,求新养殖法箱产量的中位数的估计值(精确到0.01)2P Kk0.050 0.010 0.001k3.841 6.63510.828附:22()n adbcKabcdacbd参考答案一、选择题1.答案:B解析:2.答案:A解析:3.答案:A解析:设这个数为x,则平均数为257x,众数为2,若2x,则中位数为2,此时11x;若24x,则中位数为x,此时25227xx,3x;若4x,则中位数为4,252427x,17x,所有可能值为11,3,17,故其和为113 179,故选 A.4.答案:C解析:根据茎叶图中的数据,该组数据的平均数为111132011.754xab,3ab;411413ababab141554333baab,当且仅当2ab,即2a,1b时取“=”;41ab的最小值为3,故选 C.5.答案:A解析:由题意,甲组数据为56,62,65,70 x,74,乙组数据为59,61,67,60y,78.要使两组数据中位数相等,有6560y,所以5y,又平均数相同,则566265(70)74596167657855x,解得3x.故选 A.6.答案:D解析:由图可知D错误.故选 D.7.答案:C解析:根据相关定义分析知,A B D正确;C中对分类变量X与Y的随机变量2K的观测值k来说,k越大,“X与Y有关系”的把握程度越大,故C不正确,故选C.8.答案:D解析:由题意可得10 x,10y,2402 1060ayx,2?60yx,当?72y时,有26072x,解得6x,故选D.9.答案:C解析:由于回归直线方程2?60yx过样本点的中心,x y则,解得*38.故选 C.10.答案:A解析:由题意可得,当10aa与30cc相差越大,X和Y有关系的可能性最大,分析四组选项,A 中的a,c的值最符合题意,故选A.11.答案:D解析:12.答案:B解析:前4个数据对应的19.5x,0.195y(把百分数转化为小数),而4.68%?0.0468ykxbx,0.19519.6?50.04 8b,0.24?01b,1.24.6%?4 8yx,当3034322x,1.24 324.6835t.二、填空题13.答案:25解析:由题意得抽样比例为45190020,故应抽取的男生人数为15002520.14.答案:4,117解析:15.答案:01解析:选取方法是从随机数表第1 行的第 9 列和第 10 列数字开始从左到右依次选取两个数字中小于等于20 的编号依次为08,02,14,07,01则第 5 个个体的编号为0116.答案:或;选,数据虽是同类数据,但反映不出乘车出行和乘飞机出行的总人数的关系;选,数据两个数据不是同一类数据,这与每架次飞机的乘机人数有关;不选,数据两个数据虽表面不是同一类数据,但是可以做如下大致估算,考虑平均每架次飞机的乘机人数为x,这样每百万人乘机死亡人数2.1 人,要远远少于乘车每百万人中死亡人数.解析:选,数据虽是同类数据,但反映不出乘车出行和乘飞机出行的总人数的关系;选,数据两个数据不是同一类数据,这与每架次飞机的乘机人数有关;不选,数据两个数据虽表面不是同一类数据,但是可以做如下大致估算,考虑平均每架次飞机的乘机人数为x,这样每百万人乘机死亡人数2.1 人,要远远少于乘车每百万人中死亡人数三、解答题17.答案:1.第六组的频率为40.0850,所以第七组的频率为10.085(0.00820.0160.0420.06)0.06;2.身高在第一组155,160的频率为0.008 50.04,身高在第二组160,165的频率为0.016 50.08,身高在第三组165,170)的频率为0.04 50.2,身高在第四组170,175)的频率为0.04 50.2,由于0.040.080.20.320.5,0.040.080.20.20.520.5估计这所学校的800名男生的身高的中位数为m,则170175m,由0.040.080.21700.040.5m得174.5m,所以可估计这所学校的800名男生的身高的中位数为174.53.第六组180,185)的人数为4人,设为,a b c d,第八组190,195的人数为2人,设为,A B,则有,ab ac ad bc cd aA bA cA dA,aB bB cB dB AB共15种情况,因事件5Exy发生当且仅当随机抽取的两名男生在同一组,所以事件E包含的基本事件为,ab ac ad bc bd cd AB共7种情况,故715P E解析:18.答案1.设各小长方形的宽度为m,由频率分布直方图各小长方形面积总和为1,可知0.080.10.140.120.040.020.51mm,故2m2.由1知各小组依次是0,2,2,4,4,6,6,8,8,10,10,12,其中点分别为1,3,5,7,9,11,对应的频率分别为0.16,0.20,0.28,0.24,0.08,0.04,故可估计平均值为1 0.163 0.25 0.287 0.2490.08 11 0.0453.空白栏中填5.由题意可知1234535x,232573.85y,511 22332455 769iiix y,522222211234555iix,根据公式,可求得,269533.8?1.2,3.81.230.25553ba即回归直线的方程为.由题意101.20.2x,解得8.2x,即年度广告投入约8.2万元时,年度销售收益可达到千万元.19.答案:1.130,140分数段的人数为2,又130,140分数段的频率为0.005 100.05.90,140分数段的参赛学生人数为20.0540.2.100,1110 110,120,120,130,90,100130,(,140分数段的参赛学生人数依次为40100.0104,40100.02510,40100.04518,40 100.0156.2909 分及以上的学生成绩的众数的估计值为115分,中位数的估计值为0.50.10.25 3401101130.0453(分),平均数的估计值为954 105 10115181256135211340(分).解析:20.答案:1.由散点图可以判断,ycdx适宜作为年销售量y关于年宣传费x的回归方程类型.2.令wx,先建立y关于w的线性回归方程.由于81821108.868,563686.8100.61?.6iiiiiwwyydcydwww,所以y关于w的线性回归方程为100.68?6yw,因此y关于x的回归方程为100.68?6dx.3.由 2 知,当49x时,年销售量y的预报值100.668 495?76.6y,年利润z的预报值576.6 0.249?66.32z.根据 2 的结果知,年利润z的预报值0.2 100.66813.620.1?2zxxxx.所以当13.66.82x,即x46.24时,?z取得最大值.故年宣传费为46.24千元时,年利润的预报值最大.解析:21.答案:1.记B表示事件“旧养殖法的箱产量低于50kg”,C表示事件“新养殖法的箱产量不低于50kg”.由题意知P AP BCP B P C.旧养殖法的箱产量低于50kg的频率为0.0120.0140.0240.0340.04050.62,故P B的估计值为0.62.新养殖法的箱产量不低于50kg的频率为0.0680.0460.0100.00850.66.故P C的估计值为0.66.因此,事件A的概率估计值为0.62 0.660.4092.2.根据箱产量的频率分布直方图得列联表箱产量50kg箱产量50kg旧养殖法6238新养殖法346622200626634386238346662343866K222409212922280010096 10499840015.70510.828有99%以上的把握认为产箱量与养殖方法有关.3.因为新养殖法的箱产量频率分布直方图中,箱产量低于50kg的直方图面积为0.0040.0200.04450.340.5,箱产量低于55kg的直方图面积为0.0040.0200.0440.06850.680.5,故新养殖法箱产量的中位数的估计值为0.50.345052.350.068kg.