2023年高考数学重难点复习:统计与统计案例.pdf
2023年高考数学重难点复习:统计与统计案例 考情分析 高考对本讲内容的考查往往以实际问题为背景,考查随机抽样与用样本估计总体,线性回归方程的求解与运用,独立性检验问题.常与概率综合考查,中等难度.考点一统计图表【核心提炼】1.频率分布直方图中横坐标表示组距,纵坐标表示期类,频率=组距x型土组距 组距2.频率分布直方图中各小长方形的面积之和为I.3.利用频率分布直方图求众数、中位数与平均数.频率分布直方图中:(1)最高的小长方形底边中点的横坐标即众数.(2)中位数左边和右边的小长方形的面积和相等.(3)平均数是频率分布直方图的“重心”,等于频率分布直方图中每个小长方形的面积乘以小长方形底边中点的横坐标之和.例1 (1)(多选)(2020新高考全国H)我国新冠肺炎疫情防控进入常态化,各地有序推进复工复产,下面是某地连续11天复工复产指数折线图,下列说法正确的是()A.这11天复工指数和复产指数均逐日增加B.这11天期间,复产指数增量大于复工指数的增量C.第3天至第11天复工复产指数均增大都超过80%D.第9天至第11天复产指数增量大于复工指数的增量答 案CD(2)学校为了了解新课程标准提升阅读要求对学生阅读兴趣的影响情况,随机抽取了 100名学生进行调查.根据调查结果绘制学生周末阅读时间的频率分布直方图如图所示:第1页 共1 7页将阅读时间不低于3 0 分钟的学生称为“阅读霸”,则下列结论正确的是()A.抽样表明,该校约有一半学生为阅读霸B.该校只有5 0 名学生不喜欢阅读C.该校只有5 0 名学生喜欢阅读D.抽样表明,该校有5 0 名学生为阅读霸答 案 A解 析 根据频率分布直方图可列下表:阅读时间(分钟)0,1 0)1 0,2 0)2 0,3 0)3 0,4 0)4 0,5 0)5 0,6 0 抽样人数(名)1 01 82 22 52 05抽 样 1 0 0 名学生中有5 0 名为阅读霸,占一半,据此可判断该校约有一半学生为阅读霸.易 错 提 醒(1)对于给出的统计图表,一定要结合问题背景理解图表意义,不能似懂非懂.(2)频率分布直方图中纵坐标不要误以为频率.跟踪演练1 (1)某旅游城市为向游客介绍本地的气温情况,绘制了一年中各月平均最高气温和平均最低气温的雷达图.图中力点表示十月的平均最高气温约为15 ,8点表示四月的平均最低气温约为5 .下面叙述不正确的是()-平均最低气温一平均最高气温A.各月的平均最低气温都在0 以上B.七月的平均温差比一月的平均温差大C.三月和十一月的平均最高气温基本相同D.平均最高气温不低于2 0 的月份有5个答 案 D第2页 共1 7页解析 由题中雷达图易知A,C正确.七月份平均最高气温超过2 0 C,平均最低气温约为13 ;一月份平均最高气温约为6 C,平均最低气温约为2 C,所以七月的平均温差比一月平均温差大,故 B 正确.由题图知平均最高气温不低于2 0 C 的月份为六、七、八月,有 3个.(2)(多选)(2 02 0重庆模拟)新高考方案规定,普通高中学业水平考试分为合格性考试(合格考)和选择性考试(选择考),其 中“选择考”成绩将计入高考总成绩,即将学生考试时的原始卷面分数由高到低进行排序,评定为4 B,C,D,E五个等级,再转换为分数计入高考总成绩.某试点高中2 02 0年参加“选择考”总人数是2 018 年参加“选择考”总人数的2倍,为了更好地分析该校学生“选择考”的水平情况,统计了该校2 018 年和2 02 0年“选择考”成绩等级结果,得到如图所示的统计图.2018年该校学业水平选择性考试数据统计b 2020年该校学业水平选择性考试数据统计频率40%-28%.-r-24%-i6%-1 I2%卜-T -1 I-1 I-O A B C D E 等级针对该校“选择考”情况,2 02 0年与2 018 年比较,下列说法正确的是()A.获得/等级的人数增加了B.获得B 等级的人数增加了 1.5 倍C.获得。等级的人数减少了一半D.获得E等级的人数相同答 案 A B解析 设 2 018 年参加“选择考”的总人数为x,则 2 02 0年参加“选择考”的总人数为2 x,根据图表得出2 018 年和2 02 0年各个等级的人数如表所示.X.等级年ABCDE2 0180.2 8 x0.3 2 x0.3 0 x0.08 x0.02 x第3页 共1 7页2 02 00.4 8 x0.8%0.5 6%0.12 x0.04 x由表可知,获得4等级的人数增加了,故 A正确;获得8等级的人数增加了 5。VQ=1.50.3 2 x倍,故 B 正确;获得。等级的人数增加了,故 C错误;获得E等级的人数不相同,故 D错误.考点二回归分析【核心提炼】在分析两个变量的相关关系时,可根据样本数据作出散点图来判断两个变量之间是否具有相关关系.若具有线性相关关系,则回归直线过样本点的中心(x ,y),并且可通过线性回归方程估计预报变量的值.例 2 (2 02 0全国H)某沙漠地区经过治理,生态系统得到很大改善,野生动物数量有所增加.为 调查该地区某种野生动物的数量,将其分成面积相近的2 0 0 个地块,从这些地块中用简单随机抽样的方法抽取2 0 个作为样区,调查得到样本数据(为,H)(i=1,2,,2 0),其中M 和弘分别表示第,个 样区的植物覆盖面积(单位:公顷)和这种野生动物的数量,并计算得错误!尸6 0,错误!,=1 2 0 0,错误!(为一*=8 0,错误!y)2=9 0 0 0,错误!(X L x)(y,-y )=8 0 0.(1)求该地区这种野生动物数量的估计值(这种野生动物数量的估计值等于样区这种野生动物数量的平均数乘以地块数);(2)求样本(如 y,)(i=l,2,2 0)的相关系数(精确到0.0 1):(3)根据现有统计资料,各地块间植物覆盖面积差异很 大.为提高样本的代表性以获得该地区这种野生动物数量更准确的估计,请给出一种你认为更合理的抽样方法,并说明理由.附:相关系数厂=错误!,/七 1.4 1 4.解(1)由已知得样本平均数V =捕 误!,=6 0,从而该地区这种野生动物数量的估计值为6 0 X 2 0 0=1 2 0 0 0.(2)样本(为,y,)(/=1,2,2 0)的相关系数r=错误!8 0 0 2 也.=I=-心 0.9 4.V 8 0 X 9 0 0 0 3(3)分层抽样:根据植物覆盖面积的大小对地块分层,再对2 0 0 个地块进行分层抽样.第4页 共1 7页理由如下:由(2)知各样区的这种野生动物数量与植物覆盖面积有很强的正相关关系.由于各地块间植物覆盖面积差异很大,从而各地块间这种野生动物数量差异也很大,采用分层抽样的方法较好地保持了样本结构与总体结构的一致性,提高了样本的代表性,从而可以获得该地区这种野生动物数量更准确的估计.规律方法 样本数据的相关系数 8-X)3 -N)_1=_出8-*M-J反映样本数据的相关程度,越大,则相关性越强.跟踪演练2(1)已知某产品的销售额y与广告费用x之间的关系如下表:M单位:万元)01234武单位:万元)1015203035若求得其线性回归方程为J=6.5 x+a,则预计当广告费用为6万元时的销售额为()A.42万元 B.45万元 C.48万元 D.51万元答 案C解 析 由题意,根据上表中的数据,可得 x=2,y=22,即样本点的中心为(2,22),又线性回归方程;=6.5x+。经过样本点的中心,A A所以 2 2=6.5 X 2+a,解得a=9,A A所以歹=6.5 x+9,当 x=6 时,y=48.(2)(2020河北衡水中学月考)有一散点图如图所示,在5个刃数据中去掉。(3,10)后,下列说法正确的是()y-(10,12)0(3,10)C(4,5)8(2,4)A(l,3)O xA.残差平方和变小B.相关系数尸变小C.相关指数R2变小D.解释变量x与预报变量歹的相关性变弱第5页 共1 7页答 案 A解 析 从散点图可分析得出:只有。点偏离直线远,去掉。点,解释变量x与预报变量y的线性相关性变强,.相关系数变大,相关指数变大,残差平方和变小,故选A.考点三独立性检验【核心提炼】假设有两个分类变量x 和匕 它们的取值分别为*i,刈 和 n,m ,其样本频数列联表(称为2 X2 列联表)为:及总计Xaba+bX2cdc+d总计Q+Ch+da+b+c+d烂=_ n(ad-bc)2_(a+b)(a+c)(b+叶(c+r f)(其中n=a+b+c+d为样本容量).例 3 (2020新高考全国I)为加强环境保护,治理空气污染,环境监测部门对某市空气质量进行调研,随机抽查了 100天空气中的P M 2.5 和 S O 2浓度(单位:ng/m3),得下表:S O2P M 2.5 .0,5 0(5 0,15 0(15 0,4 75 0,3 5 3 2184(3 5,75 6812(75,115 3710(1)估计 事 件“该市一天空气中P M 2.5 浓度不超过75,且 S O 2浓度不超过15 0”的概率;(2)根据所给数据,完成下面的2 X2 列联表:S O 2P M 2.5 .0,15 0(15 0,4 75 0,75(75,115(3)根据(2)中的列联表,判断是否有99%的把握认为该市一天空气中P M 2.5 浓度与S Ch浓度有关?附:烂二M dbcY,(a+b)(c+d)(a+c)(b+d)第6页 共1 7页P(烂自)0.05 00.0100.001ko3.84 16.6 3 510.828解(1)由表格可知,该 市 100天中,空气中的P M 2.5 浓度不超过75,且 S O 2浓度不超过15 0的天数为 3 2+6+18+8=6 4,所以该市一天中,空气中的P M 2.5 浓度不超过75,且 S th浓度不超过15 0的概率的估计值为6 4 八-=0.6 4.100(2)由所给数据,可得2 X2 列联表:S O 2 0,15 0(15 0,4 75 0,75 6 416(75,115 1010(3)根据2 X2 列联表中的数据可得K,_ _ _ _ _ _ (a d-6 c)2_ _ _ _ _ _(a+6)(c+d)(a+c)(b+d)=100X(6 4 X 10 16 X 10)280X 20X 74 X 26 7.4 84 6.6 3 5,故有99%的把握认为该市一天空气中P M 2.5 浓度与S O 2浓度有关.规律方法独立性检脸的关键(1)根据2 X2 列联表准确计算K2,若 2 X2 列联表没有列出来,要先列出此表.(2)岸的观测值左越大,对应的假设H o 成立的概率越小,H o 不成立的概率越大.跟踪演练3 (1)随着国家二胎政策的全面放开,为了调查一线城市和非一线城市的二胎生育意愿,某机构用简单随机抽样方法从不同地区调查了 100位育龄妇女,结果如下表.非一线城市一线城市总计愿生4 5206 5不愿生13223 5总计5 84 2100附表:P(群三例)0.1000.05 00.0100.001ko2.7063.84 16.6 3 510.828第7页 共1 7页由 -Madhc)2-计算得,(a+6)(c+d)(a+c)(b+d)mxw 牯,100X(4 5 X 22-20X 13)2 n r)rK2 的观测值 k=-=9.6 16,5 8X 4 2X 3 5 X 6 5参照附表,得到的正确结论是()A.在犯错误的概率不超过0.1%的前提下,认 为“生育意愿与城市级别有关”B.在犯错误的概率不超过0.1%的前提下,认 为“生育意愿与城市级别无关”C.有 99%以上的把握认为“生育意愿与城市级别有关”D.有 99%以上的把握认为“生育意愿与城市级别无关”答 案 C解 析 由题意知,K2 的观测值 9.616 6.63 5,.有9 9%以上的把握认为“生育意愿与城市级别有关”.(2)某校团委对“学生性别和喜欢某视频A P P 是否有关”做了一次调查,其中被调查的女生人数是男生人数的一半,男生喜欢某视频A P P 的人数占男生人数的女生喜欢某视频A P P 的人数占女生人数的|,若有95%的把握认为喜欢某视频A P P 和性别有关,则男生至少有()附:P(烂2%0)0.0 500.0 10ko3.84 16.63 5(a+b)(c+J)(a+c)(b+d)A.12 人 B.6 人 C.10 人 D.18 人答 案 A解析 设被调查的男生人数为x,则被调查的女生人数为三则2X2列联表为2喜欢某视频A P P不喜欢某视频A P P总计男生X65x6X女生X3X6X2总计X2X3x2第8页 共1 7页fxKZx 5x、/n以3v|6-X-6-6 X-3ljb若有95%的把握认为喜欢某视频A P P 和性别有关,则 烂 2 3.84 1,即 晓=2xX-X-Xx2 2 3.84 1,贝 ijx也 包 叁 比 10.2 4 3,又 工,王均为整数,所以男生至少有12 人.8 3 2 3 6专题强化练一、单项选择题1.某人5 次上班途中所花的时间(单位:分钟)分别为x,yl0,ll,9,已知这组数据的平均数为10,方差为2,则|x-y|的值为()A.4 B.3 C.2 D.1答 案 A解 析 依 题 意 有+l;+U+9=10,(x-10)2+(y10)2+(10 10)2+(11 10)2+(9-10)2=5 义2,解得 x=8,y=12 或 x=12,y=8,故|xH=4.2.(2 0 19 全 国 H I)西游记 三国演义 水浒传和 红楼梦是中国古典文学瑰宝,并称为中国古典小说四大名著.某中学为了解本校学生阅读四大名著的情况,随机调查了 10 0 位学生,其中阅读过 西游记或 红楼梦的学生共有90 位,阅读过 红楼梦的学生共有80 位,阅 读 过 西游记且阅读过 红楼梦的学生共有60 位,则该校阅读过 西游记的学生人数与该校学生总数比值的估计值为()A.0.5 B.0.6 C.0.7 D.0.8答 案 C解析 根据题意阅读过 红楼梦 西游记的人数用韦恩图表示如下:所以该校阅读过 西游记的学生人数与该校学生总数比值的估计值为型=0.7.10 03.(2 0 2 0 全国I )某校一个课外学习小组为研究某作物种子的发芽率y 和温度x(单位:C)的关系,在 2 0 个不同的温度条件下进行种子发芽实验,由实验数据8,弘)(,=1,2,,2 0)得到下面的散点图:第9页 共1 7页100%80%60%40%20%40温度/七由此散点图可以看出,在 10至 40之间,下面四个回归方程类型中最适宜作为发芽率夕和温度x 的回归方程类型的是()A.y a+bxC.y=a+he!B.y a+bx2D.y=a-hn x答 案 D解 析 由散点图可以看出,点大致分布在对数型函数的图象附近.4.某生产车间的甲、乙两位工人生产同一种零件,这种零件的标准尺寸为85 m m,现分别从他们生产的零件中各随机抽取8 件进行检测,其尺寸(单位:mm)用茎叶图表示如图所示,则估计()A.甲、乙生产的零件尺寸的中位数相等B.甲、乙生产的零件质量相当C.甲生产的零件质量比乙生产的零件质量好D.乙生产的零件质量比甲生产的零件质量好答 案 D解 析 甲 生 产 的 零 件 尺 寸 是 93,89,88,85,84,82,79,78;乙 生 产 的 零 件 尺 寸 是90,88,86,85,85,84,84,78.故甲生产的零件尺寸的中位数是受士色=84.5,乙生产的零件尺寸的2中位数是变士至=8 5,故 A 错误;根据数据分析,乙的数据较稳定,故乙生产的零件质量比2甲生产的零件质量好,故 B,C 错误.5.某校进行了一次创新作文大赛,共 有 100名同学参赛,经过评判,这 100名参赛者的得分都在 40,90 之间,其得分的频率分布直方图如图所示,则下列结论错误的是()频率0.0350.030O 40 50 6()70 80 90 得分/分第1 0页 共1 7页A.得分在 40,60)之间的共有40 人B.从 这 100名参赛者中随机选取1人,其得分在 60,80)之间的概率为0.5C.估计得分的众数为55D.这 100名参赛者得分的中位数为65答 案 D解析 根据频率和为 1,计算(4+0.035+0.030+0.020+0.010)X 10=1,解得。=0.005,得分在 40,60)之间的频率是().4,估计得分在 40,60)之间的有100X0.4=40(人),A 正确;得分在 60,80)之间的频率为0.5,可得从这100名参赛者中随机选取1 人,得分在 60,80)之间的概率为0.5,B 正确;根据频率分布直方图知,最高的小矩形对应的底边中点为卫二史=5 5,即估计众数为55,C2正确;根据频率分布直方图知,得分低于60 分的直方图面积为(0.005+0.035)Xl()=0.40.5,所 以 100名参赛者得分的中位数估计为60+5-463.3,D 错误.0.030二、多项选择题A.该学校男生对食堂服务满意的概率的估计值为B.调研结果显示,该学校男生比女生对食堂服务更满意C.有 95%的把握认为男、女生对该食堂服务的评价有差异D.有 99%的把握认为男、女生对该食堂服务的评价有差异答 案 AC解析 对于选项A,该学校男生对食堂服务满意的概率的估计值为3故 A 正确;30+20 5第1 1页 共1 7页对于选项B,该学校女生对食堂服务满意的概率的估计值为T=4W,故 B错误;因为4 0+1 0 5 5 4.7 6 2 3.8 4 1,所以有9 5%的把握认为男、女生对该食堂服务的评价有差异,故 C正确,D错误.7.(2 0 2 0 河北衡水中学月考)5 G 时代已经到来,5 G 的发展将直接带动包括运营、制造、服务在内的通信行业经济的快速增长,进而对G D P 增长产生直接贡献,并通过产业间的关联效应和波及效应,间接带动国民经济各行业的发展,创造出更多的经济增加值.如图是某单位结合近几年数据,对今后几年的5 G 经济产出所做的预测.S O a/G经济产出/亿元25 00020(XM)5(MX)2020 2021 2022 2023 2024 202520262027 2028 2029 2030运营商口信息服务商设备制造商结合上图,下列说法正确的是()A.5 G的发展带动今后几年的总经济产出逐年增加B.设备制造商的经济产出前期增长较快,后期放缓C.信息服务商与运营商的经济产出的差距有逐步拉大的趋势D.设备制造商在各年的经济产出中一直处于领先地位答 案 A BC解析 由图易知A,B,C正确,而设备制造商的经济产出在2 0 2 9 年和2 0 3 0 年将低于信息服务商的经济产出,故 D错误.8.(2 0 2 0 青岛模拟)某调查机构对全国互联网行业进行调查统计,得到整个互联网行业从业者年龄分布饼状图、9 0 后从事互联网行业岗位分布条形图,则下列结论正确的是()注:9 0 后 指 1 9 9 0 年及以后出生,8 0 后 指 1 9 8 0 1 9 8 9 年之间出生,8 0 前 指 1 9 7 9 年及以前出生.80 前 3%90后从事互联网行业齿位分布图技术39.6%运营市场 13.2%设计 12.3%职能 9.8%产品!6.5%其他 1.6%A.互联网行业从业人员中从事技术和运营岗位的人数占总人数的三成以上B.互联网行业中从事技术岗位的人数超过总人数的2 0%C.互联网行业中从事运营岗位的人数9 0 后比8 0 前多D.互联网行业中从事技术岗位的人数9 0 后比8 0 后多第1 2页 共1 7页答 案 ABC解析 选项A,因为互联网行业从业人员中,“9 0 后”占比为5 6%,其中从事技术和运营岗位的人数占的比分别为39.6%和 1 7%,则“9 0 后”从事技术和运营岗位的人数占总人数的56%X(39.6%+17%)p 31.7%.“80前”和“80后”中必然也有从事技术和运营岗位的人,则总的占比一定超过三成,故选项A 正确;选项B,因为互联网行业从业人员中,“90后”占比为5 6%,其中从事技术岗位的人数占的比为39.6%,则“9 0 后”从事技术岗位的人数占总人数的56%X39.6%22.2%.“80前”和“80后”中必然也有从事技术岗位的人,则总的占比一定超过2 0%,故选项B 正确;选项C,“9 0 后”从事运营岗位的人数占总人数的比为56%X 17%比9.5%,大 于“80前”的总人数所占比3%,故选项C 正确;选项D,“9 0 后”从事技术岗位的人数占总人数的56%X39.6%P 22.2%,“80后”的总人数所占比为4 1%,条件中未给出“8 0 后”从事技术岗位的占比,故不能判断,所以选项D错误.三、填空题9.某企业的一种商品的产量与成本数据如下表:产量x(万件)1416182022成本兴元/件)12107a3若根据表中提供的数据,求出y 关于x 的线性回归方程为j=-1.15x+28.1,则。的值为答 案 5A n+t-工啪 14+16+18+20+22 90.解析 由题意知x=-=18,5 5二 _ 12+10+7+。+3_ 32+。5 5又 y=-1.15X 18+28.1=7.4,所以 =7.4,解得a=5.51 0.已知某地区中小学生人数和近视情况分别如图甲和图乙所示.为了 了解该地区中小学生的近视形成原因,用分层抽样的方法抽取2%的学生进行调查,则 样 本 容 量 为,抽取 的 高 中 生 近 视 人 数 为.第1 3页 共1 7页,近视率()50.-I30.i*r i 1111.。小 学 初 中 高 中 年 级图甲 图乙答 案 200 20解析 由题图甲知,总人数为3 500+2000+4 500=10000,所以样本容量为10 000X2%=200,抽样比例为工,所以高中生抽取的学生数为4 0,所以抽取的高中生近视人数为40X50%50=20.11.下面的折线图给出的是甲、乙两只股票在某年中每月的收盘价格,已知股票甲的极差是6.88元,标准差为2.04元;股票乙的极差为27.47元,标准差为9.63元,根据这两只股票在这一年中的波动程度,给出下列结论:股票甲在这一年中波动相对较小,表现的更加稳定;购买股票乙风险高但可能获得高回报;股票甲的走势相对平稳,股票乙的收盘价格波动较大;两 只 股 票 在 全 年 都 处 于 上 升 趋 势.其 中 正 确 的 结 论 是.(填序号)收盘价格/元一股票甲/元 t-股票乙/元40O I ,I I I I I I I I I a1 2 3 4 5 6 7 8 9 10 11 12月份答 案 解析 由题意可知,甲的标准差为2.04元,乙的标准差为9.63元,可知股票甲在这一年中波动相对较小,表现的更加稳定,故正确;甲的极差是6.88元,乙的极差为27.47元,可知购买股票乙风险高但可能获得高回报,故正确;通过折线图可知股票甲的走势相对平稳,股票乙的收盘价格波动较大,故正确;通过折线图可得乙在6 月到8 月明显是下降趋势,故错误.12.设某大学的女生体重双单位:kg)与身高x(单位:cm)具有线性相关关系,根据一组样本数据(为,词,),用最小二乘法建立的回归方程为y=o.85x-85.71,则下列结论中不正确的是.(填序号)y 与 x 具有正的线性相关关系:回归直线过样本点的中心(x,V);若该大学某女生身高增加1 c m,则其体重约增加0.85 kg;若该大学某女生身高为170 c m,则可断定其体重必为58.79 kg.答 案 第1 4页共1 7页解析 由于线性回归方程中x 的系数为0.8 5,因此y 与x 具有正的线性相关关系,故正确;因为回归直线必过样本点的中心(x,V),所以正确;由线性回归方程的意义知,某女生的身高增加1 c m,其体重约增加0.85 k g,故正确;当某女生的身高为170cm时,其体重估计值是58.79 k g,这不是确定值,因此不正确.四、解答题1 3.某公司为了 了解广告投入对销售收益的影响,在若干地区各投入3.5万元广告费用,并将各地的销售收益绘制成频率分布直方图,如图所示,由于工作人员操作失误,横轴的数据丢失,但可以确定横轴是从0 开始计数的.(1)根据频率分布直方图计算图中各小长方形的宽度;(2)估计该公司投入3.5万元广告费用之后,对应销售收益的平均值(以各组的区间中点值代表该组的取值);(3)该公司按照类似的研究方法,测得另外一些数据,并整理得到下表:广告投入x(单位:万元)12345销售收益兴单位:万元)2327表中的数据显示,x 与y 之间存在线性相关关系,请将(2)中的结果填入空白栏,并计算y 关于 x 的线性回归方程.A A A附:6=错误!,a y-b x.解(1)设各小长方形的宽度为由频率分布直方图中各小长方形面积总和为1,可知(0.08+0.10+0.14+0.12+0.04+0.02)-/=0.5=1,故 m=2.(2)由(1)知,各分组依次是0,2),2,4),4,6),6,8),8,10),10,12,其中点值分别为 1,3,5,7,9,11,对应的频率分别为。16,0.20,0.28,0.24,0.08,0.04,故可估计平均值为 1X0.16+3X0.20+5X0.28+7X0.24+9X0.08+11X0.04=5.(3)空白栏中填5.由题意可知,Yx -1-+-2-+-3-+-4-+-5-=3-,yv -2-+-3-+-2-+-5-+-7-=3.8o,5 55X 2+2X 3+3X 2+4X 5+5X 7=69,第1 5页 共1 7页5E x?=l2+22+32+42+52=55.i=1根据公式可求得6=错误!=6 9-5 X 3 X 3.85 5-5 X 321 21 01.2,a=3.8-1.2 X 3=0.2,即线性回归方程为;=1.2 x+0.2.1 4.(2 0 2 0 全 国m)某学生兴趣小组随机调查了某市1 0 0天中每天的空气质量等级和当天到某公园锻炼的人次,整理数据得到下表(单位:天):锻炼人次空气质量京 0,2 0 0(2 0 0,4 0 0(4 0 0,6 0 0 1(优)21 62 52(良)51 01 23(轻度污染)6784(中度污染)720(1)分别估计该市一天的空气质量等级为1 2 3,4的概率:(2)求一天中到该公园锻炼的平均人次的估计值(同一组中的数据用该组区间的中点值为代表);(3)若某天的空气质量等级为1或2,则称这天“空气质量好”;若某天的空气质量等级为3或4,则称这天“空气质量不好”.根据所给数据,完成下面的2X2列联表,并根据列联表,判断是否有9 5%的把握认为一天中到该公园锻炼的人次与该市当天的空气质量有关?人次W 4 0 0人次4 0 0空气质量好空气质量不好_ n(ad-b e):_ _ _ _ _ _ _(a+6)(c+J)(a+c)(b+d)尸(烂瓦)0.0 500.0 1 00.0 0 1ko3.8 4 16.6 3 51 0.8 2 8解(1)由频数分布表可知,该市一天的空气质量等级为1的概率为 过 鬻”=0.4 3,第1 6页 共1 7页等级为2 的概率为=0.27,100等级为3 的概率为6+7+8=021,100等级为4 的概率为7+2+()=O.O9.100(2)由频数分布表可知,一 天 中 到 该 公 园 锻 炼 的 人 次 的 平 均 数 为+=350.(3)2X2列联表如下:人次400人次 400总计空气质量好333770空气质量不好22830总计5545100烂=100X(33X837X22)2/8 2 0 3.8 4 1,55X45X70X30因此,有 95%的把握认为一天中到该公园锻炼的人次与该市当天的空气质量有关.第1 7页 共1 7页