2015_2016学年高中数学第三章统计案例单元综合检测新人教A版选修2_3.doc
【成才之路】2015-2016学年高中数学 第三章 统计案例单元综合检测 新人教A版选修2-3时间120分钟,满分150分。一、选择题(本大题共12个小题,每小题5分,共60分,在每小题给出的四个选项中只有一个是符合题目要求的)1(2015·唐山一中高二期中)已知具有线性相关关系的两个变量x,y之间的一组数据如下:x01234y2.24.3t4.86.7且回归方程是0.95x2.6,则t()A2.5B3.5C4.5D5.5答案C解析(01234)2,0.95×22.64.5,又(2.24.3t4.86.7),t4.5,故选C2(2014·湖南益阳市箴言中学模拟)四名同学根据各自的样本数据研究变量x、y之间的相关关系,并求得回归直线方程,分别得到以下四个结论:y与x负相关且2.347x6.423; y与x负相关且3.476x5.648;y与x正相关且5.437x8.493;y与x正相关且4.326x4.578.其中一定不正确的结论的序号是()A BC D答案D解析y与x正(或负)相关时,线性回归直线方程yx中,x的系数>0(或<0),故错3有甲、乙两种钢材,从中各取等量样品检验它们的抗拉强度指标如下: 甲X110120125130135P0.10.20.40.10.2乙X100115125130145P0.10.20.40.10.2现要比较两种钢材哪一种抗拉强度较好,应考察哪项指标()A期望与方差 B正态分布CK2 D概率答案A4(2014·安徽示范高中联考)给出下列五个命题:将A、B、C三种个体按312的比例分层抽样调查,如果抽取的A个体为9个,则样本容量为30;一组数据1,2,3,3,4,5的平均数、众数、中位数都相同;甲组数据的方差为5,乙组数据为5,6,9,10,5,那么这两组数据中比较稳定的是甲;已知具有相关关系的两个变量满足的回归直线方程为y12x,则x每增加1个单位,y平均减少2个单位;统计的10个样本数据为125、120、122、105、130、114、116、95、120、134,则样本数据落在114.5,124.5)内的频率为0.4.其中真命题为()A BC D答案B解析样本容量为9÷18,是假命题;数据1,2,3,3,4,5的平均数为(123345)3,中位数为3,众数为3,都相同,是真命题;乙7,s(57)2(67)2(97)2(107)2(57)2×(41494)4.4,s>s,乙稳定,是假命题;是真命题;数据落在114.5,124.5)内的有:120,122,116,120共4个,故所求概率为0.4,是真命题5对变量x、y观测数据(x1,y1)(i1,2,10),得散点图1;对变量u、v有观测数据(u1,v1)(i1,2,10),得散点图2.由这两个散点图可以判断()A变量x与y正相关,u与v正相关B变量x与y正相关,u与v负相关C变量x与y负相关,u与v正相关D变量x与y负相关,u与v负相关答案C解析本题主要考查了变量的相关知识,考查学生分析问题和解决问题的能力用散点图可以判断变量x与y负相关,u与v正相关6(2014·济南市模拟)为了解疾病A是否与性别有关,在一医院随机地对入院50人进行了问卷调查得到了如下的列联表:患疾病A不患疾病A总计男20525女101525总计302050请计算出统计量K2,你有多大的把握认为疾病A与性别有关()下面的临界值表供参考:P(K2k)0.050.0100.0050.001k3.8416.6357.87910.828A95% B99%C99.5% D99.9%答案C解析由公式得K28.333>7.879,故有10.00599.5%的把握认为疾病A与性别有关7(2014·洛阳市高二期中)已知回归直线的斜率的估计值是2,样本点的中心为(4,12),则回归直线的方程是()A2x4 Bx2C2x20 Dx2答案A解析由回归直线方程x的定义知,2,回归直线过样本点的中心,122×4,4,回归直线方程为2x4.8以下关于线性回归的判断,正确的个数是()若散点图中所有点都在一条直线附近,则这条直线为回归直线;散点图中的绝大多数都线性相关,个别特殊点不影响线性回归,如图中的A,B,C点;已知回归直线方程为0.50x0.81,则x25时,y的估计值为11.69;回归直线方程的意义是它反映了样本整体的变化趋势A0 B1 C2 D3答案D解析能使所有数据点都在它附近的直线不止一条,而据回归直线的定义知,只有按最小二乘法求得回归系数,得到的直线bx才是回归直线,不对;正确;将x25代入0.50x0.81,得11.69,正确;正确,故选D9(2014·辽宁省协作体联考)甲、乙两位歌手在“中国好声音”选拔赛中,5次得分情况如茎叶图所示,记甲、乙两人的平均得分分别为甲、乙,则下列判断正确的是()甲乙6775888684093A<,乙比甲成绩稳定B<,甲比乙成绩稳定C>,甲比乙成绩稳定D>,乙比甲成绩稳定答案A解析甲(7776889094)85乙(7588868893)86甲<乙且乙的成绩分布比甲的成绩分布集中稳定,故选A10(2015·潍坊市五县高二期中)某学校要从5名男生和2名女生中选出2人作为志愿者,若用随机变量表示选出的志愿者中女生的人数,则数学期望E()等于()A B C D1答案A解析随机变量表示选出的志愿者中女生的人数,可取0,1,2,当0时,表示没有选到女生;当1时,表示选到一个女生;当2时,表示选到2个女生,P(0),P(1),P(2),E()0×1×2×.11(2015·宝鸡市金台区高二期末)两个变量y与x的回归模型中,分别选择了4个不同模型,它们的相关系数r如下,其中拟合效果最好的模型是()模型模型1模型2模型3模型4相关系数r0.980.800.500.25A模型1 B模型2 C模型3 D模型4答案A解析线性回归分析中,相关系数为r,|r|越接近于1,相关程度越大;|r|越小,相关程度越小,模型1的相关系数r最大,模拟效果最好,故选A12下面是某市场农产品的调查表市场供应量表:单价(元/千克)22.42.83.23.64供应量(1000千克)506070758090市场需求量表:单价(元/千克)43.42.92.62.32供应量(1000千克)506070758090根据以上信息,市场供需平衡点(即供应量和需求量相等的单价)应在区间()A(2.3,2.6) B(2.4,2.6)C(2.6,2.8) D(2.8,2.9)答案C解析以横轴为单价,纵轴为市场供、需量,在同一坐标系中描点,用近似曲线观察可知选C二、填空题(本大题共4个小题,每小题4分,共16分,把正确答案填在题中横线上)13已知一个回归直线方程为1.5x45,x1,7,5,13,19,则_.答案58.5解析因为(1751319)9,且1.545,所以1.5×94558.5.本题易错之处是根据x的值及1.5x45求出y的值再求,由1.5x45求得的y值不是原始数据,故错误14给出下列命题:样本方差反映了所有样本数据与样本平均值的偏离程度;若随机变量XN(0.43,0.182),则此正态曲线在x0.43处达到峰值;在回归分析模型中,残差平方和越小,说明模型的拟合效果越差;市政府调查江北水城市民收入与市民旅游欲望的关系时,抽查了3000人经过计算得K26.023,根据这一数据查阅下表,则市政府有97.5%以上的把握认为市民收入与旅游欲望有关系P(K2k)0.250.150.100.0250.0100.0050.001k1.3232.0722.7065.0246.6357.87910.828其中正确的命题是_.答案解析根据样本方差的概念、正态分布的概念可知均正确;在回归分布中,残差的平方和越小,说明模型的拟合效果越好,即X与Y有很强的关系,所以不正确;通过表中的数据和K26.023>5.024可知,可以认为有97.5%以上的把握认为市民收入与旅游欲望有关系,因此正确15在2015年春节期间,某市物价部门,对本市五个商场销售的某商品一天的销售量及其价格进行调查,五个商场的售价x元和销售量y件之间的一组数据如下表所示:价格x99.51010.511销售量y1110865通过分析,发现销售量y对商品的价格x具有线性相关关系,则销售量y对商品的价格x的回归直线方程为_.答案3.2x40解析iyi392,10,8,(xi)22.5,代入公式,得3.2,所以,40,故回归直线方程为3.2x40.16某市居民20112015年家庭年平均收入x(单位:万元)与年平均支出Y(单位:万元)的统计资料如下表所示:年份20112012201320142015收入x11.512.11313.315支出Y6.88.89.81012根据统计资料,居民家庭平均收入的中位数是_,家庭年平均收入与年平均支出有_线性相关关系答案13正解析中位数的定义的考查,奇数个时按大小顺序排列后中间一个是中位数,而偶数个时须取中间两数的平均数由统计资料可以看出,当平均收入增多时,年平均支出也增多,因此两者之间具有正线性相关关系三、解答题(本大题共6个大题,共74分,解答应写出文字说明,证明过程或演算步骤)17(本题满分12分)(2014·安徽程集中学期中)电视传媒公司为了解某地区观众对某体育节目的收视情况,随机抽取了100名观众进行调查,其中女性有55名,下面是根据调查结果绘制的观众日均收看该体育节目时间的频率分布直方图:将日均收看该体育节目时间不低于40分钟的观众称为“体育迷”,已知“体育迷”中有10名女性(1)根据已知条件完成下面的2×2列联表,并据此资料你是否认为“体育迷”与性别有关?非体育迷体育迷合计男女合计(2)将日均收看该体育节目不低于50分钟的观众称为“超级体育迷”,已知“超级体育迷”中有2名女性,若从“超级体育迷”中任意选取2人,求至少有1名女性观众的概率附:K2P(K2k)0.050.01k3.8416.635解析(1)由频率分布直方图可知,在抽取的100人中,“体育迷”为25人,从而完成2×2列联表如下:非体育迷体育迷合计男301545女451055合计7525100将2×2列联表中的数据代入公式计算,得K23.030.因为3.030<3.841,所以我们没有理由认为“体育迷”与性别有关(2)由频率分布直方图可知,“超级体育迷”为5人,从而一切可能结果所组成的集合为(a1,a2),(a1,a3),(a2,a3),(a1,b1),(a1,b2),(a2,b1),(a2,b2),(a3,b1),(a3,b2),(b1,b2)其中ai表示男性,i1,2,3,bj表示女性,j1,2.由10个基本事件组成,而且这些基本事件的出现是等可能的用A表示“任选2人中,至少有1人是女性”这一事件,则A(a1,b1),(a1,b2),(a2,b1),(a2,b2),(a3,b1),(a3,b2),(b1,b2),事件A由7个基本事件组成,因而P(A).点评本题考查了频率分布直方图,独立性检验,古典概型,解决这类题目的关键是对题意准确理解18(本题满分12分)某工业部门进行一项研究,分析该部门的产量与生产费用之间的关系,从该部门内随机抽选了10个企业为样本,有如下资料:产量x(千件)生产费用(千元)40150421404816055170651507916288185100165120190140185(1)计算x与y的相关系数;(2)对这两个变量之间是否线性相关进行检验;(3)设回归方程为x,求回归系数解析(1)根据数据可得:77.7,165.7,x70903,y277119,xiyi132938,所以r0.808,即x与y之间的相关系数r0.808;(2)因为r>0.75,所以可认为x与y之间具有线性相关关系;(3)0.398,134.8.19(本题满分12分)为考查某种药物预防疾病的效果,进行动物试验,得到如下丢失数据的列联表:患病未患病总计没服用药203050服用药xy50总计MN100设从没服用药的动物中任取2只,未患病数为;从服用药物的动物中任取2只,未患病数为,工作人员曾计算过P(0)P(0)(1)求出列联表中数据x、y、M、N的值;(2)求与的均值(期望)并比较大小,请解释所得结论的实际含义;(3)能够以99%的把握认为药物有效吗?参考公式:K2.当K23.841时有95%的把握认为、有关联;当K26.635时有99%的把握认为、有关联分析(1)从已知P(0)P(0)出发,结合2×2列联表可求(2)求出、的分布列,再利用期望定义式求E()和E()即可(3)利用公式算出K2,结合参考数据可以判断解析(1)P(0),P(0),×,x10.y40,M30,N70.(2)取值为0、1、2.P(0),P(1),P(2).012PE().P(0).P(1).P(2).012PE().E()<E(),即说明药物有效(3)K24.76.4.76<6.635,不能够有99%的把握认为药物有效20(本题满分12分)(2014·洛阳市高二期中)以下资料是一位销售经理收集来的每年销售额和销售经验年数的关系的一组样本数据:销售经验x(年)13461012年销售额y(万元)89.5910.51112(1)根据最小二乘法求出y关于x的线性回归方程;(2)试预测销售经验为8年时的年销售额约为多少万元(精确到十分位)?解析(1)由散点图(图略)知y与x呈线性相关关系,由表中数据计算得,6,10,回归直线方程:x.(2)x8时,预测年销售额为×810.7万元21(本题满分12分)某班50位学生期中考试数学成绩的频率分布直方图如下图所示,其中成绩分组区间是:40,50),50,60),60,70),70,80),80,90),90,100(1)求图中x的值;(2)从成绩不低于80分的学生中随机选取2人,该2人中成绩在90分以上(含90分)的人数记为,求的数学期望分析(1)利用频率和为1,可求x值;(2)先确定各部分人数,再确定取值,利用组合知识,用古典概型求的分布列,再求数学期望解析(1)图中x所在组为80,90即第五组,由频率分布直方图的性质知,10×(0.054x0.013×0.006)1,x0.018.(2)成绩不低于80分的学生所占的频率为f10×(0.0180.006)0.24,所以成绩不低于80分的学生有:50f50×0.2412人成绩不低于90分的学生人数为:50×10×0.0063所以为的取值为0、1、2P(0),P(1),P(2)所以的分布列为:012P所以为的数学期望E()0×1×2×.点评1.本题考查频率分布直方图与随机变量的分布列,数学期望等知识,考查抽象概括能力与应用意识2应用古典概型求事件的概率是分布列的常见命题方式22(本题满分14分)(2015·辽宁葫芦岛市一模)为了调查学生星期天晚上学习时间利用问题,某校从高二年级1 000名学生(其中走读生450名,住宿生550名)中,采用分层抽样的方法抽取n名学生进行问卷调查根据问卷取得了这n名同学每天晚上学习时间(单位:分钟)的数据,按照以下区间分为八组0,30),30,60),60,90),90,120),120,150),150,180),180,210),210,240,得到频率分布直方图如图已知抽取的学生中星期天晚上学习时间少于60分钟的人数为5人(1)求n的值并补全频率分布直方图;(2)如果把“学生晚上学习时间达到两小时”作为是否充分利用时间的标准,对抽取的n名学生,完成下列2×2列联表:利用时间充分利用时间不充分总计走读生住宿生10总计据此资料,你是否认为学生“利用时间是否充分”与走读、住宿有关?(3)若在第组、第组、第组中共抽出3人调查影响有效利用时间的原因,记抽到“学习时间少于60分钟”的学生人数为X,求X的分布列及期望参考公式:K2解析(1)设第i组的频率为Pi(i1,2,8),由图可知:P1×30, P2×30学习时间少于60分钟的频率为P1P2由题意:n×5,n100.又P3×30, P5×30,P6×30,P7×30, P8×30,P41(P1P2P3P5P6P7P8).第组的高度为:h×频率分布直方图如图:(注:未标明高度1/250扣1分)(2)由频率分布直方图可知,在抽取的100人中,“走读生”有45人,“住宿生”有55人,其中“住宿生”中利用时间不充分的有10人,从而走读生中利用时间不充分的有251015人,利用时间充分的有451530人,由此可得2×2列联表如下:利用时间充分利用时间不充分总计走读生301545住宿生451055总计7525100将2×2列联表中的数据代入公式计算,得K23.030因为3.030<3.841,所以没有理由认为学生“利用时间是否充分”与走读、住宿有关(3)由(1)知:第组2人,第组3人,第组5人,总计10人,则X的所有可能取值为0,1,2,3P(Xi)(i0,1,2,3)P(X0),P(X1),P(X2),P(X3)X的分布列为:X0123PE(X)0×1×2×3×(或由超几何分布的期望计算公式E(X)n×3×)15