2022版高考数学一轮复习核心素养测评六十七统计图表数据的数字特征用样本估计总体理北师大版.doc
核心素养测评六十七 统计图表、数据的数字特征、用样本估计总体(30分钟60分)一、选择题(每小题5分,共25分)1.某学生在一门功课的22次考试中,所得分数的茎叶图如图所示,则此学生该门功课考试成绩的极差与中位数之和为()A.117B.118【解析】选B.22次考试成绩最高为98分,最低为56分,所以极差为98-56=42,从小到大排列,中间两数为76,76,所以中位数为76,所以此学生该门功课考试成绩的极差与中位数之和为42+76=118.2.某高校调查了200名学生每周的自习时间(单位:小时),制成了如图所示的频率分布直方图,其中自习时间的范围是17.5,30,样本数据分组为17.5,20),20,22.5),22.5,25),25,27.5),27.5,30.根据直方图,这200名学生中每周的自习时间不少于22.5小时的人数是()A.56B.60C.120D.140【解析】选D.由频率分布直方图可知,每周自习时间不少于22.5小时的频率为(0.16+0.08+0.04)×2.5=0.7,则每周自习时间不少于22.5小时的人数为0.7×200=140.3.(2020·芜湖模拟)由小到大排列的一组数据x1,x2,x3,x4,x5,其中每个数据都小于-1,那么对于样本1,x1,-x2,x3,-x4,x5的中位数可以表示为()A.B.C.D.【解析】选C.因为x1<x2<x3<x4<x5<-1,所以x1<x3<x5<1<-x4<-x2,则该组样本的中位数为中间两数的平均数,即.4.(2019·全国卷)演讲比赛共有9位评委分别给出某选手的原始评分,评定该选手的成绩时,从9个原始评分中去掉1个最高分、1个最低分,得到7个有效评分.7个有效评分与9个原始评分相比,不变的数字特征是()A.中位数B.平均数C.方差D.极差【解析】选A.9个数据去掉最高分与最低分2个,最中间的数据没变,所以不变的数字特征是中位数.5.某户居民根据以往的月用电量情况,绘制了月用电量的频率分布直方图(月用电量都在25度到325度之间)如图所示.估计该用户的月用电量的平均数、中位数、众数分别为 ()A.161,158,150B.150,150,150C.175,125,150D.161,175,150【解析】选A.估计该用户的月用电量的平均数:=50×0.12+100×0.18+150×0.3+200×0.22+250×0.12+300×0.06=161.估计该用户的月用电量的中位数约为:158.估计该用户的月用电量的众数约为:150.二、填空题(每小题5分,共15分)6.(2019·江苏高考)已知一组数据6,7,8,8,9,10,则该组数据的方差是_. 【解析】由题意,该组数据的平均数为=8,所以该组数据的方差是(6-8)2+(7-8)2+(8-8)2+(8-8)2+(9-8)2+(10-8)2=.答案:7.(2020·阳泉模拟)如图所示的茎叶图记录了一组数据,关于这组数据,其中说法正确的序号是_. 众数是9;平均数是10;中位数是9;标准差是3.4.【解析】由题意可知,该组数据分别为:7,8,9,9,9,10,11,12,12,13,该组数据的众数为9,平均数为=10,中位数为=9.5,标准差为=,因此,正确.答案:8.从某小区抽取100户居民进行月用电量调查,发现其用电量都在50至350度之间,频率分布直方图如图所示. (1)频率分布直方图中x的值为_. (2)在这些用户中,用电量落在区间100,250)内的户数为_. 【解析】(1)由频率分布直方图中各小矩形的总面积为1,得(0.001 2+0.002 4×2+0.003 6+x+0.006 0)×50=1,解得x=0.004 4.(2)用电量在100,250)内的频率为(0.003 6+0.004 4+0.006 0)×50=0.7,故用电量落在区间100,250)内的户数为100×0.7=70.答案:(1)0.004 4(2)70三、解答题(每小题10分,共20分)9.为庆祝国庆节,某中学团委组织了“歌颂祖国,爱我中华”知识竞赛,从参加考试的学生中抽出60名,将其成绩(成绩均为整数)分成40,50),50,60),90,100六组,并画出如图所示的部分频率分布直方图,观察图形,回答下列问题:(1)求第四组的频率,并补全这个频率分布直方图.(2)估计这次考试的及格率(60分及以上为及格)和平均分.【解析】(1)因为各组的频率和等于1,所以第四组的频率为1-(0.025+0.015×2+0.010+0.005)×10=0.3.补全的频率分布直方图如图所示.(2)依题意可得第三、四、五、六组的频率之和为(0.015+0.030+0.025+0.005)×10=0.75,则可估计这次考试的及格率是75%.因为抽取学生的平均分约为45×0.1+55×0.15+65×0.15+75×0.3+85×0.25+95×0.05=71(分),所以可估计这次考试的平均分为71分.10.为了比较两种治疗失眠症的药(分别称为A药, B药)的疗效,随机选取18位患者服用A药,18位患者服用B药,这36位患者服用一段时间后,记录他们日平均增加的睡眠时间(单位:h),试验的观测结果如下:服用A药的18位患者日平均增加的睡眠时间:0.61.22.71.52.81.82.22.33.22.52.61.22.71.52.93.03.12.3服用B药的18位患者日平均增加的睡眠时间:3.21.71.90.80.92.41.22.61.31.60.51.80.62.11.12.51.22.7(1)分别计算两组数据的平均数(小数点后保留两位小数),从计算结果看哪种药疗效更好?(2)根据两组数据完成下面茎叶图,从茎叶图看,哪种药的疗效更好?并说明理由.【解析】(1)服用A药的18位患者日平均增加的睡眠时间的平均数为=(0.6+1.2+2.7+3.0+3.1+2.3)2.23(h)服用B药的18位患者日平均增加的睡眠时间的平均数为=(3.2+1.7+1.9+2.5+1.2+2.7)1.67(h),因为2.23>1.67,所以A种药的疗效更好.(2)由观测结果可绘制如图茎叶图:从以上茎叶图可以看出,A药疗效的试验结果有的叶集中在茎2,3上,而B药疗效的试验结果有的叶集中在茎0,1上,由此可看出A药的疗效更好.(15分钟35分)1.(5分)(2020·福州模拟)某工厂对一批新产品的长度(单位:mm)进行检测,如图是检测结果的频率分布直方图,据此估计这批产品的中位数与平均数分别为()A.20,22.5B.22.5,25C.22.5,22.75D.22.75,22.75【解析】选C.根据频率分布直方图,得平均数为5×(12.5×0.02+17.5×0.04+22.5×0.08+27.5×0.03+32.5×0.03)=22.75,因为0.02×5+0.04×5=0.3<0.5,0.3+0.08×5=0.7>0.5,所以中位数应在2025内,设中位数为x,则0.3+(x-20)×0.08=0.5,解得x=22.5,所以这批产品的中位数是22.5.【变式备选】某市要对两千多名出租车司机的年龄进行调查,现从中随机抽出100名司机,已知抽到的司机年龄都在20,45岁之间,根据调查结果得出司机的年龄情况残缺的频率分布直方图如图所示,利用这个残缺的频率分布直方图估计该市出租车司机年龄的中位数大约是()岁岁岁岁【解析】选C.在频率分布直方图中,所有矩形面积之和为1,所以,数据位于的频率为1-×5=0.2,前两个矩形的面积之和为0.01×5+0.2=0.25,前三个矩形的面积之和为0.25+0.07×5=0.6,所以,中位数位于区间,设中位数为a,则有0.25+×0.07=0.5,解得a33.6(岁).2.(5分)(2020·阳泉模拟)气象意义上从春季进入夏季的标志为连续5天的日平均温度均不低于22.现有甲、乙、丙三地连续5天的日平均温度的记录数据:(记录数据都是正整数)甲地5个数据的中位数为24,众数为22;乙地5个数据的中位数为27,总体均值为24;丙地5个数据中有一个数据是32,总体均值为26,总体方差为10.8.则肯定进入夏季的地区有_.(填序号) 【解析】甲地:5个数据的中位数为24,众数为22,根据数据得出:甲地连续5天的日平均温度的记录数据可能为:22,22,24,25,26,其连续5天的日平均气温均不低于22;乙地:5个数据的中位数为27,总体均值为24,当5个数据为19,20,27,27,27时,可知其连续5天的日平均温度有低于22 的,故不确定;丙地:5个数据中有一个数据是32,总体均值为26,若有低于22,假设取21,此时方差就超出了10.8,可知其连续5天的日平均温度均不低于22.则肯定进入夏季的地区有甲、丙两地.答案:【变式备选】已知某样本的容量为50,平均数为70,方差为75.现发现在收集这些数据时,其中的两个数据记录有误,一个错将80记录为60,另一个错将70记录为90.在对错误的数据进行更正后,重新求得样本的平均数为,方差为s2,则()A.=70,s2<75B.=70,s2>75C.>70,s2<75D.<70,s2>75【解析】选A.由题意,可得=70,设收集的48个准确数据分别记为x1,x2,x48,则75=+(60-70)2+(90-70)2=+500,s2=+(80-70)2+(70-70)2=+100<75,所以s2<75.3.(5分)(2020·郑州模拟)某同学10次测评成绩的数据如茎叶图所示,总体的中位数为12,若要使该总体的标准差最小,则4x+2y的值是()A.12B.14C.16D.18【解析】选A.因为中位数为12,所以x+y=4,数据的平均数为×(2+2+3+4+x+y+20+19+19+20+21)=11.4,要使该总体的标准差最小,即方差最小,所以(10+x-11.4)2+(10+y-11.4)2=(x-1.4)2+(y-1.4)22=0.72,当且仅当x-1.4=y-1.4,即x=y=2时取等号,此时总体标准差最小,4x+2y=12.【变式备选】(2020·驻马店模拟)已知样本9,10,11,x,y的平均数是10,方差是2,则xy的值为()A.88B.96C.108D.110【解析】选B.由于样本的平均数为10,则有=10,得x+y=20,由于样本的方差为2,则有=2,得+=8,即x2+y2-20+200=8,所以x2+y2=208,因此xy=96.4.(10分)(2019·全国卷)某行业主管部门为了解本行业中小企业的生产情况,随机调查了100个企业,得到这些企业第一季度相对于前一年第一季度产值增长率y的频数分布表.y的分组-0.20,0)0,0.20)0.20,0.40)0.40,0.60)0.60,0.80)企业数22453147(1)分别估计这类企业中产值增长率不低于40%的企业比例、产值负增长的企业比例.(2)求这类企业产值增长率的平均数与标准差的估计值(同一组中的数据用该组区间的中点值为代表).(精确到0.01)附:8.602.【解析】(1)根据产值增长率频数分布表得,所调查的100个企业中产值增长率不低于40%的企业频率为=0.21.产值负增长的企业频率为=0.02.用样本频率分布估计总体分布得这类企业中产值增长率不低于40%的企业比例为21%,产值负增长的企业比例为2%.(2)=(-0.10×2+0.10×24+0.30×53+0.50×14+0.70×7)=0.30,s2=ni=(-0.40)2×2+(-0.20)2×24+02×53+0.202×14+0.402×7=0.029 6,所以s=0.02×0.17,所以,这类企业产值增长率的平均数与标准差的估计值分别为30%,17%.5.(10分)(2020·昆明模拟)栀子原产于中国,喜温暖湿润、阳光充足的环境,较耐寒.叶,四季常绿;花,芳香素雅.绿叶白花,格外清丽.某地区引种了一批栀子作为绿化景观植物,一段时间后,从该批栀子中随机抽取100棵测量植株高度,并以此测量数据作为样本,得到该样本的频率分布直方图,其中不高于1.50 m的植株高度茎叶图如图所示.(1)求植株高度频率分布直方图中a,b,c的值.(2)在植株高度频率分布直方图中,同一组中的数据用该区间的中点值代表,植株高度落入该区间的频率作为植株高度取该区间中点值的频率,估计这批栀子植株高度的平均值.【解析】(1)由茎叶图知,a=0.5,b=1.由频率分布直方图知(0.5+1+c+3+4)×0.1=1,所以c=1.5.(2)这批栀子植株高度的平均值的估计值为×0.1=1.60(m).(2020·佛山模拟)某高中非毕业班学生人数分布情况如表,为了了解这2 000个学生的体重情况,从中随机抽取160个学生并测量其体重数据,根据测量数据制作了如图所示的频率分布直方图.性别年级男生女生合计高一年级5506501 200高二年级425375800合计9751 0252 000(1)为了使抽取的160个样品更具代表性,宜采取分层抽样,请你给出一个你认为合适的分层抽样方案,并确定每层应抽取的样品个数.(2)根据频率分布直方图,求x的值,并估计全体非毕业班学生中体重在45,75)内的人数.(3)已知高一全体学生的平均体重为58.50 kg,高二全体学生的平均体重为61.25 kg,试估计全体非毕业班学生的平均体重.【解析】(1)方案一:考虑到体重应与年级及性别均有关,最合理的分层应分为以下四层:高一男生、高一女生、高二男生、高二女生高一男生:×160=44(人),高一女生:×160=52(人),高二男生:×160=34(人),高二女生:×160=30(人),方案二:按性别分为两层,男生与女生:男生人数:×160=78(人),女生人数:×160=82(人).方案三:按年级分为两层,高一学生与高二学生:高一人数:×160=96(人),高二人数:×160=64(人).(2)体重在70,80)内的学生人数的频率:1-(0.075+0.2+0.275+0.225+0.05+0.025)=0.15,x=0.015,体重在45,75)内人数的频率为:0.1+0.275+0.225+0.075=0.675,所以估计全体非毕业班学生体重在45,75)内的人数为:2 000×0.675=1 350(人).(3)设高一全体学生的平均体重为=58.5 kg,频率为P1=×100%=60%.高二全体学生的平均体重为=61.25 kg,频率为P2=×100%=40%,则估计全体非毕业班学生的平均体重为·P1+·P2=58.50×60%+61.25×40%=59.6 (kg).答:估计全校非毕业班学生的平均体重为59.6 kg.