2018版高中数学北师大版必修三学案:第一章 统计 章末复习提升 .docx
1关于抽样方法(1)用随机数法抽样时,对个体所编号码位数要相同,当问题所给位数不同时,以位数较多的为准,在位数较少的数前面添“0”,凑齐位数(2)用系统抽样法时,如果总体容量N能被样本容量n整除,抽样间隔为k;如果总体容量N不能被样本容量n整除,先用简单随机抽样剔除多余个体,抽样间隔为k(其中KN多余个体数)(3)三种抽样方法的异同点类别共同点各自特点相互联系适用范围简单随机抽样抽样过程中每个个体被抽到的可能性相同从总体中逐个抽取总体中的个体数较少系统抽样将总体平均分成几部分,按事先确定的规则分别在各部分中抽取在起始部分抽样时,采用简单随机抽样总体中的个体数较多分层抽样将总体分成几层,按各层个体数之比抽取各层抽样时采用简单随机抽样或系统抽样总体由差异明显的几部分组成2.关于用样本估计总体(1)用样本频率分布估计总体频率分布时,通常要对给定的一组数据进行列表、作图处理,作频率分布表与频率分布直方图时要注意其方法步骤(2)茎叶图刻画数据有两个优点:一是所有信息都可以从图中得到;二是茎叶图中的数据可以随时记录,随时添加,便于记录和表示(3)平均数反映了样本数据的平均水平,而标准差反映了样本数据的波动程度3变量间的相关关系(1)除了函数关系这种确定性的关系外,还大量存在因变量的取值带有一定随机性的两个变量之间的关系相关关系,对于一元线性相关关系,通过建立回归方程就可以根据其部分观测值,获得对这两个变量之间的整体关系的了解,主要是作出散点图,写出回归方程(2)求回归方程的步骤:先把数据制成表,从表中计算出,iyi;计算回归系数,.公式为写出回归方程x.题型一抽样方法的运用1抽样方法有:简单随机抽样、系统抽样、分层抽样2三种抽样方法比较例1(1)某校选修乒乓球课程的学生中,高一年级有30名,高二年级有40名,现用分层抽样的方法在这70名学生中抽取一个样本,已知在高一年级的学生中抽取了6名,则在高二年级的学生中应抽取的人数为()A6 B8 C10 D12(2)问题:某小区有800户家庭,其中高收入家庭200户,中等收入家庭480户,低收入家庭120户,为了了解有关家用轿车购买力的某个指标,要从中抽取一个容量为100的样本;从10名学生中抽取3人参加座谈会方法:(1)简单随机抽样;(2)系统抽样;(3)分层抽样则问题与方法配对正确的是()A(1),(2) B(3),(2)C(2),(3) D(3),(1)答案(1)B(2)D解析(1)分层抽样的原理是按照各部分所占的比例抽取样本设从高二年级抽取的学生数为n,则,得n8.(2)问题中的总体是由差异明显的几部分组成的,故可采用分层抽样方法;问题中总体的个数较少,故可采用简单随机抽样故匹配正确的是D.跟踪训练1某单位有840名职工,现采用系统抽样方法抽取42人做问卷调查,将840人按1,2,840随机编号,则抽取的42人中,编号落入区间481,720的人数为()A11 B12 C13 D14答案B解析抽样间隔为20.设在1,2,20中抽取号码x0(x01,20)在481,720之间抽取的号码记为20kx0,则48120kx0720,kN.所以24k36.因为,所以k24,25,26,35,所以k的值共有3524112(个),即所求人数为12.题型二用样本的频率分布估计总体分布此类问题通常要对样本数据进行列表、作图处理这类问题采取的图表主要有:条形图、直方图、茎叶图、频率折线图、扇形图等它们的主要优点是直观,能够清楚表示总体的分布走势除茎叶图外,其他几种图表法的缺点是原始数据信息有丢失例2如图所示的是某学校抽取的学生体重的频率分布直方图,已知图中从左到右的前3个小组的频率之比为123,第2小组的频数为10,则抽取的学生人数为()A20 B30 C40 D50答案C解析前3组的频率之和等于1(0.012 50.037 5)50.75,第2小组的频率是0.750.25,设样本容量为n,则0.25,则n40.故选C.跟踪训练2有1个容量为100的样本,数据的分组及各组的频数如下:12.5,15.5),6;15.5,18.5),16;18.5,21.5),18;21.5,24.5),22;24.5,27.5),20;27.5,30.5),10;30.5,33.5,8.(1)列出样本的频率分布表(含累积频率);(2)画出频率分布直方图;(3)估计小于30的数据约占多大百分比解(1)样本的频率分布表如下:分组频数频率累积频率12.5,15.5)60.060.0615.5,18.5)160.160.2218.5,21.5)180.180.4021.5,24.5)220.220.6224.5,27.5)200.200.8227.5,30.5)100.100.9230.5,33.580.081.00合计1001.00(2)频率分布直方图如图(3)小于30的数据约占90%.题型三用样本的数字特征估计总体的数字特征为了从整体上更好地把握总体的规律,我们还可以通过样本数据的众数、中位数、平均数和标准差等数字特征对总体相应的数字特征作出估计众数就是样本数据中出现次数最多的那个值;中位数就是把样本数据按照由小到大(或由大到小)的顺序排列,如果数据的个数是奇数,处于中间位置的数,如果数据的个数是偶数,中间两个的数据的平均数;平均数就是所有样本数据的平均值,用表示;标准差是反映样本数据离散程度大小的最常用统计量,其计算公式是s .有时也用标准差的平方(s2方差)来代表标准差例3(1)若某校高一年级8个班参加合唱比赛的得分茎叶图如图所示,则这组数据的中位数和平均数分别是(单位:分)()A91.5和91.5 B91.5和92C91和91.5 D92和92(2)从某项综合能力测试中抽取100人的成绩,统计如表,则这100人成绩的标准差为()分数54321人数2010303010A.3 B.C3 D.答案(1)A(2)B解析(1)将这组数据从小到大排列,得87,89,90,91,92,93,94,96(单位:分)故平均数(8789909192939496)91.5(分),中位数为91.5(分)故选A.(2)3,s2(x1)2(x2)2(xn)2(2022101230121022)s.跟踪训练3为调查甲、乙两校高三年级学生某次联考数学成绩情况,用简单随机抽样,从这两校中各抽取30名高三年级学生,以他们的数学成绩(百分制)作为样本,样本数据的茎叶图如图(1)若甲校高三年级每位学生被抽取的概率为0.05,求甲校高三年级学生总人数,并估计甲校高三年级这次联考数学成绩的及格率(60分及60分以上为及格);(2)设甲、乙两校高三年级学生这次联考数学平均成绩分别为1,2,估计12的值解(1)设甲校高三年级学生总人数为n.由题意,知0.05,解得n600.样本中甲校高三年级学生数学成绩不及格的人数为5,据此估计甲校高三年级这次联考数学成绩的及格率为1.(2)设甲、乙两校样本平均数分别为,.根据样本茎叶图知,30()3030249537729215.因此0.5,所以的估计值为0.5分题型四变量间的相关关系1分析两个变量间的相关关系时,我们可根据样本数据散点图确定两个变量之间是否存在相关关系,还可利用最小二乘法求出回归方程把样本数据表示的点在直角坐标系中作出,构成的图叫做散点图从散点图上,我们可以分析出两个变量是否存在相关关系如果这些点大致分布在通过散点图中心的一条直线附近,那么就说这两个变量之间具有线性相关关系,这条直线称为回归直线,直线方程称为回归方程2回归方程的应用利用回归方程可以对总体进行预测,虽然得到的结果不是准确值,但我们是根据统计规律得到的,因而所得结果的正确率是最大的,所以可以大胆地利用回归方程进行预测例4某地连续十年粮食需求量逐年上升,下表是部分统计数据:年份20062008201020122014需求量(万吨)236246257276286(1)利用所给数据求年需求量与年份之间的回归方程x;(2)利用(1)中所求出的直线方程预测该地2016年的粮食需求量解(1)由所给数据看出,年需求量与年份之间是近似直线上升,下面来求回归方程为此对数据预处理如下:年份201042024需求量257211101929对预处理后的数据,容易算得0,3.2,6.5,3.2.由上述计算结果,知所求回归方程为257 (x2 010)6.5(x2 010)3.2.即6.5(x2 010)260.2.(2)利用直线方程,可预测2016年的粮食需求量为65(2 0162 010)260.26.56260.2299.2(万吨)299(万吨)跟踪训练4理论预测某城市2020到2024年人口总数与年份的关系如下表所示:年份202x(年)01234人口数y(十万)5781119(1)请画出上表数据的散点图;(2)指出x与y是否线性相关;(3)若x与y线性相关,请根据上表提供的数据,用最小二乘法求出y关于x的回归方程b;(4)据此估计2025年该城市人口总数(参数数据:051728311419132,021222324230)解(1)数据的散点图如图:(2)由散点图可知,样本点基本上分布在一条直线附近,故x与y呈线性相关(3)由表知(01234)2,(5781119)10.3.2,3.6,回归方程为3.2x3.6.(4)当x5时,19.6(十万)196万故2025年该城市人口总数约为196万题型五数形结合思想名称数形结合频率分布直方图数据分组及频数:40,50),2;50,60),3;60,70),10;70,80),15;80,90),12;90,100,8可求众数:最高小长方形的中点所对应的数据;可求中位数:中位数左边和右边的直方图面积相等;可求平均数:每个小长方形的面积乘以小长方形底边中点的横坐标之和;可求落在各个区域内的频率茎叶图甲的数据:95,81,75,89,71,65,76,88,94;乙的数据:83,86,93,99,88,103,98,114,98茎是十位和百位数字,叶是个位数字;可以帮助分析样本数据的大致频率分布;可用来求数据的一些数字特征,如中位数、众数等散点图n个数据点(xi,yi)可以判断两个变量之间有无相关关系例5甲、乙两人在相同的条件下各射靶10次, 每次射靶成绩(单位:环)如下图所示(1)填写下表:平均数方差中位数命中9环及以上甲71.21乙5.43(2)请从四个不同的角度对这次测试进行分析:从平均数和方差结合分析偏离程度;从平均数和中位数结合分析谁的成绩好些;从平均数和命中9环以上的次数相结合看谁的成绩好些;从折线图上两人射击命中环数及走势分析谁更有潜力解(1)乙的射靶环数依次为2,4,6,8,7,7,8,9,9,10.所以乙(24687789910)7;乙的射靶环数从小到大排列为2,4,6,7,7,8,8,9,9,10,所以中位数是7.5;甲的射靶环数从小到大排列为5,6,6,7,7,7,7,8,8,9,所以中位数为7.于是填充后的表格如下表所示:平均数方差中位数命中9环及以上甲71.271乙75.47.53(2)甲、乙的平均数相同,均为7,但s<s,说明甲偏离平均数的程度小,而乙偏离平均数的程度大甲、乙的平均水平相同,而乙的中位数比甲大,说明乙射靶环数的优秀次数比甲多甲、乙的平均水平相同,而乙命中9环以上(包含9环)的次数比甲多2次,可知乙的射靶成绩比甲好从折线图上看,乙的成绩呈上升趋势,而甲的成绩在平均线上波动不大,说明乙的状态在提升,更有潜力跟踪训练5甲、乙两名同学在五次数学测试中的成绩统计用茎叶图表示如下,若甲、乙两人的平均成绩分别用X甲,X乙表示,则下列结论正确的是()AX甲>X乙,甲比乙成绩稳定BX甲>X乙,乙比甲成绩稳定CX甲<X乙,甲比乙成绩稳定DX甲<X乙,乙比甲成绩稳定答案A解析由茎叶图知,X甲(6869707172)70,X乙(6368696971)68,X甲>X乙,且甲比乙成绩稳定1.对于频率分布直方图,要记住以下几点:(1)每个小矩形面积这组的频率;(2)所有小矩形面积的和为1;(3)纵轴表示的数为.2在研究两个变量是否存在某种关系时,必须从散点图入手,通过散点图,可以做出判断