知识讲解_高考总复习:统计与统计案例.doc
高考总复习:统计与统计案例编稿:孙永钊审稿:张林娟【考大年夜纲求】1.随机抽样1理解随机抽样的需要性跟要紧性;2会用复杂随机抽样办法从总体中抽取样本;理解分层抽样跟系统抽样办法.2.用样本估计总体1理解分布的意思跟感染,会列频率分布表,会画频率分布直方图、频率折线图、茎叶图,理解它们各自的特征.2理解样本数据标准差的意思跟感染,会打算数据标准差.3能从样本数据中提取全然的数字特色如均匀数、标准差,并作出公正的阐明.4会用样本的频率分布估计总体分布,会用样本的全然数字特色估计总体的全然数字特色,理解用样本估计总体的思想.5会用随机抽样的全然办法跟样本估计总体的思想,处理一些复杂的理论征询题.3.变量的相关性1会作两个有关系变量数据的散点图,会使用散点图见解变量间的相关关系;2理解最小二乘法的思想,能按照给出的线性回归方程系数公式树破线性回归方程线性回归方程系数公式不恳求阅历.【知识收集】统计图表用样本估计总体统计复杂随机抽样数据的整理分析数据的数字特色分层抽样系统抽样变量的相关性【考点梳理】考点一、随机抽样从调查的东西中按照肯定的办法抽取一局部,停顿调查或不雅观察,猎取数据,并以此对调查东西的某工程标做出揣摸,这的确是抽样调查调查东西的全体称为总体,被抽取的一局部称为样本.1复杂的随机抽样复杂随机抽样的不雅观点:设一个总体的个人数为N假设通过逐一抽取的办法从中抽取一个样本,且每次抽取时各个个人被抽到的概率相当,就称如斯的抽样为复杂随机抽样用复杂随机抽样从含有N个个人的总体中抽取一个容量为n的样本时,每次抽取一个个人时,任一个人被抽到的概率为;在全体抽样过程中各个个人被抽到的概率为;复杂随机抽样的特征是:不放回抽样,逐一地停顿抽取,各个个人被抽到的概率相当;复杂随机抽样办法表达了抽样的客不雅观性与公正性,是其他更复杂抽样办法的基础复杂抽样常用办法:抽签法:先将总体中的所有个人(共有N个)编号(号码可从1到N),并把号码写在外形、大小一样的号签上(号签可用小球、卡片、纸条等制作),然后将这些号签放在一致个箱子里,停顿均匀搅拌,抽签时每次从中抽一个号签,连续抽取n次,就掉掉落一个容量为n的样本有用范围:总体的个人数未多少多优点:抽签法笨重易行,当总体的个人数不太多时合适采用抽签法随机数表法:随机数表抽样“三步曲:第一步,将总体中的个人编号;第二步,选定开始的数字;第三步,猎取样本号码2系统抽样:当总体中的个人数较多时,可将总体分成均衡的多少多个局部,然后按预先制定出的规那么,从每一局部抽取一个个人,掉掉落需要的样本,这种抽样叫做系统抽样系统抽样的步伐:采用随机的办法将总体中的个人编号,为笨重起见,偶尔可开门见山采用个人所带有的号码,如考生的准考证号、街道上各户的门商标等等为将全体的编号分段(即分成多少多个局部),要判定分段的间隔当是整数时(N为总体中的个人的个数,n为样本容量),;当不是整数时,通过从总体中剔除一些个人使剩下的总体中个人的个数能被n整除,这时.在第一段用复杂随机抽样判定肇端的个人编号按照事先判定的规那么抽取样本(素日是将加上间隔,掉掉落第2个编号,第3个编号,如斯接着下去,直到猎取全体样本)要点说明:系统抽样有用于总体中的个人数较多的情况,它与复杂随机抽样的联系在于:将总体均分后的每一局部停顿抽样时,采用的是复杂随机抽样;与复杂随机抽样一样,系统抽样是等概率抽样,它是客不雅观的、公正的总体中的个人数偏偏能被样本容量整除时,可用它们的比值作为系统抽样的间隔;当总体中的个人数不克不迭被样本容量整除时,可用复杂随机抽样先从总体中剔除大年夜批个人,使剩下的个人数能被样本容量整除再停顿系统抽样3分层抽样:当已经清楚总体由差异清楚的多少多局部形成时,为了使样本更充分地反响总体的情况,常将总体分成多少多局部,然后按照各局部所占的比例停顿抽样,这种抽样叫做分层抽样,所分成的局部叫做层4.常用的三种抽样办法的比较:类不共同征差异点联系有用范围复杂随机抽样抽样过程中每个个人被抽取的概率相当从总体中逐一抽取是后两种办法的基础总体个数较少系统抽样将总体均分成多少多局部,按事先判定的规那么在各局部抽取在肇端局部抽样时用复杂随机抽样总体个数较多分层抽样将总体分成多少多层,分层停顿抽取各层抽样时采用复杂随机抽样或系统抽样总体由差异清楚的多少多局部形成要点说明:1各种抽样的个人被抽到的概率相当;2抽样过程中个人被抽到的概率相当.5.不放回抽样跟放回抽样:在抽样中,假设每次抽出个人后不再将它放回总体,称如斯的抽样为不放回抽样;假设每次抽出个人后再将它放回总体,称如斯的抽样为放回抽样随机抽样、系统抽样、分层抽样全然上不放回抽样考点二、用样本估计总体1.统计图表包括条形图、折线图、饼图、茎叶图2.作频率分布直方图的步伐(1)求极差(即一组数据中最大年夜值与最小值的差)(2)决定组距与组数(3)将数据分组(4)列频率分布表(5)画频率分布表3.频率分布折线图跟总体密度曲线(1)频率分布折线图:连接频率分布直方图中各小长方形上端的中点,就得频率分布折线图(2)总体密度曲线:随着样本容量的增加,作图所分的组数增加,组距减小,呼应的频率折线图会越来越濒临于一条光滑曲线,即总体密度曲线4.标准差跟方差(1)标准差是样本数据到均匀数的一种均匀间隔,(2)方差:(是样本数据,是样本容量,是样本均匀数)要点说明:幻想中的总体所包括个人数屡屡是特不多的,怎么样求得总体的均匀数跟标准差呢?(素日的做法是用样本的均匀数跟标准差去估计总体的均匀数与标准差,这与有样本的频率分布近似替换总体分布是类似的,只需样本的代表性好,如斯做的确是公正的,也是可以接受的.)5.使用频率分布直方图估计样本的数字特色(1)中位数:在频率分布直方图中,中位数右边跟右边的直方图的面积该当相当,由此可以估计中位数的值(2)均匀数:均匀数的估计值等于频率分布直方图中每个小矩形的面积乘以小矩形底边中点的横坐标之跟(3)众数:在频率分布直方图中,众数是最高的矩形的中点的横坐标6.频率分布直方图反响样本的频率分布(1)频率分布直方图中横坐标表示组距,纵坐标表示,频率=组距×(2)频率分布直方图中各小长方形的面积之跟为1,因此在频率分布直方图中组距是一个结实值,因此各小长方形高的比也的确是频率比.(3)频率分布表跟频率分布直方图是一组数据频率分布的两种办法,前者精确,后者直不雅观.(4)众数为最高矩形中点的横坐标.(5)中位数为平分频率分布直方图面积且垂直于横轴的直线与横轴交点的横坐标.考点三、变量的相关性1 散点图将两个变量所对应的点描在直角坐标系中,这些点形成了变量之间的一个图,称为变量之间的散点图散点图笼统地反响了各对数据的亲热程度.大年夜略地看,散点分布存在肯定的法那么.假设变量之间存在某种关系,这些点会有一个汇合趋势,这种趋势素日可以用一条光滑的曲线来近似表示,如斯近似的过程称为曲线拟合.2.两个变量的线性相关1相关关系:当自变量必定时,因变量的取值带有肯定的随机性的两个变量之间的关系称为相关关系(2)正相关在散点图中,点分布在从左下角到右上角的地区.关于两个变量的这种相关关系,我们将它称为正相关.(3)负相关在散点图中,点分布在从左上角到右下角的地区,两个变量的这种相关关系称为负相关.(4)线性相关关系、回归直线假设散点图中点的分布从全体上看大年夜抵在一条直线附近,就称这两个变量之间存在线性相关关系,这条直线叫做回归直线.3.回归方程(1)最小二乘法求回归直线使得样本数据的点到回归直线的间隔的平方跟最小的办法叫做最小二乘法.(2)回归方程方程是两个存在线性相关关系的变量的一组数据的回归方程,期中是待定参数.要点说明:相关关系与函数关系的异同点:一样点:两者均是指两个变量的关系.差异点:函数关系是一种判定的关系,相关关系是一种非判定的关系;函数关系是一种因果关系,而相关关系不用定是因果关系,也可以是伴随关系.考点四、统计案例1.回归分析(1)定义:对存在相关关系的两个变量停顿统计分析的一种常用办法;(2)随机倾向:线性回归模型用表示,其中为模型的未知数,称为随机倾向.(3)样本点的中心在存在线性相关关系的数据中回归方程的截距跟歪率的最小二乘估计公式分不为:其中称为样本点的中心.(4)相关系数事先,阐明两个变量正相关;事先,阐明两个变量负相关.的绝对值越濒临于0时,阐明两个变量之间多少乎不存在线性相关关系.素日大年夜于0.75时,认为两个变量有特不强的线性相关性.2.残差分析(1)总倾向平方跟把每个效应(不雅观察值减去总的均匀值)的平方加起来即:(2)残差数据点跟它回归直线上呼应位置的差异是随机倾向的效应,称为残差.(3)残差平方跟.(4)相关指数的值越大年夜,阐明残差平方跟越小,也的确是说模型的拟合结果越好.在线性回归模型中,表示阐明变量对预报变量变卦的贡献率,越濒临于1,表示回归的结果越好.3.独破性检验(1)分类变量:变量的差异“值表示个人所属的差异类不,像这类变量称为分类变量.(2)列联表:列出两个分类变量的频数表,称为列联表.假设有两个分类变量X跟Y,它们的可以取值分不为,其样本频数列联表(称为2×2列联表)为2×2列联表总计总计结构一个随机变量,其中为样本容量.(3)独破性检验使用随机变量来判定是否能以肯定控制认为“两个分类变量有关系的办法称为两个分类变量的独破性检验.注:在独破性检验中经常由掉掉落不雅观察值,那么=是否成破?与的关系并不是=,是的不雅观察值,或者说是一个随机变量,它在,取差异值时,可以差异,而是取定一组数,后的一个判定的值.【模典范题】典范一、复杂随机抽样【例1】某车间工人加工一种轴100件,为了理解这种轴的直径,要从中抽取10件轴在一致条件下测量,怎么样采用复杂随机抽样的办法抽取样本?【思路点拨】复杂随机抽样一般采用两种办法:抽签法追随机数表法.【分析】解法1:抽签法将100件轴编号为1,2,100,并做好大小、外形一样的号签,分不写上这100个数,将这些号签放在一起,停顿均匀搅拌,接着连续抽取10个号签,然后测量谁人10个号签对应的轴的直径.解法2:随机数表法将100件轴编号为00,01,99,在随机数表中选定一个肇端位置,如取第21行第1个数开始,拔取10个为68,34,30,13,70,55,74,77,40,44,这10件即为所要抽取的样本.【总结升华】从以上两种办法可以看出,当总体个数较少时用两种办法都可以,当样本总数较多时,办法2优于办法1.举一反三:【变式】某大年夜学为了支持奥运会,从报名的24名大年夜三的老师中选6人形成志愿小组,请用抽签法追随机数表法方案抽样方案.【思路点拨】(1)总体的个人数较少,使用抽签法或随机数表法可随便猎取样本;(2)抽签法的把持要点:编号、制签、搅匀、抽取;(3)随机数表法的把持要点:编号、选肇端数、读数、猎取样本.【分析】抽签法第一步:将24名志愿者编号,编号为1,2,3,24;第二步:将24个号码分不写在24张外形完好一样的纸条上,并揉成团,制成号签;第三步:将24个号签放入一个不透明的盒子中,充分搅匀;来源:Zxxk.Com第四步:从盒子中逐一抽取6个号签,并记录上面的编号;第五步:所得号码对应的志愿者,的确是志愿小组的成员.随机数表法第一步:将24名老师编号,编号为01,02,03,24;第二步:在随机数表中任选一数开始,按某一判定倾向读数;第三步:凡不在0124中的数或已读过的数,都跳过去不作记录,依次记录下得数;第四步:寻出号码与记录的数一样的老师形成志愿小组.典范二、系统抽样【例2】某校高中三年级的295名老师已经编号为1,2,295,为了理解老师的深造情况,要按1:5的比例抽取一个样本,用系统抽样的办法停顿抽取,并写出过程.【思路点拨】按1:5分段,每段5人,共分59段,每段抽取一人,关键是判定第1段的编号.【分析】按照1:5的比例,该当抽取的样本容量为295÷5=59,我们把259名同学分成59组,每组5人,第一组是编号为15的5名老师,第2组是编号为610的5名老师,依次下去,59组是编号为291295的5名老师.采用复杂随机抽样的办法,从第一组5名老师中抽出一名老师,不妨设编号为k(1k5),那么抽取的老师编号为k+5L(L=0,1,2,,58),掉掉落59个个人作为样本,如当k=3时的样本编号为3,8,13,288,293.【总结升华】系统抽样可按事先规那么的规那么抽取样本.此题采用的规那么是第一组随机抽取的老师编号为k,那么第m组抽取的老师编号为k+5(m-1).举一反三:【变式】一个总体中有100个个人,随机编号为0,1,2,99,依编号次第均匀分成10个小组,组号依次为l,2,3,10现用系统抽样办法抽取一个容量为10的样本,规那么假设在第1组随机抽取的号码为m,那么在第k组中抽取的号码个位数字与m+k的个位数字一样假设m=6,那么在第7组中抽取的号码是【答案】,在第7小组中抽取的号码是63典范三、分层抽样例3(北京高考)某校老年、中年跟青年教师的人数见下表,采用分层抽样的办法调查教师的躯体情况,在抽取的样本中,青年教师有320人,怎该样本的老年教师人数为()A.90B.100C.180D.300【思路点拨】先按照表格数据打算出老年教师跟青年教师的比例关系然后求解即可。【答案】C【分析】由题意,老年跟青年教师的人数比为900:1600=9:16,由于青年教师有320人,因此老年教师有180人.应选C.【总结升华】处理分层抽样征询题的关键是要保证各个典范在样本中的比例跟在总体中的比例一样.举一反三:【变式】(惠州模拟)某黉舍高一、高二、高三年级的老师人数分不为900、900、1200人,现用分层抽样的办法从该校高中三个年级的老师中抽取容量为50的样本,那么应从高三年级抽取的老师人数为()A.15B.20C.25D.30【答案】B【分析】三个年级的老师人数比例为3:3:4,按分层抽样办法,在高三年级该当抽取人数为:人,应选B.【例4】一个地区共有5个乡镇,人口3万人,其中人口比例为3:2:5:2:3,从3万人中抽取一个300人的样本,分析某种疾病的发病率,已经清楚这种疾病与差异的地理位置及水土有关,征询应采用什么样的办法?并写出具体过程.【思路点拨】采用分层抽样的办法.【分析】由于疾病与地理位置跟水土均有关系,因此不同乡镇的发病情况差异清楚,因此采用分层抽样的办法,具体过程如下:1将3万人分为5层,其中一个乡镇为一层.2依依然本容量的比例随机抽取各乡镇应抽取的样本.300×3/15=60人,300×2/15=40人,300×5/15=100人,300×2/15=40人,300×3/15=60人,因此各乡镇抽取人数分不为60人、40人、100人、40人、60人.3将300人组到一起,即掉掉落一个样本.【总结升华】分层抽样在一样往常生活中使用广泛,其抽取样本的步伐尤为要紧,应牢记按照呼应的比例去抽取.举一反三:【变式】某单位迩来结构了一次健身运动,运动分为登山组跟拍浮组,且每个职工至多参加了其中一组.在参加运动的职工中,青年人占42.5,中年人占47.5,老年人占10.登山组的职工占参加运动总人数的,且该组中,青年人占50,中年人占40,老年人占10.为了理解各组差异的年岁层次的职工对本次运动的称心程度,现用分层抽样的办法从参加运动的全体职工中抽取一个容量为200的样本.试判定拍浮组中,青年人、中年人、老年人分不所占的比例;拍浮组中,青年人、中年人、老年人分不该抽取的人数.【答案】设登山组人数为,拍浮组中,青年人、中年人、老年人各占比例分不为a、b、c,那么有,解得故a=100%50%10%=40%,即拍浮组中,青年人、中年人、老年人各占比例分不为40、50、10.拍浮组中,抽取的青年人数为人;抽取的中年人数为5075人;抽取的老年人数为1015人.典范四、用样本估计总体【例4】甲、乙两小组各10名老师的英语口语测试效果如下:(单位:分)甲组76908486818786828583乙组82848589798091897974用茎叶图表示两小组的效果,并揣摸哪个小组的效果更划逐一些?【思路点拨】学会用茎叶图表示数据的办法;并会停顿统计揣摸【分析】用茎叶图表示两小组的效果如图:甲茎乙67499766543218024599091由图可知甲构效果较汇合,即甲构效果更划逐一些【总结升华】对各数据是二、三位数,且数据量不是特不大年夜时,用用茎叶图表示较为便当,也便于停顿统计揣摸,否那么,应改用其他办法举一反三:【变式1】甲、乙两个深造小组各有10名同学,他们在一次数学检验中效果的茎叶图如以下列图,那么他们在此次检验中效果较好的是组.【答案】甲小组甲茎乙571688822367【变式2】甲、乙两名运发起的5次测试效果如以以下列图所示,设分不表示甲、乙两名运发起测试效果的标准差,分不表示甲、乙两名运发起测试效果的均匀数,那么有A,B,C,D,【答案】B【例5】以下茎叶图记录了甲、乙两组各四名同学在某次数学检验中的效果,甲组记录中有一个数据含糊,无法确认,在图中以X表示.甲组乙组6X87419003假设甲组同学与乙组同学的均匀效果一样,求X及甲组同学数学效果的方差;假设X=7,分不从甲、乙两组同学中各随机拔取一名,求这两名同学的数学效果之跟大年夜于180的概率.注:方差其中【思路点拨】使用均匀数的全然不雅观点加以求解。按照列举法求出所有情况形成样本空间,再求掉情况“这两名同学的数学效果之跟大年夜于180的样本空间,使用古典概型公式可解。【分析】I乙组同学的均匀效果为,甲组同学的均匀效果为90,因此甲组同学数学效果的方差为(II)设甲构效果为86,87,91,94的同学分不为乙构效果为87,90,90,93的同学分不为那么所有的情况形成的全然领件空间为:共16个全然领件.设情况“这两名同学的数学效果之跟大年夜于180,那么情况包括的全然领件的空间为共7个全然领件,【总结升华】会按照茎叶图列举出相关具体数据,再使用古典概型或是独破重复试验典范加以求解。举一反三:212443111102571089甲乙【变式】某工厂甲、乙两个车间包装一致种产品,在自动包装通报带上每隔一小时抽一包产品,称其重量单位:克是否合格,分不记录抽查数据,获得重量数据茎叶图如右.依依然本数据,打算甲、乙两个车间产品重量的均值与方差,并阐明哪个车间的产品的重量绝对动摇;假设从乙车间6件样品中随机抽取两件,求所抽取两件样品重量之差不逾越2克的概率【分析】设甲、乙两个车间产品重量的均值分不为、,方差分不为、,那么,由于,因此甲车间的产品的重量绝对动摇;从乙车间件样品中随机抽取两件,结果共有15个:设所抽取两件样品重量之差不逾越克的情况为A,那么情况A共有4个结果:因此【例6高清视频统计与统计案例:例4】频年来,某市为了促进生活垃圾的分类处理,将生活垃圾分为厨余垃圾、可接收物跟其他垃圾三类,并分不设置了呼应的垃圾箱为调查住夷易近生活垃圾分类投放情况,现随机抽取了该市三类垃圾箱中总计1000吨生活垃圾,数据统计如下(单位:吨):“厨余垃圾箱“可接收物箱“其他垃圾箱厨余垃圾400100100可接收物3024030其他垃圾202060(1)试估计厨余垃圾投放精确的概率;(2)试估计生活垃圾投放差错的概率;(3)假设厨余垃圾在“厨余垃圾箱、“可接收物箱、“其他垃圾箱的投放量分不为a,b,c,其中a>0,abc600.当数据a,b,c的方差s2最大年夜时,写出a,b,c的值(结论不恳求证明),并求现在s2的值注:数据x1,x2,xn的均匀数【思路点拨】1、2两征询可通过古典概型公式加以求解;第3征询使用方差的意思求解。【分析】1厨余垃圾投放精确的概率约为2设生活垃圾投放差错为情况A,那么表示升华垃圾投放精确。情况的概率约为“厨余垃圾箱里厨余垃圾量、“可接收物箱里的可接收物量与“其他垃圾箱里其他垃圾量的总跟除以升华垃圾总量,即约为因此约为1-0.7=0.33当a=600,b=c=0时,获得最大年夜值。由于,因此。【总结升华】此题要紧调查求解古典概型的办法跟方差的多少多何意思,同时调查数据收集处理的才干。【例7】为理解甲、乙两厂的产品的质量,从两厂花费的产品中随机抽取各10件,测量产品中某种元素的含量单位:毫克.下表是测量数据的茎叶图:甲厂乙厂90396581845690315032103规那么:当产品中的此种元素含量称心18毫克时,该产品为优等品.试用上述样本数据估计甲、乙两厂花费的优等品率;从乙厂抽出的上述10件产品中,随机抽取3件,求抽到的3件产品中优等品数的分布列及其数学期望;从上述样品中,各随机抽取3件,逐一拔取,取后有放回,求抽到的优等品数甲厂恰比乙厂多2件的概率【思路点拨】按照茎叶图所给数据,数出甲乙厂优等品数量即可。的取值为0,1,2,3,分不求出对应的抽取办法,再按照等可以情况概率办法求解可得。优等品数甲厂恰比乙厂多2件包括2种情况,“甲厂2件,乙厂0以及“甲厂3件,乙厂1件,分不按照独破重复试验概率公式求解,又从甲厂抽取与从乙厂抽取相互独破,按照乘法打算即可。【分析】I甲厂抽取的样本中优等品有6件,优等品率为乙厂抽取的样本中优等品有5件,优等品率为II的取值为0,1,2,3.因此的分布列为0123故(III)抽取的优等品数甲厂恰比乙厂多2件包括2个情况,即A=“抽取的优等品数甲厂2件,乙厂0件,B=“抽取的优等品数甲厂3件,乙厂1件抽取的优等品数甲厂恰比乙厂多2件的概率为【总结升华】此题属于统计与概率综合题,调查茎叶图有关知识,同时调查老师对相互独破情况同时发生的概率与独破重复试验的概率的使用才干。【例8】对某电子元件停顿寿命追踪调查,情况如下:寿命h100200200300300400400500500600个数20308040301列出频率分布表;2画出频率分布直方图跟累积频率分布图;3估计电子元件寿命在100400h以内的概率;4估计电子元件寿命在400h以上的概率.【思路点拨】此题开门见山使用作频率分布直方图的步伐求解即可掉掉落答案。【分析】1频率分布表如下:寿命h频数频率累积频率100200200.100.10200300300.150.25300400800.400.65400500400.200.85500600300.151合计20012频率分布直方图如下:3由累积频率分布图可以看出,寿命在100400h内的电子元件出现的频率为0.65,因此我们估计电子元件寿命在100400h内的概率为0.65.4由频率分布表可知,寿命在400h以上的电子元件出现的频率为0.20+0.15=0.35,故我们估计电子元件寿命在400h以上的概率为0.35.【总结升华】画频率分布条形图、直方图时要留心纵、横坐标轴的意思,清楚频率分布直方图中各小长方形的面积之跟为1.举一反三:【变式1】按照中华国夷易近共跟国道路交通安全法规那么:车辆驾驶员血液酒精浓度在2080mg/100mL不含80之间,属于酒后驾车;血液酒精浓度在80mg/100mL含80以上时,属醉酒驾车。占领关报道,年8月15日至8月28日,某地区查处酒后驾车跟醉酒驾车共500人,如图是对这500人血液中酒精含量停顿检测所得结果的频率分布直方图,那么属于醉酒驾车的人数约为2030405060708090100酒精含量频率组距mg/100mL0.0150.010.0050.02A25B50C75D100【答案】C【变式2】某局部方案对某路段停顿限速,为调查限速60km/h是否公正,对通过该路段的300辆汽车的车速停顿检测,将所得数据按40,50,分组,绘制成如以下列图频率分布直方图.那么这300辆汽车中车速低于限速的汽车有辆.【答案】180。【变式3】从某校随机抽取了名老师,将他们的体重单位:数据绘制成频率分布直方图如图,由图中数据可知=,所抽取的老师中O4045505560体重(kg)频率组距m0.060.02体重在的人数是【答案】,.【例9】对某校高三年级老师参加社区效力次数停顿统计,随机抽取名老师作为样本,掉掉落这名老师参加社区效力的次数.按照此数据作出了频数与频率的统计表跟频率分布直方图如下:分组频数频率100.252420.05合计1频率/组距15252010030次数a求出表中及图中的值;假设该校高三老师有240人,试估计该校高三老师参加社区效力的次数在区间内的人数;在所取样本中,从参加社区效力的次数非常多于20次的老师中任选2人,求至多一人参加社区效力次数在区间内的概率.【思路点拨】使用某一已经清楚组的频数跟频率的关系可加以求解。使用列举法列举出所无情况,再按照一致情况概率关系可以求解。【分析】由分组内的频数是,频率是知,因此.由于频数之跟为,因此,.由于是对应分组的频率与组距的商,因此.由于该校高三老师有240人,分组内的频率是,因此估计该校高三老师参加社区效力的次数在此区间内的人数为人.谁人样本参加社区效力的次数非常多于20次的老师共有人,设在区间内的人为,在区间内的人为.那么任选人共有,15种情况,而两人都在内只能是一种,因此所求概率为.约为【总结升华】在频率分布表中,频数的跟等于样本容量,频率的跟等于1,每一小组的频率等于这一组的频数除以样本容量.频率分布直方图中,小矩形的初等于每一组的频率/组距,它们与频数成正比,小矩形的面积等于这一组的频率.关于开放性征询题的回答,要选择适当的数据特色停顿调查,按照数据特色分析得出理论征询题的结论.举一反三:【变式】某校从高一年级老师中随机抽取60名老师,将其期中检验的数学效果均为整数分成六段:,后掉掉落如下频率分布直方图求分数在内的频率;按照频率分布直方图,估计该校高一年级老师期中检验数学效果的均匀分;用分层抽样的办法在80分以上含80分的老师中抽取一个容量为6的样本,将该样本看成一个总体,从中任意拔取2人,求其中恰有1人的分数不低于90分的概率【分析】分数在内的频率为:均匀分为:由题意,分数段的人数为:人;分数段的人数为:人;用分层抽样的办法在80分以上含80分的老师中抽取一个容量为6的样本,分数段抽取5人,分不记为A,B,C,D,E;分数段抽取1人,记为M由于从样本中任取2人,其中恰有1人的分数不低于90分,那么另一人的分数肯定是在分数段,因此只需在分数段抽取的5人中缀定1人设“从样本中任取2人,其中恰有1人的分数不低于90分为情况,那么全然领件空间包括的全然领件有:(A,B),(A,C),(A,D),(A,E),(B,C),(B,D),(B,E),(C,D),(C,E),(D,E),(A,M),(B,M),(C,M),(D,M),(E,M)共15种情况包括的全然领件有(A,M),(B,M),(C,M),(D,M),(E,M)5种恰有1人的分数不低于90分的概率为【例10】某中学停顿了一次“环保知识竞赛,全校老师参加了此次竞赛为了理解本次竞赛效果情况,从中抽取了局部老师的效果得分取正整数,总分值为100分作为样本停顿统计请按照上面尚未完成并有局部污损的频率分布表跟频率分布直方图如以下列图处理以下征询题:组距频率效果分频率分布直方图0.040x0.0085060807090100y频率分布表组不分组频数频率第1组50,6080.16第2组60,70a第3组70,80200.40第4组80,900.08第5组90,1002b合计写出的值;在拔取的样本中,从竞赛效果是80分以上含80分的同学中随机抽取2名同学到广场参加环保知识的志愿鼓吹运动,求所抽取的2名同学来自一致组的概率;在的条件下,设表示所抽取的2名同学中来自第5组的人数,求的分布列及其数学期望.【思路点拨】使用某一已经清楚组的频数跟频率的关系可求得样本总频数跟第四组频数,进而求出的值。分两种情况:一,2人来自第4组,二,2人来自第5组。由随便掉掉落的可以取值为,再使用等可以情况概率求解。【分析】由题意可知,由题意可知,第4组有4人,第5组有2人,共6人从竞赛效果是80分以上含80分的同学中随机抽取2名同学有种情况设情况:随机抽取的2名同学来自一致组,那么.因此,随机抽取的2名同学来自一致组的概率是由可知,的可以取值为,那么,因此,的分布列为因此,【总结升华】此题调查频数,频率及频率分布直方图及概率知识,调查使用统计知识处理复杂理论征询题的才干,数据处理才干跟运用意识。举一反三:【变式】为增强市夷易近的节能环保见解,某市面向全市征召义务鼓吹志愿者.从符合条件的名志愿者中随机抽样名志愿者的年岁情况如下表所示频率分布表中的、位置应填什么数据?并在答题卡中补全频率分布直方图如图,再按照频率分布直方图估计这名志愿者中年岁在岁的人数;在抽出的名志愿者中按年岁再采用分层抽样法抽取人参加中心广场的鼓吹运动,从这人当拔取名志愿者担当要紧担当人,记这名志愿者中“年岁低于岁的人数为,求的分布列及数学期望202530354045年岁岁分组单位:岁频数频率合计【分析】处填,处填;补全频率分布直方图如以下列图.名志愿者中年岁在的人数为人202530354045年岁岁用分层抽样的办法,从当拔取人,那么其中“年岁低于岁的有人,“年岁不低于岁的有人故的可以取值为,;,因此的分布列为:P典范五、变量的相关性、回归分析跟独破性检验【例11】已经清楚某地每单位面积菜地年均匀使用氮胖量xkg与每单位面积蔬菜年均匀产量yt之间的关系有如下数据:年份19851986198719881989199019911992x(kg)7074807885929095y(t)5.16.06.87.89.010.210.012.0年份1993199419951996199719981999x(kg)92108115123130138145y(t)11.511.011.812.212.512.813.01求x与y之间的相关系数,并检验是否线性相关;2假设线性相关,求蔬菜产量y与使用氮胖量之间的回归直线方程,并估计每单位面积施胖150kg时,每单位面积蔬菜的年均匀产量.【思路点拨】1使用样本相关系数打算公式来完成;2查表得出清楚性程度0.05与自由度15-2呼应的相关系数临界比较,假设那么线性相关,否那么不线性相关.【分析】1列出下表,并用科学打算器停顿有关打算:i1234567891011121314157074807885929095921081151231301381455.16.06.87.89.010.210.012.011.511.011.812.212.512.813.0357444544608.4765938.490011401058118813571500.616251766.41885,.故蔬菜产量与放用氮胖量的相关系数.由于n=15,故自由度15-