知识讲解_高考总复习:统计与统计案例.doc
《知识讲解_高考总复习:统计与统计案例.doc》由会员分享,可在线阅读,更多相关《知识讲解_高考总复习:统计与统计案例.doc(24页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、高考总复习:统计与统计案例编稿:孙永钊审稿:张林娟【考大年夜纲求】1.随机抽样1理解随机抽样的需要性跟要紧性;2会用复杂随机抽样办法从总体中抽取样本;理解分层抽样跟系统抽样办法.2.用样本估计总体1理解分布的意思跟感染,会列频率分布表,会画频率分布直方图、频率折线图、茎叶图,理解它们各自的特征.2理解样本数据标准差的意思跟感染,会打算数据标准差.3能从样本数据中提取全然的数字特色如均匀数、标准差,并作出公正的阐明.4会用样本的频率分布估计总体分布,会用样本的全然数字特色估计总体的全然数字特色,理解用样本估计总体的思想.5会用随机抽样的全然办法跟样本估计总体的思想,处理一些复杂的理论征询题.3.
2、变量的相关性1会作两个有关系变量数据的散点图,会使用散点图见解变量间的相关关系;2理解最小二乘法的思想,能按照给出的线性回归方程系数公式树破线性回归方程线性回归方程系数公式不恳求阅历.【知识收集】统计图表用样本估计总体统计复杂随机抽样数据的整理分析数据的数字特色分层抽样系统抽样变量的相关性【考点梳理】考点一、随机抽样从调查的东西中按照肯定的办法抽取一局部,停顿调查或不雅观察,猎取数据,并以此对调查东西的某工程标做出揣摸,这的确是抽样调查调查东西的全体称为总体,被抽取的一局部称为样本.1复杂的随机抽样复杂随机抽样的不雅观点:设一个总体的个人数为N假设通过逐一抽取的办法从中抽取一个样本,且每次抽取
3、时各个个人被抽到的概率相当,就称如斯的抽样为复杂随机抽样用复杂随机抽样从含有N个个人的总体中抽取一个容量为n的样本时,每次抽取一个个人时,任一个人被抽到的概率为;在全体抽样过程中各个个人被抽到的概率为;复杂随机抽样的特征是:不放回抽样,逐一地停顿抽取,各个个人被抽到的概率相当;复杂随机抽样办法表达了抽样的客不雅观性与公正性,是其他更复杂抽样办法的基础复杂抽样常用办法:抽签法:先将总体中的所有个人(共有N个)编号(号码可从1到N),并把号码写在外形、大小一样的号签上(号签可用小球、卡片、纸条等制作),然后将这些号签放在一致个箱子里,停顿均匀搅拌,抽签时每次从中抽一个号签,连续抽取n次,就掉掉落一
4、个容量为n的样本有用范围:总体的个人数未多少多优点:抽签法笨重易行,当总体的个人数不太多时合适采用抽签法随机数表法:随机数表抽样“三步曲:第一步,将总体中的个人编号;第二步,选定开始的数字;第三步,猎取样本号码2系统抽样:当总体中的个人数较多时,可将总体分成均衡的多少多个局部,然后按预先制定出的规那么,从每一局部抽取一个个人,掉掉落需要的样本,这种抽样叫做系统抽样系统抽样的步伐:采用随机的办法将总体中的个人编号,为笨重起见,偶尔可开门见山采用个人所带有的号码,如考生的准考证号、街道上各户的门商标等等为将全体的编号分段(即分成多少多个局部),要判定分段的间隔当是整数时(N为总体中的个人的个数,n
5、为样本容量),;当不是整数时,通过从总体中剔除一些个人使剩下的总体中个人的个数能被n整除,这时.在第一段用复杂随机抽样判定肇端的个人编号按照事先判定的规那么抽取样本(素日是将加上间隔,掉掉落第2个编号,第3个编号,如斯接着下去,直到猎取全体样本)要点说明:系统抽样有用于总体中的个人数较多的情况,它与复杂随机抽样的联系在于:将总体均分后的每一局部停顿抽样时,采用的是复杂随机抽样;与复杂随机抽样一样,系统抽样是等概率抽样,它是客不雅观的、公正的总体中的个人数偏偏能被样本容量整除时,可用它们的比值作为系统抽样的间隔;当总体中的个人数不克不迭被样本容量整除时,可用复杂随机抽样先从总体中剔除大年夜批个人
6、,使剩下的个人数能被样本容量整除再停顿系统抽样3分层抽样:当已经清楚总体由差异清楚的多少多局部形成时,为了使样本更充分地反响总体的情况,常将总体分成多少多局部,然后按照各局部所占的比例停顿抽样,这种抽样叫做分层抽样,所分成的局部叫做层4.常用的三种抽样办法的比较:类不共同征差异点联系有用范围复杂随机抽样抽样过程中每个个人被抽取的概率相当从总体中逐一抽取是后两种办法的基础总体个数较少系统抽样将总体均分成多少多局部,按事先判定的规那么在各局部抽取在肇端局部抽样时用复杂随机抽样总体个数较多分层抽样将总体分成多少多层,分层停顿抽取各层抽样时采用复杂随机抽样或系统抽样总体由差异清楚的多少多局部形成要点说
7、明:1各种抽样的个人被抽到的概率相当;2抽样过程中个人被抽到的概率相当.5.不放回抽样跟放回抽样:在抽样中,假设每次抽出个人后不再将它放回总体,称如斯的抽样为不放回抽样;假设每次抽出个人后再将它放回总体,称如斯的抽样为放回抽样随机抽样、系统抽样、分层抽样全然上不放回抽样考点二、用样本估计总体1.统计图表包括条形图、折线图、饼图、茎叶图2.作频率分布直方图的步伐(1)求极差(即一组数据中最大年夜值与最小值的差)(2)决定组距与组数(3)将数据分组(4)列频率分布表(5)画频率分布表3.频率分布折线图跟总体密度曲线(1)频率分布折线图:连接频率分布直方图中各小长方形上端的中点,就得频率分布折线图(
8、2)总体密度曲线:随着样本容量的增加,作图所分的组数增加,组距减小,呼应的频率折线图会越来越濒临于一条光滑曲线,即总体密度曲线4.标准差跟方差(1)标准差是样本数据到均匀数的一种均匀间隔,(2)方差:(是样本数据,是样本容量,是样本均匀数)要点说明:幻想中的总体所包括个人数屡屡是特不多的,怎么样求得总体的均匀数跟标准差呢?(素日的做法是用样本的均匀数跟标准差去估计总体的均匀数与标准差,这与有样本的频率分布近似替换总体分布是类似的,只需样本的代表性好,如斯做的确是公正的,也是可以接受的.)5.使用频率分布直方图估计样本的数字特色(1)中位数:在频率分布直方图中,中位数右边跟右边的直方图的面积该当
9、相当,由此可以估计中位数的值(2)均匀数:均匀数的估计值等于频率分布直方图中每个小矩形的面积乘以小矩形底边中点的横坐标之跟(3)众数:在频率分布直方图中,众数是最高的矩形的中点的横坐标6.频率分布直方图反响样本的频率分布(1)频率分布直方图中横坐标表示组距,纵坐标表示,频率=组距(2)频率分布直方图中各小长方形的面积之跟为1,因此在频率分布直方图中组距是一个结实值,因此各小长方形高的比也的确是频率比.(3)频率分布表跟频率分布直方图是一组数据频率分布的两种办法,前者精确,后者直不雅观.(4)众数为最高矩形中点的横坐标.(5)中位数为平分频率分布直方图面积且垂直于横轴的直线与横轴交点的横坐标.考
10、点三、变量的相关性1 散点图将两个变量所对应的点描在直角坐标系中,这些点形成了变量之间的一个图,称为变量之间的散点图散点图笼统地反响了各对数据的亲热程度.大年夜略地看,散点分布存在肯定的法那么.假设变量之间存在某种关系,这些点会有一个汇合趋势,这种趋势素日可以用一条光滑的曲线来近似表示,如斯近似的过程称为曲线拟合.2.两个变量的线性相关1相关关系:当自变量必定时,因变量的取值带有肯定的随机性的两个变量之间的关系称为相关关系(2)正相关在散点图中,点分布在从左下角到右上角的地区.关于两个变量的这种相关关系,我们将它称为正相关.(3)负相关在散点图中,点分布在从左上角到右下角的地区,两个变量的这种
11、相关关系称为负相关.(4)线性相关关系、回归直线假设散点图中点的分布从全体上看大年夜抵在一条直线附近,就称这两个变量之间存在线性相关关系,这条直线叫做回归直线.3.回归方程(1)最小二乘法求回归直线使得样本数据的点到回归直线的间隔的平方跟最小的办法叫做最小二乘法.(2)回归方程方程是两个存在线性相关关系的变量的一组数据的回归方程,期中是待定参数.要点说明:相关关系与函数关系的异同点:一样点:两者均是指两个变量的关系.差异点:函数关系是一种判定的关系,相关关系是一种非判定的关系;函数关系是一种因果关系,而相关关系不用定是因果关系,也可以是伴随关系.考点四、统计案例1.回归分析(1)定义:对存在相
12、关关系的两个变量停顿统计分析的一种常用办法;(2)随机倾向:线性回归模型用表示,其中为模型的未知数,称为随机倾向.(3)样本点的中心在存在线性相关关系的数据中回归方程的截距跟歪率的最小二乘估计公式分不为:其中称为样本点的中心.(4)相关系数事先,阐明两个变量正相关;事先,阐明两个变量负相关.的绝对值越濒临于0时,阐明两个变量之间多少乎不存在线性相关关系.素日大年夜于0.75时,认为两个变量有特不强的线性相关性.2.残差分析(1)总倾向平方跟把每个效应(不雅观察值减去总的均匀值)的平方加起来即:(2)残差数据点跟它回归直线上呼应位置的差异是随机倾向的效应,称为残差.(3)残差平方跟.(4)相关指
13、数的值越大年夜,阐明残差平方跟越小,也的确是说模型的拟合结果越好.在线性回归模型中,表示阐明变量对预报变量变卦的贡献率,越濒临于1,表示回归的结果越好.3.独破性检验(1)分类变量:变量的差异“值表示个人所属的差异类不,像这类变量称为分类变量.(2)列联表:列出两个分类变量的频数表,称为列联表.假设有两个分类变量X跟Y,它们的可以取值分不为,其样本频数列联表(称为22列联表)为22列联表总计总计结构一个随机变量,其中为样本容量.(3)独破性检验使用随机变量来判定是否能以肯定控制认为“两个分类变量有关系的办法称为两个分类变量的独破性检验.注:在独破性检验中经常由掉掉落不雅观察值,那么=是否成破?
14、与的关系并不是=,是的不雅观察值,或者说是一个随机变量,它在,取差异值时,可以差异,而是取定一组数,后的一个判定的值.【模典范题】典范一、复杂随机抽样【例1】某车间工人加工一种轴100件,为了理解这种轴的直径,要从中抽取10件轴在一致条件下测量,怎么样采用复杂随机抽样的办法抽取样本?【思路点拨】复杂随机抽样一般采用两种办法:抽签法追随机数表法.【分析】解法1:抽签法将100件轴编号为1,2,100,并做好大小、外形一样的号签,分不写上这100个数,将这些号签放在一起,停顿均匀搅拌,接着连续抽取10个号签,然后测量谁人10个号签对应的轴的直径.解法2:随机数表法将100件轴编号为00,01,99
15、,在随机数表中选定一个肇端位置,如取第21行第1个数开始,拔取10个为68,34,30,13,70,55,74,77,40,44,这10件即为所要抽取的样本.【总结升华】从以上两种办法可以看出,当总体个数较少时用两种办法都可以,当样本总数较多时,办法2优于办法1.举一反三:【变式】某大年夜学为了支持奥运会,从报名的24名大年夜三的老师中选6人形成志愿小组,请用抽签法追随机数表法方案抽样方案.【思路点拨】(1)总体的个人数较少,使用抽签法或随机数表法可随便猎取样本;(2)抽签法的把持要点:编号、制签、搅匀、抽取;(3)随机数表法的把持要点:编号、选肇端数、读数、猎取样本.【分析】抽签法第一步:将
16、24名志愿者编号,编号为1,2,3,24;第二步:将24个号码分不写在24张外形完好一样的纸条上,并揉成团,制成号签;第三步:将24个号签放入一个不透明的盒子中,充分搅匀;来源:Zxxk.Com第四步:从盒子中逐一抽取6个号签,并记录上面的编号;第五步:所得号码对应的志愿者,的确是志愿小组的成员.随机数表法第一步:将24名老师编号,编号为01,02,03,24;第二步:在随机数表中任选一数开始,按某一判定倾向读数;第三步:凡不在0124中的数或已读过的数,都跳过去不作记录,依次记录下得数;第四步:寻出号码与记录的数一样的老师形成志愿小组.典范二、系统抽样【例2】某校高中三年级的295名老师已经
17、编号为1,2,295,为了理解老师的深造情况,要按1:5的比例抽取一个样本,用系统抽样的办法停顿抽取,并写出过程.【思路点拨】按1:5分段,每段5人,共分59段,每段抽取一人,关键是判定第1段的编号.【分析】按照1:5的比例,该当抽取的样本容量为2955=59,我们把259名同学分成59组,每组5人,第一组是编号为15的5名老师,第2组是编号为610的5名老师,依次下去,59组是编号为291295的5名老师.采用复杂随机抽样的办法,从第一组5名老师中抽出一名老师,不妨设编号为k(1k5),那么抽取的老师编号为k+5L(L=0,1,2,,58),掉掉落59个个人作为样本,如当k=3时的样本编号为
18、3,8,13,288,293.【总结升华】系统抽样可按事先规那么的规那么抽取样本.此题采用的规那么是第一组随机抽取的老师编号为k,那么第m组抽取的老师编号为k+5(m-1).举一反三:【变式】一个总体中有100个个人,随机编号为0,1,2,99,依编号次第均匀分成10个小组,组号依次为l,2,3,10现用系统抽样办法抽取一个容量为10的样本,规那么假设在第1组随机抽取的号码为m,那么在第k组中抽取的号码个位数字与m+k的个位数字一样假设m=6,那么在第7组中抽取的号码是【答案】,在第7小组中抽取的号码是63典范三、分层抽样例3(北京高考)某校老年、中年跟青年教师的人数见下表,采用分层抽样的办法
19、调查教师的躯体情况,在抽取的样本中,青年教师有320人,怎该样本的老年教师人数为()A.90B.100C.180D.300【思路点拨】先按照表格数据打算出老年教师跟青年教师的比例关系然后求解即可。【答案】C【分析】由题意,老年跟青年教师的人数比为900:1600=9:16,由于青年教师有320人,因此老年教师有180人.应选C.【总结升华】处理分层抽样征询题的关键是要保证各个典范在样本中的比例跟在总体中的比例一样.举一反三:【变式】(惠州模拟)某黉舍高一、高二、高三年级的老师人数分不为900、900、1200人,现用分层抽样的办法从该校高中三个年级的老师中抽取容量为50的样本,那么应从高三年级
20、抽取的老师人数为()A.15B.20C.25D.30【答案】B【分析】三个年级的老师人数比例为3:3:4,按分层抽样办法,在高三年级该当抽取人数为:人,应选B.【例4】一个地区共有5个乡镇,人口3万人,其中人口比例为3:2:5:2:3,从3万人中抽取一个300人的样本,分析某种疾病的发病率,已经清楚这种疾病与差异的地理位置及水土有关,征询应采用什么样的办法?并写出具体过程.【思路点拨】采用分层抽样的办法.【分析】由于疾病与地理位置跟水土均有关系,因此不同乡镇的发病情况差异清楚,因此采用分层抽样的办法,具体过程如下:1将3万人分为5层,其中一个乡镇为一层.2依依然本容量的比例随机抽取各乡镇应抽取
21、的样本.3003/15=60人,3002/15=40人,3005/15=100人,3002/15=40人,3003/15=60人,因此各乡镇抽取人数分不为60人、40人、100人、40人、60人.3将300人组到一起,即掉掉落一个样本.【总结升华】分层抽样在一样往常生活中使用广泛,其抽取样本的步伐尤为要紧,应牢记按照呼应的比例去抽取.举一反三:【变式】某单位迩来结构了一次健身运动,运动分为登山组跟拍浮组,且每个职工至多参加了其中一组.在参加运动的职工中,青年人占42.5,中年人占47.5,老年人占10.登山组的职工占参加运动总人数的,且该组中,青年人占50,中年人占40,老年人占10.为了理解
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 知识 讲解 高考 复习 统计 案例
限制150内