2022年知识讲解-高考总复习:统计与统计案例 .pdf
《2022年知识讲解-高考总复习:统计与统计案例 .pdf》由会员分享,可在线阅读,更多相关《2022年知识讲解-高考总复习:统计与统计案例 .pdf(29页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、高考总复习:统计与统计案例【考纲要求】1理解随机抽样的必要性和重要性;2会用简单随机抽样方法从总体中抽取样本;了解分层抽样和系统抽样方法. 2. 用样本估计总体1了解分布的意义和作用,会列频率分布表,会画频率分布直方图、频率折线图、茎叶图,理解它们各自的特点. 2理解样本数据标准差的意义和作用,会计算数据标准差. 3能从样本数据中提取基本的数字特征如平均数、标准差,并作出合理的解释. 4会用样本的频率分布估计总体分布,会用样本的基本数字特征估计总体的基本数字特征,理解用样本估计总体的思想. 5会用随机抽样的基本方法和样本估计总体的思想,解决一些简单的实际问题. 3. 变量的相关性1会作两个有关
2、联变量数据的散点图,会利用散点图认识变量间的相关关系;2了解最小二乘法的思想,能根据给出的线性回归方程系数公式建立线性回归方程线性回归方程系数公式不要求记忆. 【知识网络】【考点梳理】考点一、随机抽样从调查的对象中按照一定的方法抽取一部分,进行调查或观测,获取数据,并以此对调查对象的某项统计图表用样本估计总体统计简单随机抽样数据的整理分析数据的数字特征分层抽样系统抽样变量的相关性精选学习资料 - - - - - - - - - 名师归纳总结 - - - - - - -第 1 页,共 29 页指标做出推断,这就是抽样调查调查对象的全体称为总体,被抽取的一部分称为样本.1简单的随机抽样简单随机抽样
3、的概念:设一个总体的个体数为N如果通过逐个抽取的方法从中抽取一个样本,且每次抽取时各个个体被抽到的概率相等,就称这样的抽样为简单随机抽样 用简单随机抽样从含有N个个体的总体中抽取一个容量为n 的样本时, 每次抽取一个个体时,任一个体被抽到的概率为1N;在整个抽样过程中各个个体被抽到的概率为nN;简单随机抽样的特点是:不放回抽样,逐个地进行抽取,各个个体被抽到的概率相等;简单随机抽样方法表达了抽样的客观性与公平性,是其他更复杂抽样方法的基础简单抽样常用方法:抽签法:先将总体中的所有个体( 共有 N个) 编号 ( 号码可从1 到 N),并把号码写在形状、大小相同的号签上 ( 号签可用小球、卡片、纸
4、条等制作) ,然后将这些号签放在同一个箱子里,进行均匀搅拌,抽签时每次从中抽一个号签,连续抽取n 次,就得到一个容量为n 的样本适用范围:总体的个体数不多优点:抽签法简便易行,当总体的个体数不太多时适宜采用抽签法随机数表法:随机数表抽样“三步曲”:第一步,将总体中的个体编号;第二步,选定开始的数字;第三步,获取样本号码2系统抽样:当总体中的个体数较多时,可将总体分成均衡的几个部分,然后按预先制定出的规则,从每一部分抽取一个个体,得到需要的样本,这种抽样叫做系统抽样系统抽样的步骤:采用随机的方式将总体中的个体编号,为简便起见,有时可直接采用个体所带有的号码,如考生的准考证号、街道上各户的门牌号等
5、等为将整个的编号分段 ( 即分成几个部分) ,要确定分段的间隔k当Nn是整数时 (N 为总体中的个体的个数, n 为样本容量 ) ,Nkn;当Nn不是整数时,通过从总体中剔除一些个体使剩下的总体中个体的个数N能被 n 整除,这时Nkn. 在第一段用简单随机抽样确定起始的个体编号l按照事先确定的规则抽取样本( 通常是将l加上间隔k,得到第2 个编号lk,第 3 个编号2lk,这样继续下去,直到获取整个样本) 要点诠释:精选学习资料 - - - - - - - - - 名师归纳总结 - - - - - - -第 2 页,共 29 页系统抽样适用于总体中的个体数较多的情况,它与简单随机抽样的联系在于
6、:将总体均分后的每一部分进行抽样时,采用的是简单随机抽样;与简单随机抽样一样,系统抽样是等概率抽样,它是客观的、公平的总体中的个体数恰好能被样本容量整除时,可用它们的比值作为系统抽样的间隔;当总体中的个体数不能被样本容量整除时,可用简单随机抽样先从总体中剔除少量个体,使剩下的个体数能被样本容量整除再进行系统抽样3分层抽样:当已知总体由差异明显的几部分组成时,为了使样本更充分地反映总体的情况,常将总体分成几部分,然后按照各部分所占的比例进行抽样,这种抽样叫做分层抽样,所分成的部分叫做层4. 常用的三种抽样方法的比较:类别共同点不同点联系适用范围简单随机抽样抽样过程中每个个体被抽取的概率相等从总体
7、中逐个抽取是后两种方法的基础总体个数较少系统抽样将总体均分成几部分,按事先确定的规则在各部门抽取在起始部分抽样时用简单随机抽样总体个数较多分层抽样将总体分成几层, 分层进行抽取各层抽样时采用简单随机抽样或系统抽样总体由差异明显的几部分组成要点诠释:1各种抽样的个体被抽到的概率相等;2抽样过程中个体被抽到的概率相等. 5. 不放回抽样和放回抽样: 在抽样中,如果每次抽出个体后不再将它放回总体,称这样的抽样为不放回抽样;如果每次抽出个体后再将它放回总体,称这样的抽样为放回抽样随机抽样、系统抽样、分层抽样都是不放回抽样考点二、用样本估计总体1. 统计图表包括条形图、折线图、饼图、茎叶图2. 作频率分
8、布直方图的步骤(1) 求极差 ( 即一组数据中最大值与最小值的差) (2) 决定组距与组数(3) 将数据分组(4) 列频率分布表精选学习资料 - - - - - - - - - 名师归纳总结 - - - - - - -第 3 页,共 29 页(5) 画频率分布表3. 频率分布折线图和总体密度曲线(1) 频率分布折线图: 连接频率分布直方图中各小长方形上端的中点, 就得频率分布折线图(2) 总体密度曲线: 随着样本容量的增加, 作图所分的组数增加, 组距减小 , 相应的频率折线图会越来越接近于一条光滑曲线, 即总体密度曲线4. 标准差和方差(1) 标准差是样本数据到平均数的一种平均距离,2221
9、21()().() nsxxxxxxn(2) 方差 : 2222121()().() nsxxxxxxn (nx是样本数据 ,n是样本容量 ,x是样本平均数 ) 要点诠释: 现实中的总体所包含个体数往往是很多的, 如何求得总体的平均数和标准差呢?( 通常的做法是用样本的平均数和标准差去估计总体的平均数与标准差, 这与有样本的频率分布近似代替总体分布是类似的 , 只要样本的代表性好, 这样做就是合理的, 也是可以接受的.) 5. 利用频率分布直方图估计样本的数字特征(1) 中位数 : 在频率分布直方图中, 中位数左边和右边的直方图的面积应该相等, 由此可以估计中位数的值(2) 平均数 : 平均数
10、的估计值等于频率分布直方图中每个小矩形的面积乘以小矩形底边中点的横坐标之和(3) 众数 : 在频率分布直方图中, 众数是最高的矩形的中点的横坐标6. 频率分布直方图反映样本的频率分布(1) 频率分布直方图中横坐标表示组距, 纵坐标表示组 距频 率, 频率 =组距组 距频 率(2) 频率分布直方图中各小长方形的面积之和为1, 因此在频率分布直方图中组距是一个固定值, 所以各小长方形高的比也就是频率比. (3) 频率分布表和频率分布直方图是一组数据频率分布的两种形式, 前者准确 , 后者直观 . (4) 众数为最高矩形中点的横坐标. (5) 中位数为平分频率分布直方图面积且垂直于横轴的直线与横轴交
11、点的横坐标. 考点三、变量的相关性1 散点图将两个变量所对应的点描在直角坐标系中,这些点组成了变量之间的一个图,称为变量之间的散点图散点图形象地反映了各对数据的密切程度. 粗略地看,散点分布具有一定的规律. 精选学习资料 - - - - - - - - - 名师归纳总结 - - - - - - -第 4 页,共 29 页如果变量之间存在某种关系,这些点会有一个集中趋势,这种趋势通常可以用一条光滑的曲线来近似表示,这样近似的过程称为曲线拟合. 2. 两个变量的线性相关1相关关系:当自变量一定时,因变量的取值带有一定的随机性的两个变量之间的关系称为相关关系(2) 正相关在散点图中, 点散布在从左下
12、角到右上角的区域. 对于两个变量的这种相关关系, 我们将它称为正相关. (3) 负相关在散点图中 , 点散布在从左上角到右下角的区域, 两个变量的这种相关关系称为负相关. (4) 线性相关关系、回归直线如果散点图中点的分布从整体上看大致在一条直线附近, 就称这两个变量之间具有线性相关关系, 这条直线叫做回归直线. 3. 回归方程(1) 最小二乘法求回归直线使得样本数据的点到回归直线的距离的平方和最小的方法叫做最小二乘法. (2) 回归方程方程ybxa是两个具有线性相关关系的变量的一组数据1122(,),(,),(,),nnxyxyxy的回归方程 ,期中,a b是待定参数 . 1122211()
13、()()nniiiiiinniiiixxyyx ynxybxxxnxaybx要点诠释:相关关系与函数关系的异同点:相同点 : 两者均是指两个变量的关系. 不同点 : 函数关系是一种确定的关系, 相关关系是一种非确定的关系; 函数关系是一种因果关系, 而相关关系不一定是因果关系, 也可能是伴随关系. 考点四、统计案例精选学习资料 - - - - - - - - - 名师归纳总结 - - - - - - -第 5 页,共 29 页(1) 定义 : 对具有相关关系的两个变量进行统计分析的一种常用方法; (2) 随机误差 : 线性回归模型用ybxae表示,其中a,b为模型的未知数,e称为随机误差. (
14、3) 样本点的中心在具有线性相关关系的数据1122(,),(,),(,),nnxyxyxy中回归方程的截距和斜率的最小二乘估计公式分别为: 121()(), =-()niiiniixxyybay bxxx其中111, =,( , )nniiiixx yxx yn称为样本点的中心. (4) 相关系数12211()()()()niiinniiiixxyyrxxyy当0r时, 说明两个变量正相关; 当0,abc600.当数据 a,b, c 的方差 s2最大时,写出a,b,c 的值 (结论不要求证明),并求此时s2的值“ 厨余垃圾 ” 箱“ 可回收物 ” 箱“ 其他垃圾 ” 箱厨余垃圾40010010
15、0 可回收物3024030 其他垃圾202060 精选学习资料 - - - - - - - - - 名师归纳总结 - - - - - - -第 13 页,共 29 页注:2222121s =(- ) +(- ) +(- ) ,nxxxxxxxn其中 为数据 x1, x2,xn的平均数【思路点拨】 1 、 2两问可通过古典概型公式加以求解;第3问利用方差的意义求解。【解析】1厨余垃圾投放正确的概率约为4002=400+100+1003“厨余垃圾 ”箱里厨余垃圾量厨余垃圾总量2设生活垃圾投放错误为事件A,则A表示升华垃圾投放正确。事件A的概率约为“厨余垃圾”箱里厨余垃圾量、“可回收物”箱里的可回收
16、物量与“其他垃圾”箱里其他垃圾量的总和除以升华垃圾总量,即()P A约为400+240+60=0.71000所以( )P A3当 a=600,b=c=0 时,2s取得最大值。因为1=( + + )=2003xa b c,所以22221s =(600-200) +(0-200) +(0-200) =800003。【总结升华】此题主要考察求解古典概型的方法和方差的几何意义,同时考查数据收集处理的能力。【例 7】为了解甲、乙两厂的产品的质量,从两厂生产的产品中随机抽取各10件,测量产品中某种元素的含量单位:毫克.下表是测量数据的茎叶图:甲厂乙厂9 0 3 9 6 5 8 1 8 4 5 6 9 0
17、3 1 5 0 3 2 1 0 3 规定:当产品中的此种元素含量满足 18 毫克时,该产品为优等品. 试用上述样本数据估计甲、乙两厂生产的优等品率;从乙厂抽出的上述10 件产品中,随机抽取3 件,求抽到的3 件产品中优等品数的分布列及其数学期望( )E;从上述样品中,各随机抽取3 件,逐一选取,取后有放回,求抽到的优等品数甲厂恰比乙厂多2 件的概率【思路点拨】 根据茎叶图所给数据,数出甲乙厂优等品数量即可。精选学习资料 - - - - - - - - - 名师归纳总结 - - - - - - -第 14 页,共 29 页的取值为0,1, 2,3,分别求出对应的抽取方法,再按照等可能事件概率方法
18、求解可得。优等品数甲厂恰比乙厂多2 件包括 2 种情况,“甲厂 2 件,乙厂0”以及“甲厂3 件,乙厂1 件” ,分别按照独立重复试验概率公式求解,又从甲厂抽取与从乙厂抽取相互独立,按照乘法计算即可。【解析】I甲厂抽取的样本中优等品有6 件,优等品率为63.105乙厂抽取的样本中优等品有5 件,优等品率为51.102 II的取值为 0,1,2, 3. 0312555533101015(0),(1),1212CCCCPPCC21355533101051(2),(3)1212CCCPPCC所以的分布列为0 1 2 3 P112512512112故155130123.121212122E的数学期望为
19、()(III) 抽取的优等品数甲厂恰比乙厂多2 件包括 2 个事件,即 A=“ 抽取的优等品数甲厂2 件, 乙厂 0 件” ,B=“ 抽取的优等品数甲厂3 件,乙厂1 件”2200333321127( )( ) ()( ) ( )5522500P ACC331123331181( )( )( ) ()5221000P BCC抽取的优等品数甲厂恰比乙厂多2 件的概率为278127( )( ).5001000200P AP B【总结升华】此题属于统计与概率综合题,考查茎叶图有关知识,同时考查学生对相互独立事件同时发生的概率与独立重复试验的概率的应用能力。【例 8】对某电子元件进行寿命追踪调查,情况
20、如下:寿命h 100200 200300 300400 400 500 500600 个数20 30 80 40 30 1列出频率分布表;2画出频率分布直方图和累积频率分布图;精选学习资料 - - - - - - - - - 名师归纳总结 - - - - - - -第 15 页,共 29 页3估计电子元件寿命在100400 h 以内的概率;4估计电子元件寿命在400 h 以上的概率 . 【思路点拨】此题直接利用作频率分布直方图的步骤求解即可得到答案。【解析】1频率分布表如下:寿命 h频数频率累积频率100200 20 200300 30 300400 80 400500 40 500600 3
21、0 1 合计200 1 2频率分布直方图如下:3由累积频率分布图可以看出,寿命在100400 h 内的电子元件出现的频率为0.65 ,所以我们估计电子元件寿命在100400 h 内的概率为0.65. 4由频率分布表可知,寿命在400 h 以上的电子元件出现的频率为0.20+0.15=0.35,故我们估计电子元件寿命在400 h 以上的概率为0.35. 【总结升华】画频率分布条形图、直方图时要注意纵、横坐标轴的意义,明确频率分布直方图中各小长方形的面积之和为1.举一反三:【变式 1】根据中华人民共和国道路交通安全法规定:车辆驾驶员血液酒精浓度在2080 mg/100mL不含 80之间,属于酒后驾
22、车;血液酒精浓度在80mg/100mL 含 80以上时,属醉酒驾车。据有关报道, 2009 年 8 月 15 日至 8 月 28 日,某地区查处酒后驾车和醉酒驾车共500 人,如图是对这500 人血液中酒精含量进行检测所得结果的频率分布直方图,则属于醉酒驾车的人数约为精选学习资料 - - - - - - - - - 名师归纳总结 - - - - - - -第 16 页,共 29 页O 40 45 50 55 60 体重 (kg) 频率组距m 6 2 A25 B50 C75 D100 【答案】 C 【变式 2】某部门计划对某路段进行限速,为调查限速60 km/h 是否合理,对通过该路段的300
23、辆汽车的车速进行检测,将所得数据按40,50),50,60),60,70),70,80辆. 【答案】 180。【变式 3】 从某校随机抽取了100名学生,将他们的体重 单位:kg数据绘制成频率分布直方图如图,由图中数据可知m= ,所抽取的学生中体重在5045kg的人数是【答案】0.1,50. 【例 9】对某校高三年级学生参加社区服务次数进行统计,随机抽取M名学生作为样本,得到这M名学生参加社区服务的次数. 根据此数据作出了频数与频率的统计表和频率分布直方图如下:分组频数频率10,15)10 15,20)24 n20,25)mp车速O40 50 60 70 800.0100.0350.030a频
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 2022年知识讲解-高考总复习:统计与统计案例 2022 知识 讲解 高考 复习 统计 案例
限制150内