高三数学第十二章 统计 第三讲 变量间的相关关系与统计案例 理.ppt
目 录 Contents考情精解读考点1考点2A.知识全通关B.题型全突破C.能力大提升考法1考法2考法3专题1考情精解读考纲解读命题趋势命题规律考情精解读1考试大纲1.会作两个有关联变量的数据的散点图,会利用散点图认识变量间的相关关系.2.了解最小二乘法的思想,能根据给出的线性回归方程系数公式建立线性回归方程.3.了解下列一些常见的统计方法,并能应用这些方法解决一些实际问题.(1)了解独立性检验(只要求22列联表)的基本思想、方法及其简单应用.(2)了解回归分析的基本思想、方法及其简单应用.数学 第三讲变量的相关关系与统计案例考纲解读命题规律考情精解读2命题趋势数学 第三讲变量的相关关系与统计案例考点2016全国2015全国2014全国自主命题区域回归分析【20%】全国,18,12分全国,19,12分全国,19,12分考纲解读命题规律考情精解读3命题趋势数学 第三讲变量的相关关系与统计案例考点2016全国2015全国2014全国自主命题区域独立性检验【10%】考纲解读命题规律考情精解读4返回目录1.热点预测(1)散点图与相关关系;(2)线性回归方程的求解及其应用;(3)独立性检验的应用,以上三点是高考考查的热点,以选择题、解答题的形式呈现,分值分别为5分,12分.2.趋势分析预测2018年高考对本讲内容的考查仍以线性回归方程和独立性检验的应用为主,尤其是独立性检验与统计、概率的综合题目是高考的趋势,应引起重视.命题趋势数学 第三讲变量的相关关系与统计案例知识全通关知识全通关1考点1回归分析继续学习数学 第三讲变量的相关关系与统计案例1.变量间的相关关系当自变量取值一定时,因变量的取值带有一定的随机性,则这两个变量之间的关系叫作相关关系.即相关关系是一种非确定性关系.当一个变量的值由小变大时,另一个变量的值也由小变大,则这两个变量正相关;当一个变量的值由小变大时,而另一个变量的值由大变小,则这两个变量负相关.2.散点图将样本中的n个数据点(xi,yi)(i=1,2,n)描在平面直角坐标系中,所得图形叫作散点图.具有正相关关系的两个变量的散点图如图12-3-1(1)所示,具有负相关关系的两个变量的散点图如图12-3-1(2)所示.图12-3-1知识全通关2高考帮数学 第三讲变量的相关关系与统计案例继续学习3.两个变量的线性相关如果散点图中点的分布从整体上看大致在一条直线附近,则这两个变量之间具有线性相关关系,这条直线叫作回归直线.回归直线对应的方程叫作回归直线方程(简称回归方程).知识全通关3数学 第三讲变量的相关关系与统计案例继续学习【说明】回归直线 必过样本点的中心(,),这个结论既是检验所求回归直线方程是否准确的依据,也是求参数的一个依据.4.回归方程的求解求回归方程的方法是最小二乘法,即使样本数据的点到回归直线的距离的平方和最小.若变量x与y具有线性相关关系,有n个样本数据(xi,yi)(i=1,2,n),则回归方程知识全通关4数学 第三讲变量的相关关系与统计案例继续学习5.相关系数相关系数我们可以利用相关系数来定量地衡量两个变量之间的线性相关关系,计算公式为当r0时,表明两个变量正相关;当r0时,表明两个变量负相关.|r|越接近于1,表明两个变量的线性相关性越强;|r|越接近于0,表明两个变量之间几乎不存在线性相关关系.通常,当|r|大于0.75时,我们认为两个变量之间存在着很强的线性相关关系.知识全通关5数学 第三讲变量的相关关系与统计案例继续学习1.分类变量可以用不同“值”表示个体所属的不同类别的变量称为分类变量.2.22列联表设X,Y为两个变量,它们的取值分别为x1,x2和y1,y2,其样本频数列联表(22列联表)如下:考点2独立性检验y1y2总计x1aba+bx2cdc+d总计a+cb+da+b+c+d知识全通关6数学 第三讲变量的相关关系与统计案例继续学习3.独立性检验利用随机变量K2也可表示为(其中n=a+b+c+d为样本容量)来判断“两个变量有关系”的方法称为独立性检验.知识全通关7数学 第三讲变量的相关关系与统计案例继续学习4.独立性检验的一般步骤(1)根据样本数据列出22列联表;(2)计算随机变量K2的观测值k,查下表确定临界值k0:(3)如果kk0,就推断“X与Y有关系”,这种推断犯错误的概率不超过P(K2k0);否则,就认为在犯错误的概率不超过P(K2k0)的前提下不能推断“X与Y有关系”.P(K2k0)0.500.400.250.150.10k00.455 0.708 1.323 2.072 2.706P(K2k0)0.050.025 0.010 0.005 0.001k03.841 5.024 6.635 7.879 10.828知识全通关8返回目录数学第三讲变量的相关关系与统计案例【名师提醒】1.独立性检验是对两个变量有关系的可信程度的判断,而不是对其是否有关系的判断.2.通常认为k2.706时,样本数据就没有充分的证据显示“X与Y有关系”.3.独立性检验得出的结论是带有概率性质的,只能说结论成立的概率有多大,而不能完全肯定一个结论,因此才出现了临界值表.在分析问题时一定要注意这点,不可对某个问题下确定性结论,否则就可能对统计计算的结果作出错误的解释.题型全突破考法1频率分布直方图的绘制及应用继续学习数学 第三讲变量的相关关系与统计案例题型全突破1考法指导1.求回归直线方程的步骤2.利用回归直线方程进行预测是对总体的估计,此估计值不是准确值.进行预测时,把自变量代入回归直线方程即可对因变量进行估计.数学 第三讲变量的相关关系与统计案例继续学习题型全突破2考法示例考法示例1 1随着我国经济的发展,居民的储蓄存款逐年增长.设某地区城乡居民人民币储蓄存款(年底余额)如下表:年份2012 2013 2014 2015 2016时间代号t12345储蓄存款y(千亿元)567810(1)求y关于t的回归方程(2)用所求回归方程预测该地区2017年(t=6)的人民币储蓄存款附:回归方程数学 第三讲变量的相关关系与统计案例继续学习题型全突破3【解析】(1)列表计算如下:itiyitiyi12345123455678101491625512213250153655120(1)先由题中表格数据求出的值,然后根据公式即可求得线性回归方程;(2)将t=6代入(1)中的线性回归方程即可预测该地区2017年的人民币储蓄存款.高考帮数学 第三讲变量的相关关系与统计案例继续学习题型全突破4(2)将t=6代入回归方程可预测该地区2017年的人民币储蓄存款为=1.26+3.6=10.8(千亿元).【点评】线性回归分析就是研究两组变量间线性相关关系的一种方法,通过对统计数据的分析,可以预测可能的结果,这就是线性回归方程的基本应用,因此利用最小二乘法求线性回归方程是关键,必须熟练掌握线性回归方程中两个重要估计量的计算.考法2相关系数的意义继续学习数学 第三讲变量的相关关系与统计案例题型全突破5考法指导线性相关系数是从数值上来判断变量间的线性相关程度,若|r|的值越接近于1,说明变量间的线性相关程度越高;|r|的值越接近于0,说明变量间的线性相关程度越低.当两个变量间的关系可用一次函数表示时,r=1,若斜率为正,r=1,否则r=-1,r为正时表示正相关,r为负时表示负相关.数学 第三讲变量的相关关系与统计案例继续学习题型全突破6考法示例2 2016全国卷图12-3-4是我国2008年至2014年生活垃圾无害化处理量(单位:亿吨)的折线图.图12-3-4注:年份代码17分别对应年份20082014.(1)由折线图看出,可用线性回归模型拟合y与t的关系,请用相关系数加以说明;(2)建立y关于t的回归方程(系数精确到0.01),预测2016年我国生活垃圾无害化处理量.附注:数学 第三讲变量的相关关系与统计案例继续学习题型全突破7解析(1)由折线图中数据和附注中参考数据得因为y与t的相关系数近似为0.99,说明y与t的线性相关程度相当高,从而可以用线性回归模型拟合y与t的关系数学 第三讲变量的相关关系与统计案例继续学习题型全突破8【解析】由 及(1)得 所以,y关于t的回归方程为=0.92+0.10t.将2016年对应的t=9代入回归方程得 =0.92+0.109=1.82.所以预测2016年我国生活垃圾无害化处理量约为1.82亿吨.考法3独立性检验继续学习高考帮数学 第三讲变量的相关关系与统计案例题型全突破9考法指导 1.在22列联表中,如果两个变量没有关系,则应满足ad-bc0.|ad-bc|越小,说明两个变量之间关系越弱;|ad-bc|越大,说明两个变量之间关系越强.2.解独立性检验的应用问题的关注点(1)两个明确:明确两类主体;明确研究的两个问题.(2)两个关键:准确画出22列联表;准确理解K2.数学 第三讲变量的相关关系与统计案例继续学习题型全突破10考法示例3 某企业有两个分厂生产某种零件,按规定内径尺寸(单位:mm)的值落在29.94,30.06)的零件为优质品.从两个分厂生产的零件中各抽出了500件,量其内径尺寸,得结果如下表.分组29.86,29.90)29.90,29.94)29.94,29.98)29.98,30.02)频数126386182分组30.02,30.06)30.06,30.10)30.10,30.14)频数92614分组29.86,29.90)29.90,29.94)29.94,29.98)29.98,30.02)频数297185159分组30.02,30.06)30.06,30.10)30.10,30.14)频数766218甲厂:乙厂:数学 第三讲变量的相关关系与统计案例继续学习题型全突破11(1)试分别估计两个分厂生产的零件的优质品率;(2)由以上统计数据完成下面22列联表,并问是否有99%的把握认为“两个分厂生产的零件的质量有差异”?甲厂乙厂总计优质品非优质品总计【思想分析】(1)计算优质品的频率由频率估计概率(2)完成22列联表计算K2的观测值k作出判断数学 第三讲变量的相关关系与统计案例【解析】继续学习题型全突破12(1)甲厂抽查的500件产品中有360件优质品,从而估计甲厂生产的零件的优质品率为(360/500)100%=72%;乙厂抽查的500件产品中有320件优质品,从而估计乙厂生产的零件的优质品率为(320/500)100%=64%.(2)完成的22列联表如下:甲厂乙厂总计优质品360320680非优质品140180320总计5005001000由表中数据计算得K2的观测值所以有99%的把握认为“两个分厂生产的零件的质量有差异”.返回目录数学 第三讲变量的相关关系与统计案例题型全突破13【解析】独立性检验应注意以下几点:(1)在实际问题中,独立性检验的结论仅是一种数学关系的表述,表示结论成立的概率的大小;(2)对判断结果进行描述时,注意对象的选取要准确无误,应是对假设结论进行的含概率的判断.能力大提升独立性检验与统计、概率的综合应用继续学习数学 第三讲变量的相关关系与统计案例能力大提升1【示例4】某工厂有25周岁以上(含25周岁)工人300名,25周岁以下工人200名.为研究工人的日平均生产量是否与年龄有关,现采用分层抽样的方法,从中抽取100名工人,先统计他们某月的日平均生产件数,然后按工人年龄在“25周岁以上(含25周岁)”和“25周岁以下”分为两组,再将两组工人的日平均生产件数分成5组:50,60),60,70),70,80),80,90),90,100分别加以统计,得到如图所示的频率分布直方图.(1)从样本中日平均生产件数不足60件的工人中随机抽取2人,求至少抽到一名“25周岁以下组”工人的概率;(2)规定日平均生产件数不少于80件者为“生产能手”,请你根据已知条件完成22列联表,并判断是否有90%的把握认为“生产能手与工人所在的年龄组有关”?近几年高考中单独考查独立性检验的较少,多与统计、概率等知识综合考查,频率分布表与独立性检验融合在一起是一种常见的考查形式,一般需要根据条件列出22列联表,计算K2的观测值k,从而解决问题.继续学习数学 第三讲变量的相关关系与统计案例能力大提升2P(k2k0)0.1000.0500.0100.001k02.7063.8416.63510.828【解析】(1)由已知得,样本中有“25周岁以上组”工人60名,“25周岁以下组”工人40名.所以样本中日平均生产件数不足60件的工人中,“25周岁以上组”工人有600.05=3(人),记为A1,A2,A3;“25周岁以下组”工人有400.05=2(人),记为B1,B2.从中随机抽取2名工人,所有的可能结果共有10种,它们是:(A1,A2),(A1,A3),(A2,A3),(A1,B1),(A1,B2),(A2,B1),(A2,B2),(A3,B1),(A3,B2),(B1,B2).其中,至少抽到1名“25周岁以下组”工人的可能结果共有7种,它们是(A1,B1),(A1,B2),(A2,B1),(A2,B2),(A3,B1),(A3,B2),(B1,B2).故所求的概率为P=.7/10返回目录数学 第三讲变量的相关关系与统计案例能力大提升3(2)由频率分布直方图可知,在抽取的100名工人中,“25周岁以上组”中的生产能手有600.25=15(人),“25周岁以下组”中的生产能手有400.375=15(人),据此可得22列联表如下:生产能手非生产能手合计25周岁以上组15456025周岁以下组152540合计3070100因为1.7862.706,所以没有90%的把握认为“生产能手与工人所在的年龄组有关”