高一数学必修二课件第九章 第四节变量间的相关关系与统计案例.ppt
第四节 变量间的相关关系与统计案例1.1.相关关系与回归方程相关关系与回归方程(1)(1)相关关系的分类相关关系的分类.正相关:从散点图上看,点散布在从正相关:从散点图上看,点散布在从_到到_的区域内;的区域内;负相关:从散点图上看,点散布在从左上角到负相关:从散点图上看,点散布在从左上角到_的区域内的区域内.左下角左下角右上角右上角右下角右下角(2)(2)线性相关关系线性相关关系.从散点图上看,如果这些点从整体上看大致分布在一条直从散点图上看,如果这些点从整体上看大致分布在一条直线附近,则称这两个变量之间具有线性相关关系,这条直线附近,则称这两个变量之间具有线性相关关系,这条直线叫线叫_._.回归直线回归直线(3)(3)回归方程回归方程.最小二乘法:使得样本数据的点到回归直线的最小二乘法:使得样本数据的点到回归直线的_最小的方法叫最小二乘法最小的方法叫最小二乘法.回归方程:两个具有线性相关关系的变量的一组数据:回归方程:两个具有线性相关关系的变量的一组数据:(x(x1 1,y,y1 1),(x),(x2 2,y,y2 2),),(x xn n,y,yn n),其回归方程为,其回归方程为则则其中其中,是回归方程的是回归方程的_,_,是在是在y y轴上的截距轴上的截距.距离平方和距离平方和斜率斜率(4)(4)样本相关系数样本相关系数.用它来衡量两个变量间的线性用它来衡量两个变量间的线性相关关系相关关系.当当r r0 0时,表明两个变量时,表明两个变量_;当当r r0 0时,表明两个变量时,表明两个变量_;正相关正相关负相关负相关rr的绝对值越接近的绝对值越接近1 1,表明两个变量的线性相关性,表明两个变量的线性相关性_;r r的的绝对值越接近于绝对值越接近于0 0,表明两个变量之间几乎不存在线性相关关,表明两个变量之间几乎不存在线性相关关系系.通常当通常当|r|r|0.750.75时,认为两个变量有很强的线性相关关系时,认为两个变量有很强的线性相关关系.越强越强2.2.独立性检验独立性检验(1)22(1)22列联表列联表.假设有两个分类变量假设有两个分类变量X X和和Y Y,它们的取值分别为,它们的取值分别为xx1 1,x x2 2 和和yy1 1,y y2 2,其样本频数列联表,其样本频数列联表(称称2222列联表列联表)为:为:(2)K(2)K2 2统计量统计量.K K2 2=(=(其中其中n=n=a+b+c+da+b+c+d为样本容量为样本容量).).y y1 1y y2 2总计总计x x1 1a ab b_x x2 2c cd dc+dc+d总计总计a+ca+c_a+b+c+da+b+c+da+ba+bb+db+d判断下面结论是否正确判断下面结论是否正确(请在括号中打请在括号中打“”或或“”).”).(1)(1)线性回归分析就是由样本点去寻找一条直线,使之贴近这线性回归分析就是由样本点去寻找一条直线,使之贴近这些样本点的方法些样本点的方法.().()(2)(2)利用样本点的散点图可以直观判断两个变量的关系是否可利用样本点的散点图可以直观判断两个变量的关系是否可以用线性关系去表示以用线性关系去表示.().()(3)(3)通过回归方程通过回归方程 可以估计和观测变量的取值和变化可以估计和观测变量的取值和变化趋势趋势.().()(4)(4)因为由任何一组观测值都可以求得一个线性回归方程,所因为由任何一组观测值都可以求得一个线性回归方程,所以没有必要进行相关性检验以没有必要进行相关性检验.().()(5)(5)任意两个变量之间都存在着线性相关关系任意两个变量之间都存在着线性相关关系.().()(6)(6)如果两个变量之间线性不相关,则这两个变量一定不存在如果两个变量之间线性不相关,则这两个变量一定不存在线性回归方程线性回归方程.().()【解析解析】(1)(1)正确正确.反映的是最小二乘法的思想反映的是最小二乘法的思想.(2)(2)正确正确.反映的是散点图的作用反映的是散点图的作用.(3)(3)正确正确.解释的是回归方程解释的是回归方程 的作用的作用.(4)(4)错误错误.在求回归方程之前必须进行相关性检验,以体现两变在求回归方程之前必须进行相关性检验,以体现两变量的关系量的关系.(5)(5)错误错误.变量之间还存在函数关系和非线性相关关系变量之间还存在函数关系和非线性相关关系.(6)(6)错误错误.任意两个变量都可以利用公式求出线性回归方程任意两个变量都可以利用公式求出线性回归方程.答案答案:(1)(2)(3)(4)(1)(2)(3)(4)(5)(5)(6)(6)1.1.利用随机变量利用随机变量K K2 2来判断来判断“两个分类变量两个分类变量X,YX,Y有关系有关系”时,时,K K2 2的的观测值观测值k k的计算公式为:的计算公式为:则下列说法正确的是则下列说法正确的是()()(A)ad-bcA)ad-bc越小,说明越小,说明X X与与Y Y关系越弱关系越弱(B)ad-bcB)ad-bc越大,说明越大,说明X X与与Y Y关系越强关系越强(C)(ad-bc)(C)(ad-bc)2 2越大,说明越大,说明X X与与Y Y关系越强关系越强(D)(ad-bc)(D)(ad-bc)2 2越接近于越接近于0 0,说明,说明X X与与Y Y关系越强关系越强【解析解析】选选C.C.由由K K2 2的计算公式及其意义容易判断选的计算公式及其意义容易判断选C.C.2.2.某商品销售量某商品销售量y(y(件件)与销售价格与销售价格x(x(元元/件件)负相关,则其回归负相关,则其回归直线方程可能是直线方程可能是()()(A)=-10 x+200 (B)=10 x+200(A)=-10 x+200 (B)=10 x+200(C)=-10 x-200 (D)=10 x-200(C)=-10 x-200 (D)=10 x-200【解析解析】选选A.A.商品销售量商品销售量y(y(件件)与销售价格与销售价格x(x(元元/件件)负相关,负相关,00,0,应选应选A.A.3.3.一位母亲记录了儿子一位母亲记录了儿子3 39 9岁的身高,数据岁的身高,数据(略略),由此建立的,由此建立的身高与年龄的回归模型为身高与年龄的回归模型为y y7.19x7.19x73.9373.93,用这个模型预测,用这个模型预测这个孩子这个孩子1010岁时的身高,则正确的叙述是岁时的身高,则正确的叙述是()()(A)(A)身高一定是身高一定是145.83 cm145.83 cm(B)(B)身高在身高在145.83 cm145.83 cm以上以上(C)(C)身高在身高在145.83 cm145.83 cm左右左右(D)(D)身高在身高在145.83 cm145.83 cm以下以下【解析解析】选选C.C.用回归模型用回归模型y y7.19x7.19x73.9373.93,只能作预测,其,只能作预测,其结果不一定是个确定值结果不一定是个确定值.4.4.给出下列关系:给出下列关系:正方形的边长与面积之间的关系;正方形的边长与面积之间的关系;某化妆品的销售量与广告宣传费之间的关系;某化妆品的销售量与广告宣传费之间的关系;人的身高与视力之间的关系;人的身高与视力之间的关系;雾天的能见度与交通事故的发生率之间的关系;雾天的能见度与交通事故的发生率之间的关系;学生与其学号之间的关系学生与其学号之间的关系.其中具有相关关系的是其中具有相关关系的是_._.【解析解析】正方形的边长与面积之间的关系是函数关系;正方形的边长与面积之间的关系是函数关系;化妆品的销售量与广告宣传费之间的关系不是严格的函数关化妆品的销售量与广告宣传费之间的关系不是严格的函数关系,但是具有相关性,因而是相关关系;系,但是具有相关性,因而是相关关系;人的身高与视力之间的关系既不是函数关系,也不是相关关人的身高与视力之间的关系既不是函数关系,也不是相关关系;系;能见度与交通事故的发生率之间具有相关关系;能见度与交通事故的发生率之间具有相关关系;学生与其学号之间的关系是一种确定的对应关系学生与其学号之间的关系是一种确定的对应关系.综合以上可知,综合以上可知,具有相关关系,而具有相关关系,而是确定性的函数关是确定性的函数关系,系,两种关系都不具有两种关系都不具有.答案答案:5.5.某高校某高校“统计初步统计初步”课程的教师随机调查了选该课程的一些课程的教师随机调查了选该课程的一些学生的情况,具体数据如下表:学生的情况,具体数据如下表:为了判断主修统计专业是否与性别有关系,根据表中的数据,为了判断主修统计专业是否与性别有关系,根据表中的数据,得到得到K K2 2 4.8444.844,因为,因为K K2 23.8413.841,所以,所以判定主修统计专业与性别有关系,那么这种判断出错的可能性判定主修统计专业与性别有关系,那么这种判断出错的可能性不超过不超过_._.专业性别专业性别非统计专业非统计专业统计专业统计专业男男13131010女女7 72020【解析解析】KK2 24.8444.8443.8413.841,在犯错误的概率不超过在犯错误的概率不超过0.050.05的前提下认为主修统计专业与性别有关系,的前提下认为主修统计专业与性别有关系,出错的可能性不出错的可能性不超过超过5%.5%.答案答案:5%5%考向考向 1 1 相关关系的判断相关关系的判断 【典例典例1 1】(1)1)对变量对变量x x,y y有观测数据有观测数据(x(xi i,y yi i)(i)(i1,21,2,10)10),得散点图,得散点图(1)(1);对变量;对变量u u,v v有观测数据有观测数据(u ui i,v,vi i)(i)(i1,21,2,10)10),得散点图,得散点图(2).(2).由这两个散点图可以判断由这两个散点图可以判断()()(A)(A)变量变量x x与与y y正相关,正相关,u u与与v v正相关正相关(B)(B)变量变量x x与与y y正相关,正相关,u u与与v v负相关负相关(C)(C)变量变量x x与与y y负相关,负相关,u u与与v v正相关正相关(D)(D)变量变量x x与与y y负相关,负相关,u u与与v v负相关负相关(2)(2012(2)(2012新课标全国卷新课标全国卷)在一组样本数据在一组样本数据(x(x1 1,y y1 1),(x(x2 2,y y2 2),(x xn n,y yn n)(n2)(n2,x x1 1,x,x2 2,x xn n不全相等不全相等)的散点图的散点图中,若所有样本点中,若所有样本点(x(xi i,y yi i)(i)(i=1,2,n)=1,2,n)都在直线都在直线 上,则这组样本数据的样本相关系数为上,则这组样本数据的样本相关系数为()()(A)-1 (B)0 (C)(D)1(A)-1 (B)0 (C)(D)1【思路点拨思路点拨】(1)(1)根据散点图的变化趋势判断根据散点图的变化趋势判断.(2)(2)理清相关系数与相关性强弱的关系是解决本题的关键理清相关系数与相关性强弱的关系是解决本题的关键.【规范解答规范解答】(1)(1)选选C.C.由题图由题图(1)(1)可知,各点整体呈递减趋势,可知,各点整体呈递减趋势,x x与与y y负相关;由题图负相关;由题图(2)(2)可知,各点整体呈递增趋势,可知,各点整体呈递增趋势,u u与与v v正正相关相关.(2)(2)选选D.D.样本相关系数越接近样本相关系数越接近1,1,相关性越强,现在所有的样本相关性越强,现在所有的样本点都在直线点都在直线 上,样本的相关系数应为上,样本的相关系数应为1.1.【拓展提升拓展提升】线性相关关系与函数关系的区别线性相关关系与函数关系的区别(1)(1)函数关系中的两个变量间是一种确定性关系函数关系中的两个变量间是一种确定性关系.例如,正方形例如,正方形面积面积S S与边长与边长x x之间的关系之间的关系S Sx x2 2就是函数关系就是函数关系.(2)(2)相关关系是一种非确定性关系,即相关关系是非随机变量相关关系是一种非确定性关系,即相关关系是非随机变量与随机变量之间的关系与随机变量之间的关系.例如,商品的销售额与广告费是相关例如,商品的销售额与广告费是相关关系关系.两个变量具有相关关系是回归分析的前提两个变量具有相关关系是回归分析的前提.【变式训练变式训练】某公司的科研人员在某公司的科研人员在7 7块并排、形状大小相同的块并排、形状大小相同的试验田上对某棉花新品种进行施化肥量试验田上对某棉花新品种进行施化肥量x x对产量对产量y y影响的试验,影响的试验,得到如下表所示的一组数据得到如下表所示的一组数据(单位:单位:kg)kg):(1)(1)画出散点图画出散点图.(2)(2)判断是否具有相关关系判断是否具有相关关系.施化肥量施化肥量x x1515202025253030353540404545棉花产量棉花产量y y330330345345365365405405445445450450455455【解析解析】(1)(1)散点图如图所示散点图如图所示(2)(2)由散点图知,各组数据对应点大致都在一条直线附近,所由散点图知,各组数据对应点大致都在一条直线附近,所以施化肥量以施化肥量x x与产量与产量y y具有线性相关关系具有线性相关关系.考向考向 2 2 线性回归方程及其应用线性回归方程及其应用 【典例典例2 2】(2012(2012福建高考福建高考)某工厂为了对新研发的一种产品某工厂为了对新研发的一种产品进行合理定价,将该产品按事先拟定的价格进行试销,得到如进行合理定价,将该产品按事先拟定的价格进行试销,得到如下数据:下数据:单价单价x(x(元元)8 88.28.28.48.48.68.68.88.89 9销量销量y(y(件件)909084848383808075756868(1)(1)求回归直线方程求回归直线方程 其中其中(2)(2)预计在今后的销售中,销量与单价仍然服从预计在今后的销售中,销量与单价仍然服从(1)(1)中的关系,中的关系,且该产品的成本是且该产品的成本是4 4元元/件,为使工厂获得最大利润,该产品的件,为使工厂获得最大利润,该产品的单价应定为多少元?单价应定为多少元?(利润利润=销售收入销售收入-成本成本)【思路点拨思路点拨】(1)(1)先求出先求出 再利用再利用 求出求出 的值的值.(2)(2)利用利用“利润利润=销售收入成本销售收入成本”列出函数关系式后再求解列出函数关系式后再求解.【规范解答规范解答】(1)(1)由于由于所以所以从而回归直线方程为从而回归直线方程为 =-20 x+250.=-20 x+250.(2)(2)设工厂获得的利润为设工厂获得的利润为L L元,依题意得元,依题意得L=x(-20 x+250)-4(-20 x+250)=-20 xL=x(-20 x+250)-4(-20 x+250)=-20 x2 2+330 x-1 000=+330 x-1 000=-20(x-)-20(x-)2 2+361.25,+361.25,当且仅当当且仅当x=8.25x=8.25时,时,L L取得最大值,取得最大值,故当单价定为故当单价定为8.258.25元时,工厂可获得最大利润元时,工厂可获得最大利润.【互动探究互动探究】在本例中条件不变,预测当单价为在本例中条件不变,预测当单价为1010元时,销量元时,销量是多少件?是多少件?【解析解析】将将x=10 x=10代入代入 =-20 x+250=-20 x+250得,得,=50=50,即销量大约是,即销量大约是5050件件.【拓展提升拓展提升】最小二乘法估计的三个步骤最小二乘法估计的三个步骤(1)(1)作出散点图,判断是否线性相关作出散点图,判断是否线性相关.(2)(2)如果是,则用公式求如果是,则用公式求 ,写出回归方程,写出回归方程.(3)(3)根据方程进行估计根据方程进行估计.【提醒提醒】回归直线方程恒过点回归直线方程恒过点【变式备选变式备选】某商场对每天进店人数和商品销售件数进行了统某商场对每天进店人数和商品销售件数进行了统计对比,得到如下表格:计对比,得到如下表格:其中其中i i1,2,3,4,5,6,7.1,2,3,4,5,6,7.人数人数x xi i1010151520202525303035354040件数件数y yi i4 47 712121515202023232727(1)(1)以每天进店人数为横轴,每天商品销售件数为纵轴,画出以每天进店人数为横轴,每天商品销售件数为纵轴,画出散点图散点图.(2)(2)求回归直线方程求回归直线方程(结果保留到小数点后两位结果保留到小数点后两位).).(参考数据:参考数据:)(3)(3)预测进店人数为预测进店人数为8080人时,商品销售的件数人时,商品销售的件数(结果保留整数结果保留整数).).【解析解析】(1)(1)散点图如图散点图如图.(2)(2)易知所有点在一条直线附近,易知所有点在一条直线附近,回归直线方程是回归直线方程是(3)(3)进店人数为进店人数为8080人时,商品销售的件数人时,商品销售的件数 0.780.7880804.0759(4.0759(件件).).考向考向 3 3 独立性检验独立性检验 【典例典例3 3】为了比较注射为了比较注射A A,B B两种药物后产生的皮肤疱疹的面两种药物后产生的皮肤疱疹的面积,选积,选200200只家兔做试验,将这只家兔做试验,将这200200只家兔随机地分成两组,每只家兔随机地分成两组,每组组100100只,其中一组注射药物只,其中一组注射药物A A,另一组注射药物,另一组注射药物B.B.完成下面完成下面2222列联表,并回答能否在犯错误的概率不超过列联表,并回答能否在犯错误的概率不超过0.010.01的前提下的前提下认为认为“注射药物注射药物A A后的疱疹面积与注射药物后的疱疹面积与注射药物B B后的疱疹面积有差后的疱疹面积有差异异”.疱疹面积疱疹面积小于小于70 mm70 mm2 2疱疹面积不疱疹面积不小于小于70 mm70 mm2 2总总 计计注射药物注射药物A Aa=a=b=30b=30a+ba+b=注射药物注射药物B Bc=35c=35d=d=c+dc+d=总总 计计a+ca+c=b+db+d=a+b+c+da+b+c+d=【思路点拨思路点拨】(1)(1)把握把握2 22 2列联表的意义,准确填入数据列联表的意义,准确填入数据.(2)(2)将数据代入将数据代入K K2 2的公式进行计算的公式进行计算.(3)(3)与临界值比较并得出结论与临界值比较并得出结论.【规范解答规范解答】2 22 2列联表如下:列联表如下:疱疹面积疱疹面积小于小于70 mm70 mm2 2疱疹面积不疱疹面积不小于小于70 mm70 mm2 2总总 计计注射药物注射药物A Aa=70a=70b=30b=30a+ba+b=100=100注射药物注射药物B Bc=35c=35d=65d=65c+dc+d=100=100总总 计计a+ca+c=105=105b+db+d=95=95a+b+c+da+b+c+d=200200K K2 2的观测值的观测值由于由于k k6.635,6.635,因此能在犯错误的概率不超过因此能在犯错误的概率不超过0.010.01的前提下认的前提下认为为“注射药物注射药物A A后的疱疹面积与注射药物后的疱疹面积与注射药物B B后的疱疹面积有差异后的疱疹面积有差异”.【拓展提升拓展提升】解独立性检验的应用问题的关注点解独立性检验的应用问题的关注点(1)(1)两个明确两个明确明确两类主体,如明确两类主体,如“吸烟者吸烟者”“”“不吸烟者不吸烟者”.明确研究的两个问题明确研究的两个问题.如如“患肺癌患肺癌”“”“未患肺癌未患肺癌”.(2)(2)解决问题的关键解决问题的关键准确画出准确画出2 22 2列联表列联表;准确理解准确理解K K2 2.(3)(3)统计的基本思维模式是归纳,它的特征之一是由部分数据统计的基本思维模式是归纳,它的特征之一是由部分数据的性质推断全部数据的性质的性质推断全部数据的性质.因此,由此推断所得结论可能是因此,由此推断所得结论可能是错误的,即从数据上体现的是统计关系,而不是因果关系错误的,即从数据上体现的是统计关系,而不是因果关系.【变式训练变式训练】冶炼某种金属可以用旧设备和改造后的新设备,冶炼某种金属可以用旧设备和改造后的新设备,为了检验用这两种设备生产的产品中所含杂质的关系,调查结为了检验用这两种设备生产的产品中所含杂质的关系,调查结果如下表所示:果如下表所示:杂质高杂质高杂质低杂质低旧设备旧设备3737121121新设备新设备2222202202根据以上数据,则根据以上数据,则()()(A)(A)含杂质的高低与设备改造有关含杂质的高低与设备改造有关(B)(B)含杂质的高低与设备改造无关含杂质的高低与设备改造无关(C)(C)设备是否改造不能决定含杂质的高低设备是否改造不能决定含杂质的高低(D)(D)以上答案都不对以上答案都不对由公式由公式K K2 2的观测值的观测值由于由于13.1113.1110.82810.828,故有,故有99.9%99.9%的把握认为含杂质的高低与设的把握认为含杂质的高低与设备是否改造有关备是否改造有关.杂质高杂质高杂质低杂质低总计总计旧设备旧设备3737121121158158新设备新设备2222202202224224总计总计5959323323382382【解析解析】选选A.A.由已知数据得到如下由已知数据得到如下2 22 2列联表:列联表:【满分指导满分指导】解答独立性检验与概率相结合的综合题解答独立性检验与概率相结合的综合题 【典例典例】(12(12分分)(2012)(2012辽宁高考辽宁高考)电视传媒公司为了了解某地电视传媒公司为了了解某地区电视观众对某类体育节目的收视情况,随机抽取了区电视观众对某类体育节目的收视情况,随机抽取了100100名观名观众进行调查,其中女性有众进行调查,其中女性有5555名名.下面是根据调查结果绘制的观下面是根据调查结果绘制的观众日均收看该体育节目时间的频率分布直方图:众日均收看该体育节目时间的频率分布直方图:将日均收看该体育节目时间不低于将日均收看该体育节目时间不低于4040分钟的观众称为分钟的观众称为“体育迷体育迷”,已知,已知“体育迷体育迷”中有中有1010名女性名女性.(1)(1)根据已知条件完成下面的根据已知条件完成下面的2222列联表,并据此资料你是否列联表,并据此资料你是否认为认为“体育迷体育迷”与性别有关?与性别有关?非体育迷非体育迷体育迷体育迷总计总计男男女女总计总计(2)(2)将日均收看该体育节目不低于将日均收看该体育节目不低于5050分钟的观众称为分钟的观众称为“超级体超级体育迷育迷”,已知,已知“超级体育迷超级体育迷”中有中有2 2名女性,若从名女性,若从“超级体育超级体育迷迷”中任意选取中任意选取2 2人,求至少有人,求至少有1 1名女性观众的概率名女性观众的概率.附:附:【思路点拨思路点拨】已已 知知 条条 件件条条 件件 分分 析析频率分布直方图频率分布直方图计算各时间段内的人数计算各时间段内的人数收看该体育节目时间不低收看该体育节目时间不低于于4040分钟的观众称为分钟的观众称为“体体育迷育迷”确定确定“体育迷体育迷”的人数的人数收看该体育节目不低于收看该体育节目不低于5050分钟的观众称为分钟的观众称为“超级体超级体育迷育迷”确定确定“超级体育迷超级体育迷”的人的人数数【规范解答规范解答】(1)(1)由所给的频率分布直方图知,由所给的频率分布直方图知,“体育迷体育迷”人数为人数为100100(10(100.020+100.020+100.005)=250.005)=25“非体育迷非体育迷”人数为人数为7575,则据题意完成,则据题意完成2 22 2列联表:列联表:3 3分分非体育迷非体育迷体育迷体育迷总计总计男男303015154545女女454510105555总计总计75752525100100将将2 22 2列联表的数据代入公式计算:列联表的数据代入公式计算:K K2 2的观测值的观测值因为因为3.0303.0302.7062.706,所以在犯错误的概率不超过所以在犯错误的概率不超过0.100.10的前提下认为的前提下认为“体育迷体育迷”与性别有关与性别有关6 6分分(2)(2)由所给的频率分布直方图知由所给的频率分布直方图知“超级体育迷超级体育迷”人数为人数为100100(10(100.005)=50.005)=5,7 7分分记记a ai i(i(i=1,2,3)=1,2,3)表示男性,表示男性,b bj j(j(j=1,2)=1,2)表示女性,表示女性,所有可能结果构成的集合为所有可能结果构成的集合为=(a=(a1 1a a2 2),(a),(a1 1a a3 3),(a),(a2 2a a3 3),(a),(a1 1b b1 1),(a),(a2 2b b1 1),(a),(a3 3b b1 1),(a),(a1 1b b2 2),),(a(a2 2b b2 2),(a),(a3 3b b2 2),(b),(b1 1b b2 2),共由,共由1010个基本事件组成,且每个个基本事件组成,且每个基本事件的出现是等可的;基本事件的出现是等可的;1010分分用用A A表示事件表示事件“任选任选2 2人,至少人,至少1 1名女性名女性”,则则A=(aA=(a1 1b b1 1),(a),(a2 2b b1 1),(a),(a3 3b b1 1),(a),(a1 1b b2 2),(a),(a2 2b b2 2),),(a(a3 3b b2 2),(b),(b1 1b b2 2),),共由共由7 7个基本事件组成,故个基本事件组成,故“任选任选2 2人,至少人,至少1 1名女性名女性”的概率的概率为为P(A)=P(A)=1212分分【失分警示失分警示】(下文下文见规范解答过程见规范解答过程)1.(20121.(2012湖南高考湖南高考)设某大学的女生体重设某大学的女生体重y(y(单位:单位:kg)kg)与身高与身高x(x(单位:单位:cm)cm)具有线性相关关系,根据一组样本数据具有线性相关关系,根据一组样本数据(x(xi i,y yi i)(i)(i=1=1,2 2,n)n),用最小二乘法建立的回归方程为,用最小二乘法建立的回归方程为=0.85x-85.71=0.85x-85.71,则下列结论中不正确的是,则下列结论中不正确的是()()(A)yA)y与与x x具有正的线性相关关系具有正的线性相关关系(B)(B)回归直线过样本点的中心回归直线过样本点的中心(C)(C)若该大学某女生身高增加若该大学某女生身高增加1 cm1 cm,则其体重约增加,则其体重约增加0.85 kg0.85 kg(D)(D)若该大学某女生身高为若该大学某女生身高为170 cm170 cm,则可断定其体重必为,则可断定其体重必为58.79 kg58.79 kg【解析解析】选选D.D.选项选项具体分析具体分析结论结论A Ax x的系数大于零,正相关的系数大于零,正相关正确正确B B回归直线一定过样本点中心回归直线一定过样本点中心由回归直线方程的计算公式由回归直线方程的计算公式可知直线必过点可知直线必过点正确正确C C由一次函数的单调性知,由一次函数的单调性知,x x每增加每增加1 cm1 cm,体重均增加,体重均增加0.85 kg0.85 kg,是估计值,是估计值正确正确D D体重应约为体重应约为58.79 kg58.79 kg,是估计值,是估计值不正确不正确 2.(20132.(2013三亚模拟三亚模拟)已知已知x x,y y之间的数据如表所示,则回归之间的数据如表所示,则回归直线过点直线过点()()(A)(0,0)(B)(2,1.8)(A)(0,0)(B)(2,1.8)(C)(3,2.5)(D)(4,3.2)(C)(3,2.5)(D)(4,3.2)【解析解析】选选C.C.回归直线恒过定点回归直线恒过定点 且且 3 3,2.5.2.5.故选故选C.C.x x1 12 23 34 45 5y y1.21.21.81.82.52.53.23.23.83.83.(20133.(2013常德模拟常德模拟)某产品的广告费用某产品的广告费用x x与销售额与销售额y y的统计数的统计数据如下表:据如下表:根据上表可得回归方程根据上表可得回归方程 中的中的 为为9.49.4,据此模型预报,据此模型预报广告费用为广告费用为6 6万元时销售额约为万元时销售额约为()()(A)63.6(A)63.6万元万元 (B)65.5(B)65.5万元万元 (C)67.7(C)67.7万元万元 (D)72.0(D)72.0万元万元广告费用广告费用x(x(万元万元)4 42 23 35 5销售额销售额y(y(万元万元)4949262639395454【解析解析】选选B.B.由表可计算由表可计算因为点因为点(42)(42)在回归直线在回归直线 上,且上,且 为为9.49.4,所以,所以42=9.442=9.4 +,+,解得解得 =9.1=9.1,故回归方程为,故回归方程为 =9.4x+9.1=9.4x+9.1,令令x=6x=6得得 =65.5=65.5,选,选B.B.4.(20134.(2013汕头模拟汕头模拟)以下四个命题,其中正确的是以下四个命题,其中正确的是()()从匀速传递的产品生产流水线上,质检员每从匀速传递的产品生产流水线上,质检员每2020分钟从中抽取分钟从中抽取一件产品进行某项指标检测,这样的抽样是分层抽样一件产品进行某项指标检测,这样的抽样是分层抽样两个随机变量相关性越强,则相关系数的绝对值越接近于两个随机变量相关性越强,则相关系数的绝对值越接近于1 1在回归直线方程在回归直线方程 0.2x0.2x1212中,当解释变量中,当解释变量x x每增加一个每增加一个单位时,预报变量单位时,预报变量y y平均增加平均增加0.20.2个单位个单位对分类变量对分类变量X X与与Y Y,它们的随机变量,它们的随机变量K K2 2的观测值的观测值k k来说,来说,k k越小,越小,“X X与与Y Y有关系有关系”的把握程度越大的把握程度越大(A)(B)(A)(B)(C)(D)(C)(D)【解析解析】选选D.D.是系统抽样;是系统抽样;正确;对于正确;对于,随机变量,随机变量K K2 2的观测值的观测值k k越小,说明两个变量有关系的把握程度越小越小,说明两个变量有关系的把握程度越小.(2013(2013韶关模拟韶关模拟)为了解某班学生喜爱打篮球是否与性别有关,为了解某班学生喜爱打篮球是否与性别有关,对该班对该班5050名学生进行了问卷调查,得到了如下的名学生进行了问卷调查,得到了如下的2222列联表:列联表:喜爱打篮球喜爱打篮球不喜爱打篮球不喜爱打篮球总计总计男生男生20205 52525女生女生101015152525总计总计303020205050则在犯错误的概率不超过则在犯错误的概率不超过_的前提下认为喜爱打篮球与的前提下认为喜爱打篮球与性别有关性别有关(请用百分数表示请用百分数表示).).附:附:P(KP(K2 2k k0 0)0.100.100.050.050.0250.0250.0100.0100.0050.0050.0010.001k k0 02.7062.7063.8413.8415.0245.0246.6356.6357.8797.87910.82810.828【解析解析】所以在犯错误的概率不超过所以在犯错误的概率不超过0.0050.005的前提下认为喜爱打篮球与的前提下认为喜爱打篮球与性别有关性别有关.答案答案:0.5%0.5%1.1.观察下列散点图,则观察下列散点图,则正相关;正相关;负相关;负相关;不相关,它们不相关,它们的排列顺序与图形相对应的是的排列顺序与图形相对应的是()()(A)aA)a-,b b,c c (B)aB)a,b b,c c(C)aC)a,b b,c c (D)aD)a,b b,c c【解析解析】选选D.D.变量的相关性的图形表示法,在相关变量中,图变量的相关性的图形表示法,在相关变量中,图a a从左下角到右上角,是正相关;图从左下角到右上角,是正相关;图c c从左上角到右下角,是负从左上角到右下角,是负相关;图相关;图b b的点分布不规则,是不相关,故选的点分布不规则,是不相关,故选D.D.2.2.某医疗研究所为了检验某种血清预防感冒的作用,把某医疗研究所为了检验某种血清预防感冒的作用,把500500名名使用血清的人与另外使用血清的人与另外500500名未用血清的人一年中的感冒记录作名未用血清的人一年中的感冒记录作比较,提出假设比较,提出假设H H0 0:“这种血清不能起到预防感冒的作用这种血清不能起到预防感冒的作用”,利用利用2222列联表计算得列联表计算得K K2 2的观测值的观测值k3.918k3.918,经查对临界值表,经查对临界值表知知P(KP(K2 23.841)0.05.3.841)0.05.对此,四名同学得出了以下的判断:对此,四名同学得出了以下的判断:p p:在犯错误的概率不超过:在犯错误的概率不超过0.050.05的前提下认为的前提下认为“这种血清能起这种血清能起到预防感冒的作用到预防感冒的作用”,q q:若某人未使用该血清,那么他在一年中有:若某人未使用该血清,那么他在一年中有95%95%的可能性得感的可能性得感冒,冒,r r:这种血清预防感冒的有效率为:这种血清预防感冒的有效率为95%95%,s s:这种血清预防感冒的有效率为:这种血清预防感冒的有效率为5%5%,则下列结论中,真命题的序号是则下列结论中,真命题的序号是_(_(把你认为正把你认为正确的命题序号都填上确的命题序号都填上).).ppq q;pqpq;(ppq)(rsq)(rs);(ppr)(r)(qsqs).).【解析解析】k3.9183.841,k3.9183.841,在犯错误的概率不超过在犯错误的概率不超过0.050.05的前的前提下认为提下认为“这种血清能起到预防感冒的作用这种血清能起到预防感冒的作用”,即命题,即命题p p正确正确.命题命题q q,r r,s s均不正确,对均不正确,对依次进行判断,可知依次进行判断,可知正确正确.答案答案: