相关系数ppt课件.ppt
相关系数1、两个变量的关系、两个变量的关系不相关不相关相关相关关系关系函数关系函数关系线性相关线性相关非线性相关非线性相关相关关系:相关关系:对于两个变量,当自变量取值一定对于两个变量,当自变量取值一定时,因变量的取值带有一定随机性的两个变量时,因变量的取值带有一定随机性的两个变量之间的关系。之间的关系。复习回复习回顾顾相关关系相关关系 给出两个变量,当一个变量一定时,另给出两个变量,当一个变量一定时,另一个变量的取值具有一定的随机性一个变量的取值具有一定的随机性1、注意与函数关系的区别、注意与函数关系的区别2、回归分析、回归分析散点图散点图 将样本中的所有数据点(将样本中的所有数据点(xi , yi ),描在,描在平面直角坐标系中,以表示具有相关关系平面直角坐标系中,以表示具有相关关系的两个变量的一组数据的图形的两个变量的一组数据的图形2、最小二乘估计、最小二乘估计下的线性回归方程:下的线性回归方程:2 2n n1 12 2n n1 1_ _ _2 2n n1 1_ _ _) )n(n() )xxxxxxyxxbiiiiiiiniiiyny()y)(12)a,b 的意义是:以的意义是:以 a 为基数,为基数,x 每增加每增加1个单位,个单位,y相相应地平均增加应地平均增加 b 个单位个单位。1) 称为样本点的中心称为样本点的中心。( (x x, ,y y) )xbyaaxby(1)(1)计算平均数计算平均数(2)(2)计算计算 与与 的积的积, ,求求(3)(3)计算计算(4)(4)将上述有关结果代入公式,求将上述有关结果代入公式,求b b、a a,写出回归直线方程写出回归直线方程 ,xyixiy1niiix y2211,nniiiixy3、求线性回归方程的步骤:、求线性回归方程的步骤:4、回归分析的基本步骤回归分析的基本步骤:A.画散点画散点图图B.求回归方求回归方程程C.用回归直线方程解决应用问题用回归直线方程解决应用问题求线性回归方程的步骤:求线性回归方程的步骤:(1)(1)计算平均数计算平均数(2)(2)计算计算 与与 的积的积, ,求求(3)(3)计算计算(4)(4)将上述有关结果代入公式,求将上述有关结果代入公式,求b b、a a,写,写出回归直线方程出回归直线方程 ,xyixiy1niiix yniix12相关性相关性1、在散点图中,点有一个集中的大致趋势、在散点图中,点有一个集中的大致趋势2、在散点图中,所有的点都在一条直线附近、在散点图中,所有的点都在一条直线附近 波动线性相关。波动线性相关。 xxxyyyOOO问题:有时散点图的各点并不集中在一条直线的附近,仍然可以按照求回归直线方程的步骤求回归直线,显然这样的回归直线没有实际意义。在怎样的情况下求得的回归直线方程才有实际意义?即建立的线性回归模型是否合理?如何对一组数据之间的线性相关程度作出定量分析?需要对需要对x,y的线性相关的线性相关性进行检验性进行检验 从散点图上可以看出,如果变量之间存在着某种关系,这些点会有从散点图上可以看出,如果变量之间存在着某种关系,这些点会有一个一个集中的大致趋势集中的大致趋势,这种趋势通常可以用,这种趋势通常可以用一条光滑的曲线一条光滑的曲线来近似描述,来近似描述,这种近似的过程称为这种近似的过程称为曲线拟合曲线拟合。在两个变量。在两个变量x x和和y y的散点图中,所有点看的散点图中,所有点看上去都在一条直线附近波动,则称变量间是上去都在一条直线附近波动,则称变量间是线性相关线性相关的。此时,我们可的。此时,我们可以用一条直线来拟合,这条直线叫以用一条直线来拟合,这条直线叫回归直线回归直线。 xyO思考:思考:观察散点图的大致趋势,人的年龄的与人体脂观察散点图的大致趋势,人的年龄的与人体脂肪含量具有什么相关关系?肪含量具有什么相关关系?年龄与脂肪的散点图,从整体上看,它们是线性相关的年龄与脂肪的散点图,从整体上看,它们是线性相关的 思考思考2 2:在上面的散点图中,这些点散布在从左下角在上面的散点图中,这些点散布在从左下角到右上角的区域,对于两个变量的这种相关关系,我到右上角的区域,对于两个变量的这种相关关系,我们将它称为们将它称为正相关正相关. .一般地,如果两个变量成正相关,一般地,如果两个变量成正相关,那么这两个变量的变化趋势如何?那么这两个变量的变化趋势如何? 思考思考3 3:如果两个变量成负相关,从整体上看这两个变如果两个变量成负相关,从整体上看这两个变量的变化趋势如何?其散点图有什么特点?量的变化趋势如何?其散点图有什么特点? 一个变量随另一个变量的变大而变小,散点图中的点一个变量随另一个变量的变大而变小,散点图中的点散布在从左上角到右下角的区域散布在从左上角到右下角的区域. .这就像函数中的增这就像函数中的增函数和减函数。即一个变量从小到大,另一个变量也函数和减函数。即一个变量从小到大,另一个变量也从小到大,或从大到小。从小到大,或从大到小。 思考思考4 4:你能列举一些生活中的变量成正相关或负相你能列举一些生活中的变量成正相关或负相关的实例吗关的实例吗? ? 年龄与身高是正相关,网速与下载文件所需时间是负年龄与身高是正相关,网速与下载文件所需时间是负相关。相关。 例例2. 52. 5个学生的数学和物理成绩如下表:个学生的数学和物理成绩如下表: 学生学生学科学科 ABCDE数学数学8075706560物理物理7066686462 画出散点图,并判断它们是否有相关关系画出散点图,并判断它们是否有相关关系. .数学数学物理物理具有相关关系具有相关关系. .例例3. 3. 下表给出了某校下表给出了某校1212名高一学生的身高名高一学生的身高( (单位:单位:cm)cm)和体重和体重( (单位:单位:kg)kg): 画出散点图,并观察它们是否有相关关系画出散点图,并观察它们是否有相关关系.身身高高体体重重具有相关关系具有相关关系.思考:如何分析变量之间是否具有相关的关系?思考:如何分析变量之间是否具有相关的关系? 分析变量之间是否具有相关的关系,我们可以借助分析变量之间是否具有相关的关系,我们可以借助日常生活和工作日常生活和工作经验经验对一些常规问题来进行对一些常规问题来进行定性分析定性分析,如儿童的身高随着年龄的增长而增长,但它们之间又如儿童的身高随着年龄的增长而增长,但它们之间又不存在一种确定的函数关系,因此它们之间是一种非不存在一种确定的函数关系,因此它们之间是一种非确定性的随机关系,即相关关系。确定性的随机关系,即相关关系。 散点图也只是形象地描述点的分布情况,它的散点图也只是形象地描述点的分布情况,它的“线性线性”是是否明显只能通过观察,否明显只能通过观察,但仅凭这种定性分析不够;但仅凭这种定性分析不够;要想把握其要想把握其特征,必须进行特征,必须进行定量定量的研究的研究相关系数相关系数n ni ii ii i= =1 1n nn n2 22 2i ii ii i= =1 1i i= =1 1( (x x - - x x) )( (y y - - y y) )r r = =( (x x - - x x) )( (y y - - y y) )2 2_ _n n1 1i i2 2i i2 2n n1 1i i2 2i in n1 1i i_ _ _i ii i) )y yn n( (y y) )x xn n( (x xy yx xn ny yx x建构数学建构数学.75. 0,.,0;, 1.,0;,0强的线性相关关系时认为两个变量有很大于当通常关系不存在线性相关表明两个变量之间几乎时越接近于的线性相关性越强表明两个变量的绝对值越接近表明两个变量负相关时当表明两个变量正相关时当rrrrr相关系数相关系数r的性质:的性质:(2) ;1r (3) 越接近于越接近于1,x,y的线性相关的线性相关程度越强;程度越强;r(4) 越接近于越接近于0,x,y的线性相关的线性相关程度越弱;程度越弱;r.,0;,0表明两个变量负相关时当表明两个变量正相关时当rr(1)P7思考交流思考交流1如图所示,图中有5组数据,去掉组数据后(填字母代号),剩下的4组数据的线性相关性最大() ECD A2 2、对于散点图下列说法中正确一个是(、对于散点图下列说法中正确一个是( ) A.A.通过散点图一定可以看出变量之间的变化规律通过散点图一定可以看出变量之间的变化规律 B.B.通过散点图通过散点图一定不可以看出变量之间的变化规律一定不可以看出变量之间的变化规律 C.C.通过散点图可以看出正相关与负相关有明显区别通过散点图可以看出正相关与负相关有明显区别 D.D.通过散点图看不出正相关与负相关有什么区别通过散点图看不出正相关与负相关有什么区别C32 2_ _n n1 1i i2 2i i2 2n n1 1i i2 2i in n1 1i i_ _ _i ii i) )y yn(n(y y) )x xn(n(x xy yx xn ny yx xr2 2n n1 12 2n n1 1_ _ _2 2n n1 1_ _ _) )n(n() )xxxxxxyxxbiiiiiiiniiiyny()y)(1例例. . 下表是随机抽取的下表是随机抽取的8 8对母女的身高数据,试对母女的身高数据,试根据这些数据探讨根据这些数据探讨y y与与x x之间的关系之间的关系. .母亲身高母亲身高x/cmx/cm 154154 157157 158158 159159 160160 161161 162162 163163女儿身高女儿身高y/cmy/cm 155155 156156 159159 162162 161161 164164 165165 166166解:画出散点图列表:ixiyixi2yi2xiyi1154155237162402523870215715624649243362449231581592496425281251224159162252812624425758516016125600259212576061611642592126896264047162165262442722526730816316626569275562705812741288202944 20748420519416125.159nyynxxii其中:963. 01165 .5980161820748425.159820294416125.1598205194222 2_ _n n1 1i i2 2i i2 2_ _n n1 1i i2 2i in n1 1i i_ _ _i ii iy yn ny yx xn nx xy yx xn ny yx xr计算相关系数:因为r=0.963接近1,所以x与y具有较强的线性相关关系.建立线性回归模型:y=a+bx191.53345. 1xbyab2 2_ _n n1 1i i2 2i in n1 1i i_ _ _i ii i2 2_ _n n1 1i i2 2i in n1 1i i_ _ _i ii ix x8 8x xy yx x8 8y yx xx xn nx xy yx xn ny yx xxyxy345. 1191.53的线性回归方程为对故小结1、相关关系的判断、相关关系的判断2、画散点图、画散点图3、线性关系系数、线性关系系数例例1.下表给出我国从下表给出我国从1949至至1999年人口数据资料,年人口数据资料,试根据表中数据估计我国试根据表中数据估计我国2004年的人口数年的人口数.检验:检验:(1)作统计假设)作统计假设H0:x与与y不具有线性相关关系不具有线性相关关系;(2)由)由0.05与与n-2=9,在附录在附录1中查的中查的r0.05=0.602;(3)根据公式求的线性相关系数)根据公式求的线性相关系数r=0.998;(4)因为)因为|r|=0.9980.602,|r|=0.9980.602,即即|r|r|r|r0.050.05,所以,所以有有95%的把握认为的把握认为x与与y之间具有线性相关关系,线之间具有线性相关关系,线性相关回归方程性相关回归方程y=527.591+14.453x是有意义的是有意义的.年份年份4954596469747984899499人口数人口数/百万百万5426036727058079099751035110711771246