相关系数(课堂PPT).ppt
1.2 相关系数相关系数高二数学高二数学 选修选修1-2西安远东二中西安远东二中 李建章李建章121、两个变量的关系、两个变量的关系不相关不相关相关相关关系关系函数关系函数关系线性相关线性相关非线性相关非线性相关相关关系:相关关系:对于两个变量,当自变量取值一定对于两个变量,当自变量取值一定时,因变量的取值带有一定随机性的两个变量时,因变量的取值带有一定随机性的两个变量之间的关系。之间的关系。复习回复习回顾顾32、最小二乘估计、最小二乘估计下的线性回归方程:下的线性回归方程:2)a,b 的意义是:以的意义是:以 a 为基数,为基数,x 每增加每增加1个单位,个单位,y相相应地平均增加应地平均增加 b 个单位个单位。1)称为样本点的中心称为样本点的中心。4(1)(1)计算平均数计算平均数(2)(2)计算计算 与与 的积的积,求求(3)(3)计算计算(4)(4)将上述有关结果代入公式,求将上述有关结果代入公式,求b b、a a,写出回归直线方程写出回归直线方程 3、求线性回归方程的步骤:、求线性回归方程的步骤:5给定给定n n个样本点(个样本点(x x1 1,y,y1 1),(x x2 2,y,y2 2),(x xn n,y,yn n),如),如果图像上面显示它们具有线性相关关系的话,就可以果图像上面显示它们具有线性相关关系的话,就可以通过下面的公式计算出通过下面的公式计算出a,ba,b的值,代入的值,代入 y=a+bx y=a+bx 即可得即可得线性回归方程。线性回归方程。若若b0则正相关则正相关;若若b0则负相关则负相关复习复习6相关性相关性1、在散点图中,点有一个集中的大致趋势、在散点图中,点有一个集中的大致趋势2、在散点图中,所有的点都在一条直线附近、在散点图中,所有的点都在一条直线附近 波动线性相关。波动线性相关。xxxyyyOOO7 从散点图上可以看出,如果变量之间存在着某种关系,这些点会有从散点图上可以看出,如果变量之间存在着某种关系,这些点会有一个一个集中的大致趋势集中的大致趋势,这种趋势通常可以用,这种趋势通常可以用一条光滑的曲线一条光滑的曲线来近似描述,来近似描述,这种近似的过程称为这种近似的过程称为曲线拟合曲线拟合。在两个变量。在两个变量x x和和y y的散点图中,所有点看的散点图中,所有点看上去都在一条直线附近波动,则称变量间是上去都在一条直线附近波动,则称变量间是线性相关线性相关的。此时,我们可的。此时,我们可以用一条直线来拟合,这条直线叫以用一条直线来拟合,这条直线叫回归直线回归直线。xyO8思考:思考:观察散点图的大致趋势,人的年龄的与人体脂观察散点图的大致趋势,人的年龄的与人体脂肪含量具有什么相关关系?肪含量具有什么相关关系?年龄与脂肪的散点图,从整体上看,它们是线性相关的年龄与脂肪的散点图,从整体上看,它们是线性相关的 9思考思考2 2:在上面的散点图中,这些点散布在从左下角在上面的散点图中,这些点散布在从左下角到右上角的区域,对于两个变量的这种相关关系,我到右上角的区域,对于两个变量的这种相关关系,我们将它称为们将它称为正相关正相关.一般地,如果两个变量成正相关,一般地,如果两个变量成正相关,那么这两个变量的变化趋势如何?那么这两个变量的变化趋势如何?10 但是在样本点非常多的情况下,散点图但是在样本点非常多的情况下,散点图不好做,那么我们如何来刻画他们之间是否不好做,那么我们如何来刻画他们之间是否具有线性相关关系呢?具有线性相关关系呢?如何描述它们之如何描述它们之间线性相关关系间线性相关关系的强弱呢?的强弱呢?11(x xn n,y,yn n),则变量间线性相关系数),则变量间线性相关系数r r的计算公式如下:的计算公式如下:假设两个随机变量的取值分别是(假设两个随机变量的取值分别是(x x1 1,y,y1 1),(),(x x2 2,y,y2 2),),12相关系数相关系数建构数学建构数学13相关系数相关系数r的性质:的性质:(2);(3)越接近于越接近于1,x,y的线性相关的线性相关程度越强;程度越强;(4)越接近于越接近于0,x,y的线性相关的线性相关程度越弱;程度越弱;(1)P7思考交流思考交流14误差误差由于由于,所以,所以,即,即|r|r|越接近越接近 0 0,误差,误差 Q Q 越大,变量间的线性程度越弱越大,变量间的线性程度越弱.|r|r|越接近越接近1 1,误差,误差 Q Q 越小,变量间的线性程度越强;越小,变量间的线性程度越强;若若,则,则,则两变量负相关;,则两变量负相关;若若,则两变量不相关。,则两变量不相关。若若,则,则,即,即,则两变量正相关;,则两变量正相关;15相关系数取值及其意义相关系数取值及其意义-1.01.00-0.50.5完全负相关完全负相关完全负相关完全负相关无线性相关无线性相关无线性相关无线性相关完全正相关完全正相关完全正相关完全正相关负相关程度增加负相关程度增加负相关程度增加负相关程度增加r正相关程度增加正相关程度增加正相关程度增加正相关程度增加164xy0-26241-4-6532x-5-4-30345y03454302.2.计算下表中两变量的线性相关系数计算下表中两变量的线性相关系数r r:经计算后得经计算后得 r=0 r=0。通常,通常,|r|r|越大,线性关系越强,用直越大,线性关系越强,用直线拟合的效果就越好。一般来说线拟合的效果就越好。一般来说 :1.1.试计算课本试计算课本P P7373中变量的线性相关系数中变量的线性相关系数r r。r-1,-0.75r-1,-0.75或或0.75,10.75,1,线性关,线性关系很强;系很强;r-0.75r-0.75,0.750.75,线性关系很弱。,线性关系很弱。171如图所示,图中有5组数据,去掉组数据后(填字母代号),剩下的4组数据的线性相关性最大()ECD A2 2、对于散点图下列说法中正确一个是(、对于散点图下列说法中正确一个是()A.A.通过散点图一定可以看出变量之间的变化规律通过散点图一定可以看出变量之间的变化规律 B.B.通过散点图一定不可以看出变量之间的变化规律通过散点图一定不可以看出变量之间的变化规律 C.C.通过散点图可以看出正相关与负相关有明显区别通过散点图可以看出正相关与负相关有明显区别 D.D.通过散点图看不出正相关与负相关有什么区别通过散点图看不出正相关与负相关有什么区别C18319例例.下表是随机抽取的下表是随机抽取的8 8对母女的身高数据,试对母女的身高数据,试根据这些数据探讨根据这些数据探讨y y与与x x之间的关系之间的关系.母亲身高母亲身高x/cmx/cm 154154 157157 158158 159159 160160 161161 162162 163163女儿身高女儿身高y/cmy/cm 155155 156156 159159 162162 161161 164164 165165 166166解:画出散点图20列表:ixiyixi2yi2xiyi115415523716240252387021571562464924336244923158159249642528125122415916225281262442575851601612560025921257606161164259212689626404716216526244272252673081631662656927556270581274128820294420748420519421计算相关系数:因为r=0.963接近1,所以x与y具有较强的线性相关关系.22建立线性回归模型:y=a+bx23说明:说明:1 1。由于。由于从而从而故相关系数故相关系数的取值范围是的取值范围是24年份年份200020012002200320042005x24.429.532.928.730.328.9y19611018(1)(1)对变量对变量x,yx,y进行相关性检验:进行相关性检验:解析解析:2526例例 请计算表中变量的线性相关系数请计算表中变量的线性相关系数r r,通过计算,发现,通过计算,发现了什么?了什么?x-5-4-30345y0345430I1-5025002-43149-123-34916-124050250534916126431691275025000191007501.1.列表列表计算计算 相关系数相关系数表表 1-3 1-32728