第九讲相关与回归精选PPT.ppt
《第九讲相关与回归精选PPT.ppt》由会员分享,可在线阅读,更多相关《第九讲相关与回归精选PPT.ppt(37页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、第九讲相关与回归相关与回归1第1页,本讲稿共37页 医学上,许多现象之间也都有相互联系,例如:身高与体重、体温与脉搏、产前检查与婴儿体重、乙肝病毒与乙肝等。在这些有关系的现象中,它们之间联系的程度和性质也各不相同。这里,体温和脉搏的关系就比产前检查与婴儿体重之间的关系密切得多,而体重和身高的关系则介与二者之间。另外,可以说乙肝病毒感染是前因,得了乙肝是后果,乙肝病毒和乙肝之间是因果关系;但是,有的现象之间因果不清,只是伴随关系,例如丈夫的身高和妻子的身高之间,就不能说有因果关系。相关与回归就是用于研究和解释两个变量之间相互关系的。相关与回归2第2页,本讲稿共37页直线相关直线相关Linear
2、Correlation相关与回归3第3页,本讲稿共37页散点图n为了确定相关变量之间的关系,首先应该收集一些数据,这些数据应该是成对的。例如,每人的身高和体重。然后在直角坐标系上描述这些点,这一组点集称为散点图。相关与回归4第4页,本讲稿共37页n为了研究父亲与成年儿子身高之间的关系,卡尔.皮尔逊测量了1078对父子的身高。把1078对数字表示在坐标上,如图。用水平轴X上的数代表父亲身高,垂直轴Y上的数代表儿子的身高,1078个点所形成的图形是一个散点图。它的形状象一块橄榄状的云,中间的点密集,边沿的点稀少,其主要部分是一个椭圆。相关与回归5第5页,本讲稿共37页相关的类型相关的类型正相关 负
3、相关 完全正相关 完全负相关 称零相关 相关与回归6第6页,本讲稿共37页相关系数 n样本的相关系数用r(correlation coefficient)n相关系数r的值在-1和1之间,但可以是此范围内的任何值。正相关时,r值在0和1之间,散点云图是斜向上的,这时一个变量增加,另一个变量也增加;负相关时,r值在-1和0之间,散点云图是斜向下的,此时一个变量增加,另一个变量将减少。r的绝对值越接近1,两变量的关联程度越强,r的绝对值越接近0,两变量的关联程度越弱。相关与回归7第7页,本讲稿共37页相关系数的计算公式r的计算结果说明了两个变量的计算结果说明了两个变量X与与Y之间关联的密切程之间关联
4、的密切程度(绝对值大小)与关联的性质(正负号)。度(绝对值大小)与关联的性质(正负号)。相关与回归8第8页,本讲稿共37页 例例 一一n一个产科医师发现孕妇尿中雌三醇含量与产儿的体重有关。于是设想,通过测量待产妇尿中雌三醇含量,可以预测产儿体重,以便对低出生体重进行预防。因此收集了31例待产妇24小时的尿,测量其中的雌三醇含量,同时记录产儿的体重。问尿中雌三醇含量与产儿体重之间相关系数是多少?是正相关还是负相关?n分析问题:目的、变量、关系 相关与回归9第9页,本讲稿共37页编号(1)尿雌三醇mg/24h(2产儿体重kg(3)编号(1)尿雌三醇mg/24h(2)产儿体重kg(3)172.517
5、173.2292.518253.2392.519273.44122.720153.45142.721153.46162.722153.57162.423163.58143.024193.49163.025183.510163.126173.611173.027183.712193.128203.813213.029224.014242.830253.915153.231244.316163.2 待产妇尿雌三醇含量与产儿体重关系 第10页,本讲稿共37页10X=534Y=99.2 X2=9876 Y2=324.8XY=1750N=31相关与回归11第11页,本讲稿共37页计算结果从计算结果可以知
6、道,从计算结果可以知道,31例待产妇尿中雌三醇含量与产儿例待产妇尿中雌三醇含量与产儿体重之间程正相关,相关系数是体重之间程正相关,相关系数是0.61。相关与回归12第12页,本讲稿共37页问题:我们能否得出结论说明待产妇尿中雌三醇含量与产儿体重之间程正相关,相关系数是0.61。为什么?相关与回归13第13页,本讲稿共37页相关系数的假设检验 n上例中的相关系数r等于0.61,说明了31例样本中雌三醇含量与出生体重之间存在相关关系。但是,这31例只是总体总体中的一个样本一个样本,由此得到的相关系数会存在抽样误差。因为,总体相关系数()为零时,由于抽样误差,从总体抽出的31例,其r可能不等于零。所
7、以,要判断该样本的r是否有意义,需与总体相关系数=0进行比较,看两者的差别有无统计学意义。这就要对r进行假设检验,判断r不等于零是由于抽样误差所致,还是两个变量之间确实存在相关关系。相关与回归14第14页,本讲稿共37页对相关系数的假设检验,常用t检验,选用统计量t的计算公式如下:=n-2 相关与回归15第15页,本讲稿共37页zH0:=0 H1:0 =0.05 r=0.61,n=31,代入公式t=n-2=31-2=29 t=4.14查t值表,t0.05(29)=2.045查t值表,t0.05(29)=2.756,上述计算t=4.142.045,由t所推断的P值小于0.05,按=0.05水准拒
8、绝,接受,认为临产妇24小时内尿中雌三醇浓度与产儿体重之间有正相关关系。相关与回归16第16页,本讲稿共37页直线相关的应用直线相关的应用n 前面我们已经讲过,相关是研究两个变量间的相互关系,而且这种相互关系是用相关系数反应的。在确实存在相关关系的前提下,如果r的绝对值越大,说明两个变量之间的关联程度越强,那么,已知一个变量对预测另一个变量越有帮助;如果r绝对值越小,则说明两个变量之间的关系越弱,一个变量的信息对猜测另一个变量的值无多大帮助。n 一般说来,当样本量较大(n100),并对r进行假设检验,有统计学意义时,r的绝对值大于0.7,则表示两个变量高度相关;r的绝对值大于0.4,小于等于0
9、.7时,则表示两个变量之间中度相关;r的绝对值大于0.2,小于等于0.4时,则两个变量低度相关。相关与回归17第17页,本讲稿共37页 n前面我们讨论了待产妇尿中雌三醇含量和产儿体重之间的关系,知道了二者之间成正相关。那么,如果我们知道了一位待产妇的尿雌三醇含量,能推断出产儿的体重吗?或产儿的体重可能在什么范围内呢?还有,随着身高的增加,体重也在增大,它们之间也成正相关关系。那么,身高每增加1厘米,体重增加多少克呢?上面的相关关系分析不能提供给我们需要的答案。这些要用直线回归的方法来解决。相关与回归18第18页,本讲稿共37页相关与回归19第19页,本讲稿共37页n当我们知道了两个变量之间有直
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 第九 相关 回归 精选 PPT
限制150内