直线相关回归简单回归分析.ppt





《直线相关回归简单回归分析.ppt》由会员分享,可在线阅读,更多相关《直线相关回归简单回归分析.ppt(83页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、两变量关联性分析第十一章第一节 线性相关什么是相关?什么是相关?当所研究的两个事物或现象之间,既存当所研究的两个事物或现象之间,既存在着密切的数量关系,又不象函数关系那在着密切的数量关系,又不象函数关系那样,能以一个变量的数值精确地求出另一样,能以一个变量的数值精确地求出另一个变量的数值,我们称这类变量之间的关个变量的数值,我们称这类变量之间的关系为相关关系,简称系为相关关系,简称相关相关。目的:目的:研究事物或现象之间有无关系、关系研究事物或现象之间有无关系、关系的方向和密切程度。的方向和密切程度。线性相关线性相关(linear correlation)(linear correlation
2、)又称简单相关,又称简单相关,用于双变量正态分布资料。用于双变量正态分布资料。相关关系并不一定是因果关系,相关分析相关关系并不一定是因果关系,相关分析的任务就是对相关关系给以定量的描述。的任务就是对相关关系给以定量的描述。第一节 线性相关线性相关的性质和相关之间的密切程度:1.正相关正相关2.负相关负相关3.无相关无相关4.非线性相关非线性相关线性相关系数线性相关系数(一)相关系数的意义(一)相关系数的意义 相关系数相关系数(coefficient of correlation)(coefficient of correlation)又称又称积差相关系数积差相关系数(coefficient o
3、f product-(coefficient of product-moment correlation)moment correlation),以符号,以符号r r表示。表示。它是说明具有直线关系的两个变量间相它是说明具有直线关系的两个变量间相关密切程度和相关方向的统计指标。关密切程度和相关方向的统计指标。线性相关系数线性相关系数(一)相关系数的意义(一)相关系数的意义 r0r0:正相关;:正相关;r0r3.169t=3.583.169,P P0.010.01,按,按=0.05=0.05水准,拒绝水准,拒绝H H0 0,接受,接受H H1 1,故可以认为一,故可以认为一年级女大学生体重与肺活
4、量间呈正的直年级女大学生体重与肺活量间呈正的直线相关线相关 查表法:查表法:根据自由度根据自由度=n-2=12-2=10=n-2=12-2=10,查附表,查附表1313,r r界值表界值表r r 0.05(10)0.05(10)=0.576=0.576r=0.7495r=0.74950.5760.576,P P0.050.05,按,按=0.05=0.05水准,拒绝水准,拒绝H H0 0,接受,接受H H1 1,故可,故可以认为一年级女大学生体重与肺活量间以认为一年级女大学生体重与肺活量间呈正的直线相关呈正的直线相关进行相关分析时的注意事项进行相关分析时的注意事项1.1.线性相关表示两个变量之间
5、的关系线性相关表示两个变量之间的关系是双向的,当散点图出现直线趋势是双向的,当散点图出现直线趋势时,再作分析。时,再作分析。2.2.相关系数的计算只适用于两个变量相关系数的计算只适用于两个变量都服从正态分布的资料。都服从正态分布的资料。3.3.样本相关系数是总体相关系数的一样本相关系数是总体相关系数的一个估计值,与总体相关系数之间存个估计值,与总体相关系数之间存在着抽样误差,必须作假设检验。在着抽样误差,必须作假设检验。4.4.相关分析是用相关系数来描述两个相关分析是用相关系数来描述两个变量间相互关系的密切程度和方向,变量间相互关系的密切程度和方向,相关关系不一定是因果关系。相关关系不一定是因
6、果关系。5.5.出现异常值时慎用相关。出现异常值时慎用相关。进行相关分析时的注意事项进行相关分析时的注意事项第二节 秩相关(Spearman秩相关)秩相关,又称秩相关,又称等级相关等级相关。适用于不服从正态分布的资料或总体分适用于不服从正态分布的资料或总体分布未知的资料,属非参数统计方法。布未知的资料,属非参数统计方法。一、秩相关的概念及其统计描述一、秩相关的概念及其统计描述例例11-411-4 某地研究某地研究2 27 7岁急性白血病岁急性白血病患儿的血小板数与出血症状程度之间患儿的血小板数与出血症状程度之间的相关性,结果见表的相关性,结果见表11-211-2。试用秩相。试用秩相关进行分析。
7、关进行分析。表表11-2 11-2 患儿的血小板和出血症状患儿的血小板和出血症状编号编号 血小板数血小板数 秩次秩次 出血症状出血症状 秩次秩次 pq pq 1 121 1 1 121 1 11.5 11.5 11.5 11.5 2 138 2 2 138 2 9.0 18 9.0 18 3 165 3 3 165 3 7.0 21 7.0 21 4 310 4 4 310 4 3.5 14 3.5 14 5 426 5 5 426 5 9.0 45 9.0 45 6 540 6 6 540 6 9.0 54 9.0 54 7 740 7 7 740 7 3.5 24.5 3.5 24.5 8
8、 1060 8 8 1060 8 3.5 28 3.5 28 9 1260 9 9 1260 9 3.5 31.5 3.5 31.510 1290 10 10 1290 10 3.5 35 3.5 3511 1438 11 11 1438 11 11.5 126.5 11.5 126.512 2004 12 12 2004 12 3.5 42 3.5 42合计合计 78 78 451 78 78 451步骤:步骤:1.1.将两变量将两变量X X、Y Y成对的观察值分别成对的观察值分别从小到大排序编秩,以从小到大排序编秩,以p pi i表示表示X Xi i的秩的秩次,以次,以q qi i表示表示
9、Y Yi i的秩次。的秩次。2.2.观察值相同的取平均秩次观察值相同的取平均秩次。3.3.将将p pi i、q qi i直接替换原始数据,计直接替换原始数据,计算秩相关系数算秩相关系数(r(rs s)。p=78,q=78,pp=78,q=78,p2 2=650,=650,qq2 2=630,pq=451=630,pq=451,n n1212二、秩相关系数的统计推断二、秩相关系数的统计推断=0.05=0.05 当当n50n50时,可查附表时,可查附表1414,r rs s界值表,界值表,若统计量若统计量r rs s大于临界值,则拒绝大于临界值,则拒绝H H0 0假假设。设。当当n n5050时,
10、可作时,可作t t检验。检验。例例11-411-4中,算得中,算得r rs s0.4220.422,n n1212,查,查r rs s界值表,界值表,r rs sr r12,0.112,0.1=0.503,P=0.503,P0.10.1,按,按0.050.05的水准,不拒绝的水准,不拒绝H H0 0,可认为急性白,可认为急性白血病患儿的出血症状与血小板数之血病患儿的出血症状与血小板数之间无相关关系。间无相关关系。第三节 分类变量的关联性分析例例11-611-6 为观察婴儿腹泻是否与喂养方为观察婴儿腹泻是否与喂养方式有关,某医院儿科随机收集了消化式有关,某医院儿科随机收集了消化不良的婴儿不良的婴
11、儿8282例,把该院儿科所有消例,把该院儿科所有消化不良的患儿视为一个总体的话,则化不良的患儿视为一个总体的话,则该该8282例患儿可看作一份随机样本,对例患儿可看作一份随机样本,对每个个体分别观察腹泻与否和喂养方每个个体分别观察腹泻与否和喂养方式两种属性,试分析两种属性的关联式两种属性,试分析两种属性的关联性。性。一、交叉分类一、交叉分类22表的关联分析表的关联分析表表11-3 11-3 婴儿腹泻与喂养方式的关系婴儿腹泻与喂养方式的关系喂养方式喂养方式 腹泻腹泻 合计合计 有有 无无 人工人工 30 10 40 30 10 40 母乳母乳 17 25 42 17 25 42 合计合计 47
12、35 82 47 35 82两种属性的关联性分析两种属性的关联性分析H0:喂养方式与婴儿腹泻间互相独立:喂养方式与婴儿腹泻间互相独立H1:喂养方式与婴儿腹泻间有关联:喂养方式与婴儿腹泻间有关联 0.05由于由于2 =9.98=9.98 2 0.05(1)0.05(1)=3.84=3.84,故故P P0.050.05,按,按=0.05=0.05 水准拒绝水准拒绝H H0 0,接受,接受H H1 1,故可以认为喂养方式与婴故可以认为喂养方式与婴儿腹泻间存在关联性。儿腹泻间存在关联性。两分类变量的关联程度,可用两分类变量的关联程度,可用pearson列联系数来描述。列联系数来描述。例例11-711-
13、7 有有5656份咽喉涂抹标本,把每份份咽喉涂抹标本,把每份标本一分为二,依同样的条件分别接标本一分为二,依同样的条件分别接种于甲、乙两种培养基上,观察白喉种于甲、乙两种培养基上,观察白喉杆菌的生长情况,结果见表杆菌的生长情况,结果见表11-511-5,问,问两种培养基的结果有无关联?两种培养基的结果有无关联?二、二、22配对资料的关联性分析配对资料的关联性分析表表11-5 11-5 两种培养基白喉杆菌生长情况两种培养基白喉杆菌生长情况 甲培养基甲培养基 乙培养基乙培养基 合合 计计 22(a)18(b)40 22(a)18(b)40 2(c)14(d)16 2(c)14(d)16合计合计 2
14、4 32 56 24 32 56检验步骤:检验步骤:1 1建立假设:建立假设:H H0 0 0 0:两种培养基的结果之间互相独立:两种培养基的结果之间互相独立H H1 1 1 1:两种培养基的结果之间互相关联:两种培养基的结果之间互相关联0.050.052 2计算计算2 2值值由于由于2 =8.43=8.43 2 0.05(1)0.05(1)=3.84=3.84,故故P P0.050.05,按,按=0.05=0.05 水准拒绝水准拒绝H H0 0,接受,接受H H1 1,故可认为两种培养基的结故可认为两种培养基的结果之间存在关联性。果之间存在关联性。pearson列联系数列联系数例例11-81
15、1-8 某地居民主要有三种祖籍,均某地居民主要有三种祖籍,均流行甲状腺肿。为探讨甲状腺肿类型流行甲状腺肿。为探讨甲状腺肿类型与祖籍是否有关联,现根据居民甲状与祖籍是否有关联,现根据居民甲状腺肿筛查结果,按甲状腺肿类型与祖腺肿筛查结果,按甲状腺肿类型与祖籍两种属性交叉分类,得表籍两种属性交叉分类,得表11-611-6的结的结果,问甲状腺肿类型与祖籍间有无关果,问甲状腺肿类型与祖籍间有无关联?联?三、三、RC表分类资料的关联性分析表分类资料的关联性分析表表11-6 11-6 甲状腺肿类型与祖籍的关系甲状腺肿类型与祖籍的关系祖籍祖籍 甲状腺肿甲状腺肿类型类型 合计合计 弥漫型弥漫型 结节型结节型 混
16、合型混合型甲甲 486 2 4 492 486 2 4 492乙乙 133 260 51 444 133 260 51 444丙丙 100 315 85 500 100 315 85 500合计合计 719 577 140 1436 719 577 140 1436两种属性的关联性分析两种属性的关联性分析H0:甲状腺肿类型与祖籍间无关联甲状腺肿类型与祖籍间无关联H1:甲状腺肿类型与祖籍间甲状腺肿类型与祖籍间有关联有关联 0.05由于由于2 =723.783=723.783 2 0.05(4)0.05(4)=9.499.49,故,故P P0.050.05,按,按=0.05=0.05 水准水准拒绝
17、拒绝H H0 0,接受,接受H H1 1,故可认为甲状腺肿故可认为甲状腺肿类型与祖籍间有关联。类型与祖籍间有关联。pearson列联系数列联系数线性相关的概念线性相关的概念线性相关线性相关(linear correlation)(linear correlation)又称又称简单相关,简单相关,用于双变量正态分布资料用于双变量正态分布资料。相关关系并不一定是因果关系,相关相关关系并不一定是因果关系,相关分析的任务就是对相关关系给以定量分析的任务就是对相关关系给以定量的描述。的描述。小小 结结相关系数的意义相关系数的意义 相关系数相关系数(coefficient of(coefficient o
18、f correlation)correlation)又称积差相关系数又称积差相关系数(coefficient of product-moment(coefficient of product-moment correlation)correlation),以符号,以符号r r表示。它是说表示。它是说明具有直线关系的两个变量间相关密明具有直线关系的两个变量间相关密切程度和相关方向的统计指标。切程度和相关方向的统计指标。小小 结结r r0 0:正相关;:正相关;r r0 0:负相关;:负相关;r r0 0:零相关;:零相关;|r|r|l l:完全相关。:完全相关。小小 结结线性相关系数的特点线性相
19、关系数的特点 1.相关系数r是一个无量纲的数值,且-1rl;2.r0为正相关,r0为负相关;3.|r|越接近于l,说明相关性越好,|r|越接近于0,说明相关性越差。小小 结结练习练习1 1 根据如下资料,试分析根据如下资料,试分析1616名男大名男大学生的身高与肺活量的线性相关关系。学生的身高与肺活量的线性相关关系。身高:身高:1.742 1.718 1.714 1.712 1.742 1.718 1.714 1.712 1.720 1.704 1.709 1.729 1.708 1.720 1.704 1.709 1.729 1.708 1.698 1.714 1.674 1.683 1.6
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 直线 相关 回归 简单 分析

限制150内