第十五章--直线相关与直线回归分析优秀PPT.ppt
《第十五章--直线相关与直线回归分析优秀PPT.ppt》由会员分享,可在线阅读,更多相关《第十五章--直线相关与直线回归分析优秀PPT.ppt(70页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、学 习 目 标v1.说出直线相关与直线回来的概念;v2.说出等级相关的适用范围;v3.能计算直线相关系数与回来系数、进行假设检验;v4.能从专业角度考虑相关与回来的实际意义。1两个变量之间的关系大致分为两种:21.两个变量共同变更的,是一种相互依靠的关系v例如身高与体重的关系。可以用相关分析方法去探讨这种关系。可以探讨两个变量之间的相互关系的亲密程度和变更趋势,并用恰当的统计指标表达。32.一个变量对另外一个变量有着某种依存关系v例如儿子的身高与父亲的身高有着某种依存关系,可以用回来分析的方法去探讨这种关系,即把两个变量间的数量依存关系用函数形式表示出来,用一个或多个变量去推想另一个变量的估计
2、值和波动范围,这就是回来分析。4v为了探讨父亲与成年儿子身高之间的关系,卡尔.皮尔逊测量了1078对父子的身高。把1078对数字表示在坐标上,如图。用水平轴X上的数代表父亲身高,垂直轴Y上的数代表儿子的身高,1078个点所形成的图形是一个散点图。它的形态象一块橄榄状的云,中间的点密集,边沿的点稀有,其主要部分是一个椭圆。5第一节第一节 直直 线线 相相 关关 分分 析析 Linear Correlation61.直线相关概念v概念:描述和推断两个(事务、现象)正态概念:描述和推断两个(事务、现象)正态变量(变量(x、y)总的变更趋势上协同变更规律性总的变更趋势上协同变更规律性的亲密程度和方向(
3、但又非确定的函数关系)的亲密程度和方向(但又非确定的函数关系)的统计分析方法。的统计分析方法。v协同变更:同增同减,此增彼减协同变更:同增同减,此增彼减72.直线相关的特点:v两变量同时进入数据分析;v两变量不区分为缘由变量和结果变量,是一种互为因果的数量协同变更关系;v变量类型:两变量应同时满足正态分布的条件(实际工作中近似正态分布)。8相关分析1.图示法:有无相关、相关程度、相关方向2相关系数:在求相关系数前,最好先做图。9v相关分析:无自变量、因变量、地位同等。v回来分析:有自变量、因变量,两者从属关系。10绘制散点图v分析探讨两个变量x与y之间的关系时,两个变量的值可视为直角坐标系的一
4、个点。为直观地推断两个变量间的关系,可把每对(x,y)变量值在直角坐标系标点出来,此为散点图。v若一个变量x由小到大(或由大变小),则另一变量相应地由小到大(或由大到小),两个变量的散点图呈直线趋势,可称这种现象为共变。113、相关的类型、相关的类型正相关 负相关 完全正相关 完全负相关 零相关 12一、直线相关统计量13相 关 系 数 及 意 义v相关系数相关系数:相关系数是用以衡量两个变量线形相关有无、强弱与方向的统计指标。v总体参数:v样本相关系数:r14相关系数的计算公式15 r r 的计算结果:的计算结果:说明白两个变量说明白两个变量X X与与Y Y之间关联的亲密程度(确之间关联的亲
5、密程度(确定值大小)与关联的性质(正负号)。定值大小)与关联的性质(正负号)。16vr是无量刚的统计量;-1r2.228,由t所推断的P值小于0.05,按=0.05水准拒绝H0,接受H1,r为正值,说明唾液药物浓度与血液药物浓度存在正相关关系。23相关确定有内在联系吗?v某君喜得贵子,庭前种一小树,每月测子高与树高,积累了数据。统计计算发觉,子高与树高具有相关性,莫非两者真有内在联系?原来子高与树高均与日俱增,时间变量与两者得潜在联系,造成了子高与树高的虚假联系。24相关关系与因果关系是一回事吗?v相关关系可能是:v(1)两个变量之间存在依存因果关系,如由于遗传的缘由,子女的身高数值的大小在很
6、大程度上取决于父母的身高。v(2)两个变量之间存在相互的伴随关系,如“蛙鸣而燕至”,虽然年年如此,但蛙鸣恒久也不能成为燕至的缘由。25直线相关的应用直线相关的应用v 相关是探讨两个变量间的相互关系,而且这种相互关系是用相关系数反应的。在的确存在相关关系的前提下,假如r的确定值越大,说明两个变量之间的关联程度越强,那么,已知一个变量对预料另一个变量越有帮助;假如r确定值越小,则说明两个变量之间的关系越弱,一个变量的信息对揣测另一个变量的值无多大帮助。v 一般说来,当样本量较大(n100),并对r进行假设检验,有统计学意义时,r的确定值大于0.7,则表示两个变量高度相关;r的确定值大于0.4,小于
7、等于0.7时,则表示两个变量之间中度相关;r的确定值大于0.2,小于等于0.4时,则两个变量低度相关。26 v前面我们探讨了12名癫痫病人的唾液药物浓度和血液药物浓度之间的关系,知道了二者之间成正相关。那么,假如我们知道了一位癫痫病人的唾液药物浓度,能推断出血液药物浓度的大小吗?或血液药物浓度可能在什么范围内呢?还有,唾液药物浓度和血液药物浓度。那么,体重每增加1微克,血液药物浓度增加多少呢?上面的相关关系分析不能供应应我们须要的答案。这些要用直线回来的方法来解决。27五、直线相关分析的留意点v作直线相关分析时,应结合散点图来推断两变量的数量协同变更关系是否呈直线关系,避开将某些曲线关系误判为
8、直线关系;v应当留意假相关状况;v当两变量均明显不呈正态分布时,最好接受秩相关统计分析方法计算秩相关系数。2829“回来”一词的来由v“回来”一词最早由Golton在一项有关父亲与儿子身高的探讨中提出。儿子的身高(Y)与父亲的身高(X)自然是相关的,他发觉身材高大的父亲所生儿子的高度不少要比其父亲矮,而身材矮小的父亲所生的儿子不少要比其父亲高;也就是说,无论是身材高还是身材矮的父亲所生儿子的身高有向人群的平均身高“回来”的趋势,这就是“回来”的生物学内涵。后来人们借助“回来”一词来描述通过自变量的数值预料反应变量的平均水平。30v为了通过可测或易测的变量对未知或难测或不行测量的状态进行估计,可
9、以借助回来分析。v例如:我们可以用身高、体重、肺活量这些简洁测得的指标来估计心室血输出量、体循环总血量等相对难测的指标;通过对产妇的尿雌三醇含量的检测来估计腹中胎儿体重,以便实行必要的措施降低生产过程的难产风险。31v(1 1)当我当我们知道了两个知道了两个变量之量之间有直有直线相关关系,相关关系,并且一个并且一个变量的量的变更会引起另一个更会引起另一个变量的量的变更,更,这时,假如它,假如它们之之间存在精确、存在精确、严格的关系,它格的关系,它们的的变更可用函数方程来表示,叫它更可用函数方程来表示,叫它们是函数关系,它是函数关系,它们之之间的关系式叫函数方程。的关系式叫函数方程。v(2 2)
10、但在)但在实际生活当中,由于其它因素的干生活当中,由于其它因素的干扰,很多双很多双变量之量之间的关系并不是的关系并不是严格的函数关系,不格的函数关系,不能用函数方程反映,能用函数方程反映,为了区分于两了区分于两变量量间的函数方的函数方程,我程,我们称称这种关系式种关系式为直直线回来方程,回来方程,这种关系种关系为直直线回来回来.32直线回来的定义v分析两个变量X、Y之间准确的定量关系,建立一个方程式,从而可由X变量的大小推算出Y变量的估计值。v直线回来就是用来描述一个变量如何依靠于另一个变量。33回来方程 v直线回来的任务就是要找出一个变量随另一个变量变更的直线方程,我们把这个直线方程叫做直线
11、回来方程。:是由自变量X推算应变量Y的估计值(读作Yhat)a:是回来直线在Y轴上的截距,即X=0时的Y值;b:为样本的回来系数,即回来直线的斜率,表示当X变动一个单位时,Y平均变动b个单位。34直线回来分析的特点:v两变量同时进入数据分析;v两变量必需区分为自变量X和应变量Y;v要求应变量Y为正态分布,或对应同一X值的应变量Y与直线回来方程估计值的差值听从正态分布v适用于两变量数量协同变更关系亲密的状况,否则回来估计误差过大,无应用价值。35直线回来分析的意义v可以用来较精确描述两变量的定量关系;v可以在确定自变量变更线性范围内由自变量预报应变量值,v给定应变量的限制限值,利用直线方程找寻自
12、变量的限制限值。36 要使 是 最适合的直线,必需满足下列条件:v(1)直线上方各点离回来线的距离(以平行于Y轴计算)之和与直线下方各点离回来线的距离之和确定值相等,但方向相反,因此:37v(2)此直线是使得误差平方和 为最小值的直线,即因变量的实际视察值y与理论值 之差的平方和取最小值。v对于每一个x值来说,它所对应实际的y值,与估计的 值往往会存在差异,这个差异就是用估计 值来代替实际y值所产生的误差,即 ,误差越小越好,由于理论上 ,因此要把 为最小值的直线当作回来直线是很困难的。一个最佳且能表达同样目的的方法,那就是将此直线定义为使得误差平方和为最小值的直线。这个方法称为最小二乘法。3
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 第十五 直线 相关 回归 分析 优秀 PPT
限制150内