相关分析与回归分析精选课件.ppt
《相关分析与回归分析精选课件.ppt》由会员分享,可在线阅读,更多相关《相关分析与回归分析精选课件.ppt(47页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、关于相关分析与回归分析第一页,本课件共有47页概述概述n相相关关分分析析和和回回归归分分析析都都是是分分析析客客观观事事物物之之间间相相关关性性的的数数量量分析方法。分析方法。n相互关系:函数关系与统计关系相互关系:函数关系与统计关系n统统计计关关系系:不不完完全全确确定定的的随随机机关关系系,当当一一个个或或几几个个相相互互联联系系的的变变量量取取一一定定值值时时,与与其其相相对对应应的的另另一一个个变变量量取取值值虽虽不不确确定定,但但会会按按照某种规律在一定范围内变化。照某种规律在一定范围内变化。线性相关:正/负非线性相关第二页,本课件共有47页相关分析相关分析-散点图散点图n将将数数据
2、据以以点点的的形形式式画画在在直直角角平平面面上上。n基基本本操操作作:n图图形形-旧旧对对话话框框-散散点点/点点状状第三页,本课件共有47页相关系数相关系数n两两个个步步骤骤:1.计计算算样样本本相相关关系系数数r;2.对对样样本本来来自自的的两两总总体体是是否否存存在在显显著著线线性性关关系系进进行行推推断断。提出零假设,即两总体无线性相关性;选择检验统计量;计算检验统计量的观测值和对应的概率p值;决策第四页,本课件共有47页n相相关关系系数数的的分分类类nP Pe ea ar rs so on n简简单单相相关关系系数数(皮皮尔尔逊逊):用用来来度度量量正正态态分分布布的的定定距距变变
3、量量间间的的线线性性相相关关关关系系,P Pe ea ar rs so on n简简单单相相关关系系数数不不能能用用于于度度量量变变量量之之间间的的非非线线性性关关系系nS Sp pe ea ar rm ma an n秩秩相相关关系系数数(斯斯皮皮尔尔曼曼):采采用用非非参参数数检检验验方方法法来来度度量量定定序序变变量量间间的的线线性性相相关关关关系系,由由于于数数据据为为非非定定距距变变量量,因因此此不不能能直直接接采采用用原原始始数数据据,而而是是利利用用数数据据的的秩秩nK Ke en nd da al ll l秩秩相相关关系系数数(肯肯德德尔尔):采采用用非非参参数数检检验验方方法法
4、来来度度量量定定序序变变量量间间的的线线性性相相关关关关系系第五页,本课件共有47页连续变量的相关分析连续变量的相关分析nPearson简单相关系数:其中简单相关系数:其中 为协方差,为协方差,为标准差。为标准差。x和y是对称的,说明x与y的相关系数等同于y和x和相关系数;简单相关系数是无量纲的;x和y做线性变换后可能改变相关系数的符号,但不会改变值;只能度量线性关系,不能度量非线性关系的。第六页,本课件共有47页n对对相相关关关关系系的的显显著著性性进进行行检检验验,该该检检验验原原假假设设是是:两两总总体体相相关关系系数数等于等于0。nt统计量:统计量:,服从自由度为服从自由度为n-2的的
5、t分布。分布。第七页,本课件共有47页定序变量的相关分析定序变量的相关分析-Spearmannui和和vi分分别别表表示示变变量量x和和y的的秩秩变变量量,用用di=ui-vi表表示示第第i个个样样本本对对应应于两变量的秩之差。于两变量的秩之差。nSpearman秩相关公式:秩相关公式:n两变量正相关,秩变化有同步性,两变量正相关,秩变化有同步性,r趋向于趋向于1;n两两变变量量完完全全正正线线性性相相关关,ui和和vi相相等等,r=1;完完全全负负相相关关,ui+vi=n+1,r=-1;n检验系数,原假设为:两变量不相关。检验系数,原假设为:两变量不相关。n小小样样本本,服服从从Spearm
6、an分分布布;大大样样本本,服服从从标标准准正正态态分分布。布。第八页,本课件共有47页定序变量的相关分析定序变量的相关分析-Kendall秩相关系数秩相关系数n设设在在v1后后面面有有R1个个秩秩大大于于v1,v2后后面面有有R2个个秩秩大大于于v2,.在在vn-1后面有后面有Rn-1个秩大于个秩大于vn-1,令,令n显然,变量显然,变量x和和y相关性越强,则相关性越强,则R越大。越大。nKendall秩相关系数:秩相关系数:第九页,本课件共有47页举例举例kendall秩相关系数秩相关系数n假假如如我我们们设设一一组组8人人的的身身高高和和体体重重在在那那里里A的的人人是是最最高高的的,第
7、第三重,等等:三重,等等:n注注意意,A最最高高,但但体体重重排排名名为为 3,比比体体重重排排名名为为 4,5,6,7,8 的的重重,贡贡献献5个个同同序序对对,即即AB,AE,AF,AG,AH。同同理理,我我们们发发现现B、C、D、E、F、G、H分分别别贡贡献献4、5、4、3、1、0、0个同序对,因此,个同序对,因此,nR=5+4+5+4+3+1+0+0=22.n因而因而rk=(88/56)-1=0.57。第十页,本课件共有47页定类变量的相关分析定类变量的相关分析n卡方检验离散变量的相关性,称为列联表分析。卡方检验离散变量的相关性,称为列联表分析。n用多行多列纵横交错形成一个表体。用多行
8、多列纵横交错形成一个表体。nEij为为联联合合观观察察频频数数;ni.为为第第i行行观观察察频频数数之之和和,n.j为为第第j列列观观察察频数之和。频数之和。nPearson 卡方统计量:卡方统计量:n该检验的原假设为:两变量相互独立。该检验的原假设为:两变量相互独立。第十一页,本课件共有47页举例:列联表分析举例:列联表分析第十二页,本课件共有47页第十三页,本课件共有47页第十四页,本课件共有47页第十五页,本课件共有47页第十六页,本课件共有47页第十七页,本课件共有47页案例案例6.1 双变量相关分析双变量相关分析n案案例例6.1.sav的的资资料料给给出出了了杭杭州州市市2006年年
9、市市区区分分月月统统计计的的平平均均温温度和日照时数。试据此分析平均温度和日照时数的相关性。度和日照时数。试据此分析平均温度和日照时数的相关性。第十八页,本课件共有47页偏相关分析偏相关分析n很很多多情情况况下下,需需要要进进行行相相关关分分析析的的变变量量的的取取值值会会同同时时受受到到其其他他变变量量的的影影响响,这这时时候候就就需需要要把把其其他他变变量量控控制制住住,然然后后输输出出控控制制其其他他变变量量影影响响后后的的相相关关系系数数。SPSS的的偏偏相相关关分分析析(Partial)过过程程就就是是为为解解决决这一问题而设计的。这一问题而设计的。n控控制制变变量量个个数数为为一一
10、时时,偏偏相相关关系系数数称称为为一一阶阶偏偏相相关关,为为2则则是是二阶偏相关。二阶偏相关。第十九页,本课件共有47页n步步骤骤:1.计计算算样样本本的的偏偏相相关关系系数数2.对对样样本本来来自自两两总总体体是是否否存存在在显显著著净净相相关关进进行行推推断断:提出零假设:两总体的偏相关系数与零无显著差异;选择检验统计量t;计算检验统计量的观测值和对应的概率p值;决策。第二十页,本课件共有47页案例案例6.2 n案案例例6.2.sav的的资资料料给给出出了了随随机机抽抽取取的的山山东东省省某某学学校校的的12名名学学生生的的IQ值值、语语文文成成绩绩和和数数学学成成绩绩。因因为为语语文文成
11、成绩绩和和数数学学成成绩绩都都受受IQ的的影影响响,所所以以试试用用偏偏相相关关分分析析研研究究学学生生语语文文成成绩绩和和数数学成绩的相关关系。学成绩的相关关系。第二十一页,本课件共有47页案例案例6.3 距离分析距离分析nSPSS的的距距离离分分析析(Distances)也也属属于于相相关关分分析析的的范范畴畴,其其基基本本功功能能是是对对样样本本观观测测值值之之间间差差异异性性或或者者相相似似程程度度进进行行度度量量,从从而而对对数数据据形形成成一一个个初初步步的的了了解解。这这种种分分析析方方法法主主要要应应用用在在分分析析之之前前对对数数据据背背后后的的专专业业知知识识不不够够充充分
12、分了了解解,进进行探索性研究的情形。行探索性研究的情形。n案案例例6.3.sav的的资资料料给给出出了了沈沈阳阳、大大连连和和鞍鞍山山2006年年各各月月的的平平均均气气温情况。试用距离分析方法研究这三个地区月平均气温的相似程度。温情况。试用距离分析方法研究这三个地区月平均气温的相似程度。第二十二页,本课件共有47页回归分析回归分析n回归分析是研究两个变量或多个变量之间因果关系的统计方法。回归分析是研究两个变量或多个变量之间因果关系的统计方法。n基基本本思思想想:在在进进行行相相关关分分析析的的基基础础上上,对对确确定定具具有有相相关关关关系系的的两两个个或或多多个个变变量量之之间间数数量量变
13、变化化的的一一般般关关系系进进行行测测定定,确定一个合适的数学模型,以便从已知量来推断未知量。确定一个合适的数学模型,以便从已知量来推断未知量。第二十三页,本课件共有47页相关分析与回归分析的区别相关分析与回归分析的区别n相相关关分分析析研研究究的的变变量量之之间间关关系系是是对对等等的的,回回归归分分析析研研究究的的变变量有解释和被解释之分;量有解释和被解释之分;n相相关关分分析析研研究究的的是是随随机机变变量量,回回归归分分析析被被解解释释变变量量是是随随机机变量,而解释变量非随机;变量,而解释变量非随机;n相相关关分分析析不不能能指指出出变变量量间间相相互互关关系系的的具具体体形形式式,
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 相关 分析 回归 精选 课件
限制150内