第五章-相关分析SPSS优秀PPT.ppt
《第五章-相关分析SPSS优秀PPT.ppt》由会员分享,可在线阅读,更多相关《第五章-相关分析SPSS优秀PPT.ppt(38页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、双变量的关系有关与无关v找寻变量间的关系是科学探讨的首要目的。变量间的关系最简洁的划分即:有关与无关。v在统计学上,我们通常这样推断变量之间是否有关:假如一个变量的取值发生变更,另外一个变量的取值也相应发生变更,则这两个变量有关。假如一个变量的变更不引起另一个变量的变更则二者无关。性别与四级英语考试通过率的相关统计性别与四级英语考试通过率的相关统计表述:统计结果显示,当性别取值不同时,通过率变量表述:统计结果显示,当性别取值不同时,通过率变量的取值并未发生变更,因此性别与考试通过率无关。的取值并未发生变更,因此性别与考试通过率无关。自变量的不同取值在因变量上无差异,两变量无关。自变量的不同取值
2、在因变量上无差异,两变量无关。自变量的不同取值在因变量上有差异,两变量有关。自变量的不同取值在因变量上有差异,两变量有关。表述:统计结果显示,当性别取值不同时,收入变表述:统计结果显示,当性别取值不同时,收入变量的取值发生了变更,因此性别与月收入有关。量的取值发生了变更,因此性别与月收入有关。自变量因变量双变量关系的统计类型双变量关系的统计类型双变量的关系双变量的关系关系强度测量关系强度测量变量关系强度的含义变量关系强度的含义:指两个变量相关程指两个变量相关程度的凹凸。统计学中是以准试验的思想度的凹凸。统计学中是以准试验的思想来分析变量相关的。通常从以下的角度来分析变量相关的。通常从以下的角度
3、分析:分析:A)两变量是否相互独立。)两变量是否相互独立。B)两变量是否有共变趋势。)两变量是否有共变趋势。C)一变量的变更多大程度上能由另一)一变量的变更多大程度上能由另一变量的变更来说明。变量的变更来说明。双变量关系强度测量的主要指标双变量关系强度测量的主要指标双变量的关系双变量的关系关系的性质关系的性质直线相关与曲线相关正相关与负相关完全相关与完全不相关第一节 列联相关一、列联分析的基本原理一、列联分析的基本原理自变量发生变更,因变量取值是否也发自变量发生变更,因变量取值是否也发生变更。生变更。比较边缘百分比和条件百分比的差别。比较边缘百分比和条件百分比的差别。列联表的格式列联表的格式自
4、变量因变量人数行百分比列百分比总百分比边缘百分比边缘百分比条件百分比卡方测量的原理卡方测量的原理卡方测量用来考察两变量是否独立(无关)。其原理是依据这一概率定理:若两变量无关,则两变量中联合事务发生的概率应等于各自独立发生的概率乘积在列联表中,这确定理就具体转化为:在列联表中,这确定理就具体转化为:若两变量无关,则两变量中条件概率应若两变量无关,则两变量中条件概率应等于各自边缘的概率乘积。反之,则两等于各自边缘的概率乘积。反之,则两变量有关,或,两变量不独立。变量有关,或,两变量不独立。示例示例151565 5观察值边缘概率边缘概率边缘概率期望条件概率 9 9-9-9残差由此可见,期望值(独立
5、模型)与视察值的差距越大,说明两变量越不独立,也就越有相关。因此,卡方的表达式如下:卡方的取值在0之间。卡方值越大,关联性越强。在SPSS中,有Pearson X2和相像比卡方(Likelihood Ratio X2)两种。的改进标准化系数:的改进标准化系数:为使为使 值有一固定的区间,便于比较,接值有一固定的区间,便于比较,接受了以下几个修正:受了以下几个修正:A、系数(Phi):(01),适用于22表。B、列联系数(Contingency Coefficient):(01),适用随意表。C、Cramer V系数:(01),适用随意表。D、系数(Lambda):(01),适用随意表。E、Go
6、odman&Kruskal-tau系数:(01),适用随意表。二、二、列联表分析过程主要功能:主要功能:调用列联表分析过程可进行计数资料和某调用列联表分析过程可进行计数资料和某些等级资料的列联表分析,一个行变量和一些等级资料的列联表分析,一个行变量和一个列变量可组成一个二维列联表,如再加一个列变量可组成一个二维列联表,如再加一个限制变量则可组成一个三维列联表。而多个限制变量则可组成一个三维列联表。而多个行、列、限制变量就可组成一个困难的多个行、列、限制变量就可组成一个困难的多维列联表。在分析中可对二维和多维列联表维列联表。在分析中可对二维和多维列联表资料进行统计描述和资料进行统计描述和x2检验
7、,并计算相应的检验,并计算相应的百分数指标。此外,还可计算四格表准确概百分数指标。此外,还可计算四格表准确概率(率(Fishers Exact Test),且有单双侧),且有单双侧(One-Tail、Ywo-Tail)、对数拟然比检验)、对数拟然比检验(Likelihood Ratio)以及线性关系的)以及线性关系的Mantel-Haenszel x2检验。检验。三、列联表分析过程 列联表分析程序 按Analyze-Descriptive Statistics-Crosstabs 依次打开 Crosstabs 主对话框。如图431该框中的变量该框中的变量作为分布表中作为分布表中的行变量,必的行
8、变量,必需是数值型或需是数值型或字符型等分类字符型等分类变量。变量。该框中的变量作该框中的变量作为限制变量,确为限制变量,确定频数分布表中定频数分布表中的层,可有多个的层,可有多个限制变量,如要限制变量,如要增加新的限制变增加新的限制变量,按量,按Next 键,键,要修改以前的变要修改以前的变量按量按Previous 键键显示每显示每一组中一组中各变量各变量的分类的分类条形图。条形图。只输出只输出统计量,统计量,不输出不输出多维列多维列联表。联表。见图见图4-32见图见图4-33见图见图4-34图图431 Crosstabs 对话框对话框进行行和列变量相互独立的假进行行和列变量相互独立的假设检
9、验,有多种检验法。(注)设检验,有多种检验法。(注)进行相关系数的检验,有两项结果显示:Pearson相关系数和 Spearman相关系数适用于定类变量的统计量:适用于定类变量的统计量:基于卡方检验基础上对相关性的检基于卡方检验基础上对相关性的检验验用来描述相关性用来描述相关性当用自变量预料因变量时,此系数当用自变量预料因变量时,此系数反映这种预料降低错误的比率。反映这种预料降低错误的比率。显示不确定系数,表示用一个变量显示不确定系数,表示用一个变量来预料其他变量时降低错误的比率来预料其他变量时降低错误的比率适用于定序变量:适用于定序变量:Gamma系数反映两个有序变量间系数反映两个有序变量间
10、的对称相关性。的对称相关性。是是Gamma检验的非对称推广。检验的非对称推广。对有序变量和秩变量相关性的非对有序变量和秩变量相关性的非参数检验。参数检验。与与Kendalls tau-c相像相像适用于定序变量:适用于定序变量:用于检验相关性用于检验相关性用于检验两个评估人对同一对象的评估是用于检验两个评估人对同一对象的评估是否具有一样系。否具有一样系。检验某事务发生和某因子之间的关系检验某事务发生和某因子之间的关系进行两个相关的二值变量的非参数检验进行两个相关的二值变量的非参数检验进行一个二值因素变量和一个二值响应变进行一个二值因素变量和一个二值响应变量的独立性检验。量的独立性检验。图432
11、Crosstabs的Statistics 对话框图图433 Crosstabs的的Cell Display 对话框对话框选择在列联表中输出的统计量,选择在列联表中输出的统计量,包括观测量数、百分比、残差包括观测量数、百分比、残差输出观测量的实际数量输出观测量的实际数量假如行和列变量在统计假如行和列变量在统计上是独立的或不相关的,上是独立的或不相关的,那么会在单元格中输出期那么会在单元格中输出期望的观测值的数量。望的观测值的数量。输出单元格中观测量的数目占输出单元格中观测量的数目占整行全部观测量数目的百分比整行全部观测量数目的百分比输出单元格中观测值的数目占输出单元格中观测值的数目占整列全部观测
12、量数目的百分比整列全部观测量数目的百分比输出单元格中观测量的数目占输出单元格中观测量的数目占全部观测量数目的百分比全部观测量数目的百分比计算非标准化残差计算非标准化残差计算标准化残差计算标准化残差计算调整后残差计算调整后残差图图434 Table Format 对话框对话框确定各行的排列依次:确定各行的排列依次:各行的排列按升序各行的排列按升序各行的排列按降序各行的排列按降序三、例三、例 为了探讨吸烟与慢性支气管炎有无关系,调查为了探讨吸烟与慢性支气管炎有无关系,调查了了339人,状况如下:人,状况如下:表表4-18 吸烟和慢性支气管炎调查表吸烟和慢性支气管炎调查表患慢性支气管炎未患慢性支气管
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 第五 相关 分析 SPSS 优秀 PPT
限制150内