6第六章 相关分析.ppt
《6第六章 相关分析.ppt》由会员分享,可在线阅读,更多相关《6第六章 相关分析.ppt(33页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、第五章第五章 双变量关系描述统计双变量关系描述统计相关分析与检验相关分析与检验双变量的关系有关与无关v寻找变量间的关系是科学研究的首要目的。变量间的关系最简单的划分即:有关与无关。v在统计学上,我们通常这样判断变量之间是否有关:如果一个变量的取值发生变化,另外一个变量的取值也相应发生变化,则这两个变量有关。如果一个变量的变化不引起另一个变量的变化则二者无关。性别与四级英语考试通过率的相关统计性别与四级英语考试通过率的相关统计表述:统计结果显示,当性别取值不同时,通过率变量表述:统计结果显示,当性别取值不同时,通过率变量的取值并未发生变化,因此性别与考试通过率无关。的取值并未发生变化,因此性别与
2、考试通过率无关。自变量的不同取值在因变量上无差异,两变量无关。自变量的不同取值在因变量上无差异,两变量无关。自变量的不同取值在因变量上有差异,两变量有关。自变量的不同取值在因变量上有差异,两变量有关。表述:统计结果显示,当性别取值不同时,收入变表述:统计结果显示,当性别取值不同时,收入变量的取值发生了变化,因此性别与月收入有关。量的取值发生了变化,因此性别与月收入有关。自变量因变量双变量的关系双变量的关系关系强度测量关系强度测量变量关系强度的含义变量关系强度的含义:指两个变量相关程指两个变量相关程度的高低。统计学中是以准实验的思想度的高低。统计学中是以准实验的思想来分析变量相关的。通常从以下的
3、角度来分析变量相关的。通常从以下的角度分析:分析:A)两变量是否相互独立。两变量是否相互独立。B)两变量是否有共变趋势。两变量是否有共变趋势。C)一变量的变化多大程度上能由另一变一变量的变化多大程度上能由另一变量的变化来解释。量的变化来解释。双变量关系强度测量的主要指标双变量关系强度测量的主要指标双变量的关系双变量的关系关系的性质关系的性质直线相关与曲线相关正相关与负相关完全相关与完全不相关第一节 列联相关一、列联分析的基本原理一、列联分析的基本原理自变量发生变化,因变量取值是否也发自变量发生变化,因变量取值是否也发生变化。生变化。比较边缘百分比和条件百分比的差别比较边缘百分比和条件百分比的差
4、别。列联表的格式列联表的格式自变量因变量人数行百分比列百分比总百分比边缘百分比边缘百分比条件百分比卡方测量的原理卡方测量的原理卡方测量用来考察两变量是否独立(无关)。其原理是根据这一概率定理:若两变量其原理是根据这一概率定理:若两变量无关,则两变量中联合事件发生的概率无关,则两变量中联合事件发生的概率应等于各自独立发生的概率乘积应等于各自独立发生的概率乘积在列联表中,这一定理就具体转化为:在列联表中,这一定理就具体转化为:若两变量无关,则两变量中条件概率应若两变量无关,则两变量中条件概率应等于各自边缘的概率乘积。反之,则两等于各自边缘的概率乘积。反之,则两变量有关,或,两变量不独立。变量有关,
5、或,两变量不独立。示例示例151565 5观察值边缘概率边缘概率边缘概率期望条件概率 9 9-9-9残差由此可见,期望值(独立模型)与观察值期望值(独立模型)与观察值的差距越大,说明两变量越不独立,也就的差距越大,说明两变量越不独立,也就越有相关。越有相关。因此,卡方的表达式如下:卡方的取值在0之间。卡方值越大,关联性越强。在SPSS中,有Pearson X2和相似比卡方(Likelihood Ratio X2)两种。二、二、列联表分析过程主要功能:主要功能:调用列联表分析过程可进行计数资料和某些等级资料的列联表分析,一个行变量和一个列变量可组成一个二维列联表,如再加一个控制变量则可组成一个三
6、维列联表。而多个行、列、控制变量就可组成一个复杂的多维列联表。在分析中可对二维和多维列联表资料进行统计描述和x2检验,并计算相应的百分数指标。此外,还可计算四格表确切概率(Fishers Exact Test),且有单双侧(One-Tail、Ywo-Tail)、对数拟然比检验(Likelihood Ratio)以及线性关系的Mantel-Haenszel x2检验。三、列联表分析过程 列联表分析程序 按Analyze-Descriptive Statistics-Crosstabs 顺序打开 Crosstabs 主对话框。如图431该框中的变量该框中的变量作为分布表中作为分布表中的行变量,必的
7、行变量,必须是数值型或须是数值型或字符型等分类字符型等分类变量。变量。该框中的变量作该框中的变量作为控制变量,决为控制变量,决定频数分布表中定频数分布表中的层,可有多个的层,可有多个控制变量,如要控制变量,如要增加新的控制变增加新的控制变量,按量,按Next 键,键,要修改以前的变要修改以前的变量按量按Previous 键键显示每显示每一组中一组中各变量各变量的分类的分类条形图。条形图。只输出只输出统计量,统计量,不输出不输出多维列多维列联表。联表。见图见图4-32见图见图4-33见图见图4-34图图431 Crosstabs 对话框对话框进行行和列变量相互独立的假进行行和列变量相互独立的假设
8、检验,有多种检验法。(注设检验,有多种检验法。(注)进行相关系数的检验,有两项结果显示:Pearson相关系数和 Spearman相关系数适用于定类变量的统计量:适用于定类变量的统计量:基于卡方检验基础上对相关性的基于卡方检验基础上对相关性的检验检验用来描述相关性用来描述相关性当用自变量预测因变量时,此系当用自变量预测因变量时,此系数反映这种预测降低错误的比率。数反映这种预测降低错误的比率。显示不确定系数,表示用一个变显示不确定系数,表示用一个变量来预测其他变量时降低错误的比量来预测其他变量时降低错误的比率率适用于定序变量:适用于定序变量:Gamma系数反映两个有序变量系数反映两个有序变量间的
9、对称相关性。间的对称相关性。是是Gamma检验的非对称推广。检验的非对称推广。对有序变量和秩变量相关性的对有序变量和秩变量相关性的非参数检验。非参数检验。与与Kendalls tau-c相似相似适用于定序变量:适用于定序变量:用于检验相关性用于检验相关性用于检验两个评估人对同一对象的评估用于检验两个评估人对同一对象的评估是否具有一致系。是否具有一致系。检验某事件发生和某因子之间的关系检验某事件发生和某因子之间的关系进行两个相关的二值变量的非参数检验进行两个相关的二值变量的非参数检验进行一个二值因素变量和一个二值响应进行一个二值因素变量和一个二值响应变量的独立性检验。变量的独立性检验。图432
10、Crosstabs的Statistics 对话框图图433 Crosstabs的的Cell Display 对话框对话框选择在列联表中输出的统计量,选择在列联表中输出的统计量,包括观测量数、百分比、残差包括观测量数、百分比、残差输出观测量的实际数量输出观测量的实际数量如果行和列变量在统计如果行和列变量在统计上是独立的或不相关的,上是独立的或不相关的,那么会在单元格中输出期那么会在单元格中输出期望的观测值的数量。望的观测值的数量。输出单元格中观测量的数目占输出单元格中观测量的数目占整行全部观测量数目的百分比整行全部观测量数目的百分比输出单元格中观测值的数目占输出单元格中观测值的数目占整列全部观测
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 6第六章 相关分析 第六 相关 分析
限制150内