图形→散点图→简单散点图分析→回归分析→线性回归分析分析实例教程文件.ppt
-
资源ID:60891541
资源大小:2.45MB
全文页数:54页
- 资源格式: PPT
下载积分:20金币
快捷下载
会员登录下载
微信登录下载
三方登录下载:
微信扫一扫登录
友情提示
2、PDF文件下载后,可能会被浏览器默认打开,此种情况可以点击浏览器菜单,保存网页到桌面,就可以正常下载了。
3、本站不支持迅雷下载,请使用电脑自带的IE浏览器,或者360浏览器、谷歌浏览器下载即可。
4、本站资源下载后的文档和图纸-无水印,预览文档经过压缩,下载后原文更清晰。
5、试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓。
|
图形→散点图→简单散点图分析→回归分析→线性回归分析分析实例教程文件.ppt
图形散点图简单散点图分析回归分析线性回归分析分析实例学习目标学习目标l能用SPSS做简单相关分析l能用SPSS做简单回归分析一些基本概念一些基本概念l直线相关:直线相关:研究两个变量是否存在直线相关关系,以及关系的密切程度l正相关、负相关、完全相关正相关、负相关、完全相关l相关系数:相关系数:表示相关的密切程度与相关方向的指标,取值范围:-1,1。SPSS中的相关分析过程中的相关分析过程l双变量相关分:双变量相关分:变量之间的两两相关l偏相关分析:偏相关分析:对其他变量控制后的两两相关l距离:距离:同一变量内部观测值或不同变量间的相似性和不相似性15.2 简单相关分析1.积差相关系数(积差相关系数(Pearson相关相关系数)的计算系数)的计算注:积差相关系数严格上仅适用于两变量呈线性相关时。注:积差相关系数严格上仅适用于两变量呈线性相关时。相关系数的检验方法相关系数的检验方法l样本相关系数r 是总体相关系数 的估计值,需进行假设检验。H0:0,两变量间无直线相关关系 H1:0,两变量间有直线相关关系 在SPSS中,直接给出最终的P值。积差相关系数的适用条件积差相关系数的适用条件l积差相关系数适用于线性相关线性相关的情形,且各自均服从正态分布正态分布。l样本中存在的极端值极端值对积差相关系数的计算影响极大,要慎重考虑和处理,必要时可以对其进行剔除,或者加以变量变换。l工具:散点图、直方图、K-S检验等。散点图可以用来发现异常值!散点图可以用来发现异常值!分析实例分析实例l数据文件是corr.sav分析实例分析实例l相关分析用于进行两个/多个变量间的相关分析lSPSS分析过程l图形 散点图 简单散点图l分析 相关分析 双变量相关分析分析实例分析实例l分析结论l进食量和体重增量的相关系数为0.940,P0.01,有统计学意义。Correlations1.940*.0001010.940*1.0001010Pearson CorrelationSig.(2-tailed)NPearson CorrelationSig.(2-tailed)N进食量体重增量进食量体重增量Correlation is significant at the 0.01 level(2-tailed).*.2.秩相关系数秩相关系数l适用情况:不服从双变量正态分布、分布未知、等级资料。lSpearman等级相关用rs表示两变量的相关关系的密切程度及相关方向。l基本思想:将两变量分别从小到大编秩,对秩次进行前述的相关分析。lSPSS分析过程l分析 相关分析 相关分析l相关系数复选框:Spearmanl结论l进食量和体重增量的Spearman相关系数为0.899,P0.01,有统计学意义。Correlations1.000.899*.0001010.899*1.000.000.1010Correlation CoefficientSig.(2-tailed)NCorrelation CoefficientSig.(2-tailed)N进食量体重增量Spearmans rho进食量体重增量Correlation is significant at the 0.01 level(2-tailed).*.Kendalls 等级相关系数等级相关系数Correlations1.000.750*.0031010.750*1.000.003.1010Correlation CoefficientSig.(2-tailed)NCorrelation CoefficientSig.(2-tailed)N进食量体重增量Kendalls tau_b进食量体重增量Correlation is significant at the 0.01 level(2-tailed).*.适用于两个变量均为有序分类的情况!适用于两个变量均为有序分类的情况!15.3 偏相关分析方法原理方法原理l控制其它变量影响的情况下,分析两个变量之间的关系。l偏相关系数:揭示两变量之间的真实联系。分析实例分析实例l例15.2:分析汽车价格和每加仑汽油可行驶公里数的相关关系。教材中的auto.sav。l分析:汽车的自重可影响每加仑汽油可行驶公里数。Correlations1-.469*.539*.000.000747474-.469*1-.807*.000.000747474.539*-.807*1.000.000747474Pearson CorrelationSig.(2-tailed)NPearson CorrelationSig.(2-tailed)NPearson CorrelationSig.(2-tailed)NPriceMileage(mpg)Weight(lbs.)PriceMileage(mpg)Weight(lbs.)Correlation is significant at the 0.01 level(2-tailed).*.利用相关分析得到利用相关分析得到3个变量两两之间的相关关系:个变量两两之间的相关关系:分析实例分析实例lSPSS分析过程l分析分析 相关分析相关分析 偏相关分析偏相关分析l变量框:变量框:price、mpgl控制框:控制框:weightl结论l控制了汽车自重的影响后汽车价格和每加仑汽油可行驶公里数的相关系数r=-0.068,p=0.539,无统计学意义,即汽车价格和每加仑汽油可行驶公里数无相关性,汽车自重为混杂因素。Correlations1.000-.068.567071-.0681.000.567.710CorrelationSignificance(2-tailed)dfCorrelationSignificance(2-tailed)dfPriceMileage(mpg)Control VariablesWeight(lbs.)PriceMileage(mpg)15.4 简单回归分析l研究一个连续性变量(因变量)的取值随着其它变量(自变量)的数值变化而变化的趋势。l通过回归方程解释两变量之间的关系显得更为精确,可以计算出自变量改变一个单位时因变量平均改变的单位数量,这是相关分析无法做到的。l除了描述两变量的关系描述两变量的关系以外,通过回归方程回归方程还可以进行预测预测和控制控制,这在实际工作中尤为重要。la:常数项或截距,即回归直线在y轴上的截距。lb:回归系数,即回归直线的斜率。l残差:y的估计值与实测值的差。如何求解如何求解a、b?l最小二乘法:使各实测点距回归直线的纵向距离的平方和达到最小(y-)2。l系数b是总体回归系数的估计值,需进行假设检验。H0:0l决定系数R2:相关系数的平方。表示应变量的变异中能够通过回归关系被自变量解释的比例。如何求解如何求解a、b?分析实例分析实例l例:上海医科大学儿科医院研究某种代乳粉的营养价值,大白鼠的进食量和体重增量间的关系,试求进食量对体重的线性回归方程。数据文件Corr.sav分析实例分析实例l分析过程:l1.散点图l2.用最小二乘法拟合回归方程l3.对回归系数作假设检验,计算决定系数分析实例分析实例lSPSS分析过程l图形图形 散点图散点图 简单散点图简单散点图l分析分析 回归分析回归分析 线性回归分析线性回归分析分析实例分析实例分析实例分析实例l【应变量】选入回归分析的应变量。l【自变量】选入回归分析的自变量。l【块】l由“上一张”和“下一张”两个按钮组成,用于将下面自变量框中选入的自变量分组。多元回归分析多元回归分析中自变量的选入方式有前进、后退、逐步等方法,如果对不同的自变量选入的方法不同,则用该按钮组将自变量分组选入。分析实例分析实例l【“方法”下拉列表】选择自变量的选入方法,共五种,对自变量框中的所有变量均有效。l强行进入法l逐步法l强制剔除法l向后法l向前法分析实例分析实例l【选择条件】l选入一个筛选变量,并利用右侧的Rules钮建立一个选择条件,则满足该条件的记录才会进入回归分析,功能同数据选择个案。l【个案标签】l选择某一变量,将其取值作为每条记录的标签。最典型的情况是使用记录ID号的变量。l【WLS权重权重】l可利用该按钮扩展当前对话框进行权重最小二乘法的回归分析。分析实例分析实例l【统计量】l回归系数回归系数复选框组:定义回归系数的输出情况,默认只选中Estimates。lEstimates:可输出回归系数B及其标准误,t值、p值、标化回归系数beta;l置信区间:输出每个回归系数的95%可信区间;l协方差矩阵:输出各个自变量的相关矩阵和方差、协方差矩阵。分析实例分析实例l【统计量】l残差残差:用于选择输出残差诊断的信息,可选的有Durbin-Watson残差序列相关性检验、超出规定的n倍标准误的残差列表。l共线性诊断:给出一些用于共线性诊断的统计量,如特征根(Eigenvalues)、方差膨胀因子(VIF)等。分析实例分析实例l【统计量】l模型拟合度模型拟合度:显示模型拟合过程中进入、退出的变量的列表,以及一些有关拟合优度的检验:R,R2和调整的R2,标准误及方差分析表。lR方变化:显示模型拟合过程中R2、F值和p值的改变情况。l描述性描述性:提供一些变量描述,如有效例数、均数、标准差等,同时还给出一个自变量间的相关矩阵。l部分相关和偏相关性:显示自变量间的相关、部分相关和偏相关系数。分析实例分析实例l【绘制绘制】l用于选择需要绘制的回归分析诊断或预测图。可绘制标准化残差的直方图和正态分布图,应变量、预测值和各自变量残差间两两的散点图等。l【保存保存】l用以保存中间结果。分析实例分析实例l【选项】l步进方法标准:设置纳入和排除标准,可按P值或F值来设置。l在等式中包含常量:用于决定是否在模型中包括常数项,默认选中。l缺失值:用于选择对缺失值的处理方式。分析实例分析实例l拟合过程中变量进入/退出模型的情况记录分析实例分析实例l所拟合模型的情况汇总分析实例分析实例l模型的检验结果l实际是标准的方差分析表l回归模型F值为60.197,P值0.01,拒绝H0:b=0分析实例分析实例l模型系数的检验结果分析实例分析实例l结论l回归方程lt=7.759 p0.01l体重与进食量之间存在直线回归关系线性相关与回归的区别线性相关与回归的区别l相关用于说明变量之间的相关关系,回归则说明因变量随自变量变化而变化的数量关系。l方向一致:r和b的正负号一致l假设检验等价:tr=tb,r和b的假设检验的结果相同。l用回归解释相关:决定系数R2练习练习 THE END