最新SPSS操作步骤及解析.doc
《最新SPSS操作步骤及解析.doc》由会员分享,可在线阅读,更多相关《最新SPSS操作步骤及解析.doc(290页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、Four short words sum up what has lifted most successful individuals above the crowd: a little bit more.-author-dateSPSS操作步骤及解析第四章统计描述目录第四章统计描述24.2 频数分析24.3描述性统计量24.4.1(探索性数据分析)操作步骤4第五章 统计推断65.2单样本t检验65.3 两独立样本t检验75.4 配对样本t检验8第六章 方差分析96.2.2 单因素单变量方差分析(One-way ANOVA)(操作步骤)96.3.3 多因素单变量方差分析操作步骤146.3.5
2、不考虑交互效应的多因素方差分析176.3.6 引入协变量的多因素方差分析18第八章 相关分析198.2 连续变量相关分析实例208.3 离散变量相关分析的实例(列联表)22第九章 回归分析249.1.3 线性回归(操作步骤)261多重共线性检验262.使用变量筛选的方法克服多重共线性29二、曲线估计(操作步骤)329.2.5二项Logistic回归(操作步骤)35第十章 聚类分析3910.3.1 K-均值操作步骤:3910.4.1 系统聚类法操作步骤43第十一章 判别分析4711.3.1 操作步骤48第十二章 因子分析5312.2.2操作步骤56第十三章 主成分分析6413.2 操作步骤65第
3、十四章 相应分析6914.2相应分析实例(操作步骤)70第十五章 典型相关分析7515.2操作步骤:75第四章统计描述统计描述是指如何搜集、整理、分析、研究并提供统计资料的理论和方法,用于说明总体的情况和特征。4.1 基本概念和原理4.1.1 频数分布4.1.2 集中趋势指标算数平均值:适用于 定比数据、定距数据中位数:适用于 定比数据、定距数据和定序数据众数:适用于 定比数据、定距数据、定序数据和定类数据4.1.3离散程度指标作用:(1)它可以表明现象的平衡程度和稳定程度;(2)离散性指标可以表明平均指标的代表性,数据离散程度越大,则该分布的平均指标的代表性就越小。方差、标准差、均值标准误差
4、、极差。均值标准误差:也叫抽样标准误差,是样本均值的标准差,反映了样本均值与总体均值之间的差异程度。4.1.4反映分布形态的描述性指标偏度、峰度4.2 频数分析AnalyzeDescriptive StatisticsFrequencies4.3描述性统计量AnalyzeDescriptive StatisticsFrequencies输出结果:4.4 探索性数据分析基本思路:在统计分析时应尽量减少数据中存在的少量异常值对分析结果的影响。只讲Explore命令:(1)异常值检验(2)分布正太性检验(3)方差齐性检验检验各观测变量在控制变量不同水平下的方差是否相等。4.4.1(探索性数据分析)操
5、作步骤AnalyzeDescriptive StatisticsExplore齐性检验第五章 统计推断统计推断内容:参数估计、假设检验。参数估计:研究一个随机变量,推断它的数量特征和变动模式。假设检验:检验随机变量的数量特征和变动模式是否符合事先所做的假设。共同特点:对总体都不很了解,都是利用部分样本所提供的信息对总体的数量特征做出估计或判断。所以,统计推断的过程必定伴有某种程度的不确定性,需要用概率来表示其可靠程度。5.1 参数估计5.2单样本t检验用于对总体均值进行检验。前提:样本来自的总体服从或近似服从正态分布。检验我国上市公司的平均资产负债比是否为0.5AnalyzeCompare m
6、eansOne-Sample T Test,Test value设为0.5上表1给出了资产负债率描述统计量。从表可知,上市公司资产负债率平均为0.4677,标准差为0.16773,均值标准误差为0.00945。上表2给出了单样本t检验结果。从表中可以看到t统计量为-3.413,自由度为314,p值为0.01。由于p值小于显著性水平0.05,所以拒绝上市公司资产负债率平均为0.5的原假设。另外,单样本t检验还5.3 两独立样本t检验对两个不同总体均值之间的差异性(样本均值之差)是否显著进行检验。前提:样本来自的总体服从或近似服从正态分布;两样本相互独立。注意:要检验方差齐性。(自带)Analyz
7、eCompare meansDependent-Sample T Test,输出结果:5.4 配对样本t检验利用来自某两个总体的配对样本,推断两个总体的均值是否存在显著差异。特征:第一,两组样本的样本数相同;第二,两组样本观测值的先后顺序一一对应。例如:检验某学校学生进行培训前后学生学习成绩有无显著变化。两个样本具有一对一的配对关系AnalyzeCompare meansPaird-Sample T Test输出结果:第六章 方差分析也是一种假设检验,它是对全部样本观测值的变动进行分解,将某种控制因素下各组样本的观测值之间可能存在的由该因素导致的系统性误差与随机误差加以比较,据以推断各组样本之
8、间是否存在显著差异。若存在显著差异,则说明该因素对各总体的影响是显著的。l 方差分析的主要目的是通过对方差的比较来检验多个均值之间差异的显著性。l 可以看作t检验的扩展,只比较两个均值时与t检验等价。方差分析有三个基本概念:观测变量、因素和水平。观测变量(因变量):实际测量的、作为结果的变量,是进行方差分析所研究的对象。因素(自变量):作为原因的、把观测结果分成几个组以进行比较的变量,例如奖金水平。水平:因素的不同表现,即每个自变量的不同取值称为因素的水平。根据观测变量的个数分类:单变量方差分析和多变量方差分析;根据因素的个数分类:单因素方差分析和多因素方差分析。l 只有一个因素变量的方差分析
9、称为单因素方差分析。l 研究多个因素变量对因变量的影响的方差分析称为多因素方差分析,其中最简单的情况是双因素方差分析。 6.2 单因素单变量方差分析(One-way ANOVA)l 单因素方差分析:模型中有一个自变量(因素)和一个观测变量。l 其实就是关于在一个影响因素的不同水平下,观测变量均值差异的显著性检验。SST=SSB+SSESST:观测变量的总离差平方和SSB:组间离差平方和SSE:组内离差平方和方差分析需满足的假设条件:l 样本是独立的随机样本。l 各样本皆来自正态总体。对于因素的每一个水平,其观察值是来自服从正态分布总体的简单随机样本。l 总体方差具有齐性,即各总体方差相等。各组
10、观察数据是从具有相同方差的总体中抽取的。某汽车经销商为研究东部、西部和中部地区市场上汽车销量是否存在显著差异原假设:H0:6.2.2 单因素单变量方差分析(One-way ANOVA)(操作步骤)AnalyzeCompare meansOne-Way ANOVA输出结果:(假设一般为没有显著性差异)描述表给出了不同地区汽车 销量的基本描述统计量已经95%的置信区间,从表中可以看出,东部地区汽车平均销量最高,中部地区销量尚可,西部销量最低。销量N均值标准差标准误均值的 95% 置信区间极小值极大值下限上限西10157.9022.2787.045141.96173.84120194中9176.44
11、19.7176.572161.29191.60135198东7196.1430.92711.689167.54224.75145224总数26174.6227.8455.461163.37185.86120224方差齐性检验销量Levene 统计量df1df2显著性1.262223.302Levene统计量对应的p值大于0.05,可得不同地区汽车销量满足方差齐性ANOVA销量平方和df均方F显著性组间(组合)6068.17423034.0875.241.013单因素方差分析表中,p=0.0130.05,接受原假设,即东西部地区汽车的平均销量与中部地区汽车平均销量没有显著差异不假设等方差1138
12、.20a15.1489.12314.551.0002.589.474.06118.114.952a. 对比系数总和不为零。在此之后检验多重比较因变量:销量(I) 地区(J) 地区均值差 (I-J)标准误显著性95% 置信区间下限上限LSD方差齐性下看LSD西中-18.54411.055.107-41.414.33东-38.243*11.858.004-62.77-13.71中西18.54411.055.107-4.3341.41东-19.69812.126.118-44.785.39东西38.243*带“*”号的表示销量有显著差异,由p值也可以看出。11.858.00413.7162.77中1
13、9.69812.126.118-5.3944.78Tamhane西中-18.5449.635.199-44.056.96东-38.24313.648.054-77.10.61中西18.5449.635.199-6.9644.05东-19.69813.410.436-58.3118.91东西38.24313.648.054-.6177.10中19.69813.410.436-18.9158.31*. 均值差的显著性水平为 0.05。折线图可直观看出各个因素水平下汽车平均销量情况:东部地区汽车平均销量最高,中部地区销量尚可,西部销量最低。6.3 多因素单变量方差分析同时研究多种因素对观测变量的影响
14、,就是多因素方差分析。例如,研究汽车销量问题,对汽车销量的影响很可能不仅受地区因素的影响,还受广告、居民收入以及消费偏好等其他因素的影响。交互效应:各个因素不同水平的搭配所产生的新的影响。主效应:各个因素对观测变量的单独影响。SST:观测变量的总变动SSA:因素A引起的观测变量的变动SSB:因素B引起的观测变量的变动SSAB:因素A和因素B的交互效应引起的观测变量的变动SSE:随机因素引起的观测变量的变动如果其中某种因素引起的观测变量的变动占观测变量总变动的比例足够大,则可以认为该因素变量对观测变量的影响是显著的。6.3.2 固定效应、随机效应和协变量根据可控性分为:固定效应、随机效应固定效应
15、:因素变量的各个水平可以严格控制,它们对观测变量的影响是固定的。如产品定价、广告类型。随机效应:因素变量的各个水平无法严格控制,它们对观测变量的影响是随机的。如气候条件等。协变量:像居民收入这样的无法控制其水平的连续型变量在方差分析中通常叫做协变量。6.3.3 操作步骤1. 提出零假设和备择假设。双因素方差分析可以同时检验两组或三组零假设和备择假设。要说明因素A有无显著影响,就是检验如下假设:H0:因素A不同水平下观测变量的总体均值无显著差异。H1:因素A不同水平下观测变量的总体均值存在显著差异。要说明因素B有无显著影响,就是检验如下假设:H0:因素B不同水平下观测变量的总体均值无显著差异。H
16、1:因素B不同水平下观测变量的总体均值存在显著差异。在有交互效应的双因素方差中,要说明两个因素的交互效应是否显著,还要检验第三组零假设和备择假设:H0:因素A和因素B的交互效应对观测变量的总体均值无显著差异。H1:因素A和因素B的交互效应对观测变量的总体均值存在显著差异。假设6.3.3 多因素单变量方差分析操作步骤AnalyzeGeneral Linear ModelUnivariate点击“添加”模型、对比、两两比较、保存、Boo-默认值结果输出:主体间因子值标签N地区1西102中93东7广告1828310描述性统计量从表中可以看出,平均来看,东部地区并且采用第一种广告的汽车销量最高,达到2
17、24;而西部地区采用第三种广告的汽车销售量最低,平均只有130辆。因变量:销量地区广告均值标准 偏差N西1179.3313.31732162.757.13643130.008.7183总计157.9022.27810中1193.338.08332174.007.07123165.0022.6424总计176.4419.7179东1224.00.00022198.5010.60723176.0037.7233总计196.1430.9277总计1195.7520.38082174.5016.98783157.8029.91810总计174.6227.84526误差方差等同性的 Levene 检验a
18、因变量:销量Fdf1Df2Sig.2.495817.054Levene 方差齐性检验结果显示:p=0.054,在0.05的显著水平下,无法拒绝方差在不同因素水平下满足方差齐性的原假设,而在在0.1的显著水平下则应拒绝原假设,即认为不同地区和广告类型的汽车销量方差存在显著差异。检验零假设,即在所有组中因变量的误差方差均相等。a. 设计 : 截距 + region + ad + region * ad主体间效应的检验因变量:销量源III 型平方和df均方FSig.校正模型14047.571a81755.9465.594.001截距770802.5521770802.5522455.437.000r
19、egion7149.78123574.89111.388.001ad7625.70823812.85412.146.001地区和广告类型对销售量的影响都比较显著,但地区和广告类型的交互效应却不并不显著。这一点下图也可以直观的看出region * ad637.7414159.435.508.731误差5336.58317313.917总计812138.00026校正的总计19384.154(以上三个之和)25a. R 方 = .725(调整 R 方 = .595)Corrected 本模型Corrected Model对应的统计量为5.594,p值为0.0010.05,可决系数为0.725,说明
20、模型整体对观测变量有一定的解释能力。修正可决系数只有0.596,说明模型的拟合程度还不够理想,可能还有某个显著影响销售量的变量没有引入进来。Model:用户建立的模型能够解释的变差。有两种方法可以衡量用户建立的模型对观测变量的解释程度:一是通过观察Corrected Model对应的F统计量和p值;二是通过观察Corrected Model和Corrected Total对应变差的比值,即可决系数(R Squared)。当引入的因素较多时,应该观察修正的可决系数(Adjusted R Squared)。本模型Corrected Model对应的统计量为5.594,p值为0.0010.05,可决
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 最新 SPSS 操作 步骤 解析
限制150内