欢迎来到淘文阁 - 分享文档赚钱的网站! | 帮助中心 好文档才是您的得力助手!
淘文阁 - 分享文档赚钱的网站
全部分类
  • 研究报告>
  • 管理文献>
  • 标准材料>
  • 技术资料>
  • 教育专区>
  • 应用文书>
  • 生活休闲>
  • 考试试题>
  • pptx模板>
  • 工商注册>
  • 期刊短文>
  • 图片设计>
  • ImageVerifierCode 换一换

    统计分析软件SPSS详细教程.docx

    • 资源ID:36223450       资源大小:13.76MB        全文页数:36页
    • 资源格式: DOCX        下载积分:20金币
    快捷下载 游客一键下载
    会员登录下载
    微信登录下载
    三方登录下载: 微信开放平台登录   QQ登录  
    二维码
    微信扫一扫登录
    下载资源需要20金币
    邮箱/手机:
    温馨提示:
    快捷下载时,用户名和密码都是您填写的邮箱或者手机号,方便查询和重复下载(系统自动生成)。
    如填写123,账号就是123,密码也是123。
    支付方式: 支付宝    微信支付   
    验证码:   换一换

     
    账号:
    密码:
    验证码:   换一换
      忘记密码?
        
    友情提示
    2、PDF文件下载后,可能会被浏览器默认打开,此种情况可以点击浏览器菜单,保存网页到桌面,就可以正常下载了。
    3、本站不支持迅雷下载,请使用电脑自带的IE浏览器,或者360浏览器、谷歌浏览器下载即可。
    4、本站资源下载后的文档和图纸-无水印,预览文档经过压缩,下载后原文更清晰。
    5、试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓。

    统计分析软件SPSS详细教程.docx

    10.11统计分析软件&SPSS建立数据目录10.11统计分析软件&SPSS建立数据110.25数据加工作图111. 08绘图解答&描述性分析:32.描述性统计分析:3四格表卡方检验:(检验某个连续变量的分布是否与某种理论分布一致, 如是否符合正态分布)7第七章 非参数检验101.单样本的非参数检验10(1)卡方检验10(2)二项分布检验122.两独立样本的非参数检验133.多独立样本的非参数检验164.两相关样本的非参数检验165.多相关样本的非参数检验17第五章 均值检验与T检验201.Means过程(均值检验)(204. 单样本T检验215. 两独立样本T检验226.两配对样本T检验23第六章 方差分析25单因素方差分析:25多因素方差分析:2910.25数据加工作图1.Excel中随机取值:=randbetween(55,99)2.SPSS中新建数据,一列40个,正态分布随机数:先在40那里随便输入一个数 表示选择40个可用的,然后按一下操作步骤:3.排序:个案排秩4.数据选取:数据-选择个案-如果条件满足:计算新变量:5.频次分析:分析-统计描述-频率还原:个案-全部6.加权:还原7.画图:11. 08绘图解答&描述性分析:1.课后题:长条图2.描述性统计分析:(1) 频数分析:(2) 描述性分析:描述性统计分析没有图形功能,也不能生成频数表,但描述性分析可以将原始数据转换成标准化得分,并以变量形式存入数据文件中,以便后续分析时应用。操作:分析描述性分析:然后对结果进行筛选,去掉异常值,就得到标准化的数据: 任何形态的数据经过Z标准化处理之后就会是正态分布的<错误!标准化是等比例缩放的,不会改变数据的原始分布状态,(3) 探索分析:(检验是否是正态分布:茎叶图、箱图)实例:操作:(4) 交叉列联表(探索定类型的变量间的相关性):【纯数值的变量用回归分析,名义变量用交叉分析】操作:实例:四格表卡方检验:(检验某个连续变量的分布是否与某种理论分布一致, 如是否符合正态分布)例子:第1步 建立数据文建:第2步:对数据进行预处理;(给数据加权)第3步 进行卡方检验:第4步 结果分析P0.011<0.05, 则在5%显著性水平下拒绝原假设, 差异有显著性意义,即药物加化疗与单用药物治疗癌症的疗效有显著性差异。如何选sig值:期望值就是T 是理论频数 N是样本数量(合计)对应:1)选第一个:2)选3)选配对卡方检验:第1步 建立数据文建:第2步 对数据进行加权处理第3步 进行配对卡方检验结果分析:第七章 非参数检验使用情况:在总体分布未知的情况下用非参数检验,分布已知用参数检验。1.单样本的非参数检验(1)卡方检验分析步骤Ø 第1 步 提出零假设:卡方检验的零假设H0是“总体服从某种理论分布”,其对立假设H1是“总体不服从某种理论分布”。Ø 第2步 选择检验统计量:卡方分布选择的是Pearson卡方统计量。已证明,当n充分大时,它近似地服从自由度为k-1的卡方分布。Ø 第3步 计算检验统计量的观测值和概率p值。Ø 第4步 给出显著性水平,作出决策。 实例:某公司质检负责人欲了解企业一年内出现的次品数是否均匀分布在一周的五个工作日中,随机抽取了90件次品的原始记录,其结果如下表,问该企业一周内出现的次品数是否均匀分布在一周的五个工作日中?( ) 工作日12345次品数251581626第1步 分析:由于考虑的是次品是否服从均匀分布的问题,考虑用卡方检验。 第2步 数据的组织:数据分成两列,一列是工作日,其变量名为“weekday”,另一列是次品数,变量名为“number”,输入数据并保存。第3步 加权设置:将变量“number”定义为权变量。第4步 进行卡方检验:Ø 第5步 主要结果及分析左表是频数分布情况表,第二列为实际观察值出现次数,第三列为理论上每天应出现的次数,第四列为残差右表是计算的卡方统计量及对应的相伴概率值,由于Sig.=0.014<0.05。说明应拒绝每个工作日出现的次品率相等的原假设。即次品数出现是不均匀的。(2)二项分布检验【例7-2】某地某一时期内出生35名婴儿,其中女性19名(定Sex=0),男性16名(定Sex=1)。问这个地方出生婴儿的性别比例与通常的男女性比例(总体概率约为0.5)是否不同?第1步 分析:由于性别分为男与女两种状态,故应用二项分布检验。第2步 数据的组织:数据分成两列,其变量名为“性别”,“频数”。输入数据并保存。进行加权处理。第3步 进行二项分布检验:第4步 主要结果及分析从上表可知,相伴概率Sig.=0.736>0.05,因此没有理由拒绝零假设。这说明此地新生儿男女比例与通常的男女比例相同。2.两独立样本的非参数检验【例7-3】 某公司希望了解两种品牌汽油A和B每加仑的行驶里程是否有区别,表7.15是两种品牌汽油每加仑的行驶里程数,在显著性水平0.05下,判断两个品牌间是否存在显著性差异?A30.428.729.232.531.729.530.831.130.731.8B33.529.830.131.433.830.931.329.632.833第1步 分析:由于是两种品牌的汽油,可以认为是两个独立样本,但行驶里程数根本不知道服从何种分布,可用两独立样本的非参数检验进行分析。第2步 数据组织:由于独立样本的非参数检验所检验的数据只有一列,故应将A,B数据组织成一列,用另一列来区分A和B,作分组变量。第3步 进行独立样本的非参数检验双尾检验的相伴概率为0.151,大于0.05,说明两种汽油无显著性差异。两个相伴概率都大于显著性水平0.05,因此应接受零假设,认为两种汽油之间无显著性差异。Kolmogorov-Smirnov Z值为0.894,相伴概率值为0.400,大于显著性水平0.05,因此应接受两种汽油之间无显著性差异的原假设;根据游程检验计算的Z统计量为-1.149,对应在单尾显著性概率为0.128,大于显著性水平,因此应接受两种汽油之间无显著性差异的原假设。从以上四种检验方法所得到的结果是相同的,即两种汽油之间无显著性差异。3.多独立样本的非参数检验4.两相关样本的非参数检验某企业提出了一项新工艺,为了检验新工艺是否能降低单位成本,随机抽取16个工人分别用新旧工艺生产产品,测得单位成本资料如下表,请在显著性水平0.05下检验是否新工艺降低了成本? new25121422211722161718192422152223old18171619241928182224223025202421第1步 分析:由于是同一批工人和同一批机器,其先后的成本是相关的,同时也不知数据的分布情况,故应用两相关样本的非参数检验。第2步 数据组织:数据分成两列,第一列为新工艺的成本,第二列为旧工艺的成本。第3步 两相关样本的非参数检验 :设置如下图Z统计量为-2.160,相伴概率为0.031,小于显著水平0.05,故应拒绝原假设,即认为两样本不是来自于同一总体,说明有差异,新工艺可省成本。结果分析:Z统计量为-2.160,相伴概率为0.031,小于显著水平0.05,故应拒绝原假设,即认为两样本不是来自于同一总体,说明有差异,新工艺可省成本。 其相伴概率为0.021,小于0.05,说明新工艺与旧工艺有显著性差异,这与Wilxocon检验结果是一致的。5.多相关样本的非参数检验某文艺晚会有5个节目,共有5个评委参与打分,其数据如下表。问这5个评委的判断标准是否一致 。节目1节目2节目3节目4节目5评委18.758.258.898.5评委2109.59.58.99.5评委39.69.19.18.59.6评委49.28.58.99.19.4评委59.659.29.19.18.9第1步 分析:由于5个评委打分是分别针对同一个节目,所以数据之间具有相关性,同时不知道数据所服从的分布,可以采用多相关样本的非参数检验。第2步 数据组织:由于是分析的评委之间的评判标准是否一致,故应将每个评委所打的分各分成一列。第3步 多相关样本的非参数检验:结果分析:卡方值为9.102,自由度为4,相伴概率为0.059>0.05,故应认为5个评委打分是一致的。卡方值为9.102,自由度为4,相伴概率为0.059>0.05,也应认为5个评委的打分具有一致性,这与Friedman检验具有一致性。非参数检验与卡方检验比较:卡方检验是 数据总体是服从什么样的分布(都是 频次的方式呈现出来的)非参数检验 是总体分布情况未知第五章 均值检验与T检验 参数检验必须说明,他是服从某种分布的实例:1.Means过程(均值检验)(与非参检验比较)非参检验中的二项式检验,但是只能是两个变量。第1步 数据组织; 根据表5.1生成SPSS数据文件,建3个变量:“sex”、“edu”、“num”, 数据文件的部分数据如图5-3所示。3、实例分析第2步 打开主对话框;选择分析 比较均值 均值,打开同图5-1一样的均值过程主对话框。第3步 确定要进行均值比较的变量;在图5-1的对话框中,从左边的候选变量列表框中选择“人口数量(num)”变量,移入“因变量列表”文本框中,表示对该变量进行均值比较分析。第4步 确定分组变量;分组变量可以有几层,选择“性别(sex)”变量作为第一层分组变量,将其移入“自变量列表”文本框中。第5步 确定输出的统计量;单击图5-1上的选项按钮,弹出如图所示的子对话框,选择方差和eta复选框,进行方差分析,单击继续按钮,返回主对话框。结果分析:此表是性别的单因素方差分析。表中的Sig.值远大于0.05,说明不同性别受教育的人口数量没有显著性差异。 人口数量与性别的相关性度量表。此时的Eta和Eta方 取值都很小,说明性别和受教育的人口数量的相关性很差,这也和单因素方差分析表的结论是一致的。4. 单样本T检验(它是对总体均值的假设检验)【例5-2】某生产食盐的生产线,其生产的袋装食盐的标准重量为500g,现随机抽取10袋,其重量分别为:495,502,508,496,505,499,503,498,505,500。假设数据总体呈正态分布,请检验生产线的工作情况。第1步 数据组织;首先建立SPSS数据文件,只需建立一个变量“Weight”,录入相应的数据即可。第2步 打开主对话框; 选择分析 比较均值 单样本T检验,打开同图5-3一样的单样本T检验主对话框。第3步 确定要进行T检验的变量; 在图5-3所示的对话框中,选择“Weight”变量作为检验变量,移入“检验变量”框中。第4步 输入要检验的值; 在图5-4的对话框中的“检验值”中输入要检验的值,本例应输入500。单样本T检验结果表,第一行的Test Value为检验参数值500,即用于比较的总体均值,下面从左至右依次为检验统计量(t)、自由度(df)、双尾检测概率P值(Sig.(2-tailed))、样本均值与和检验值的差(Mean Difference)、均值差的95%置信区间(95%Confidence Interval of the Difference)。 当置信水平为95%时,显著性水平为0.05,从表中可以看出,双尾检测概率P值为0.432,大于0.05,故零假设成立,也就是说抽样袋装食盐的重量与500克无显著性差异,有理由相信生产线工作状态正常。5. 两独立样本T检验【例5-3】为比较两种不同品种的玉米的产量,分别统计了8个地区的单位面积产量,具体数据见表5.8。假定样本服从正态分布,且两组样本相互独立,试比较在置信度为95%的情况下,两种玉米产量是否有显著性差异。第1步 数据组织;根据表5.8,SPSS数据文件中建立两个变量,分别为“品种”、“产量”,变量“品种”的变量值标签为:a-品种A,b-品种B,录入数据即可。第2步 打开主对话框;选择分析 比较均值独立样本T检验 ,打开同图5-4一样的两独立样本T检验主对话框。第3步 确定要进行T检验的变量;在图5-4所示的对话框中,选择“产量”变量作为检验变量,移入“检验变量”框中。第4步 确定分组变量;选择变量“品种”作为分组变量,将其移入图5-4中的“分组变量”文本框中,并定义分组的变量值:Group11,Group22。结果分析:首先做2个样本方差的齐性检验。上图中sig.=0.752>0.05,因此认为2个样本方差不存在差异,可以按照P=0.332取值。在显著性水平为0.05的情况下,T统计量的概率p值大于0.05,故不应拒绝零假设,,即认为两样本的均值是相等的,在本例中,不能认为两种玉米品种的产量有显著性差异。6.两配对样本T检验3、实例分析【例5-4】以下是某大学跆拳道选手15人的平衡训练的数据,统计实验前、后平衡训练成绩是否有差异。训练前:86,77,59,79,90,68,85,94,66,72,75,72,69,85,88训练后:78,81,76,92,88,76,93,87,62,84,87,95,88,87,80第1步 数据组织; 首先建立SPSS数据文件,建立两个变量:“训练前”、“训练后”,录入相应数据。第2步 打开主对话框;选择分析 比较均值 配对样本T检验,打开同图5-5一样的配对样本T检验主对话框。第3步 确定配对分析的变量;将变量“训练前”和“训练后”添加到“成对变量”框中,作为第一对分析的配对变量。两配对样本T检验的简单相关关系及其检验结果。表中第3列为训练前和训练两样本的相关系数,第4列是相关系数的检验p值。从表中可以看出,在显著性水平为0.05时,训练前后的概率p值为0.132,大于0.05,接受零假设,可以认为训练前后的成绩没有明显的线性关系。由于概率p值为0.041,小于0.05,拒绝零假设,可以认为训练前后对成绩有显著效果。第六章 方差分析单因素方差分析:用四种饲料喂猪,共19头分为四组,每一组用一种饲料。一段时间后称重,猪体重增加数据如下表所示,比较四种饲料对猪体重增加的作用有无不同。饲料A饲料B饲料C饲料D133.8151.2193.4225.8125.3149.0185.3224.6143.1162.7182.8220.4128.9143.8188.5212.3135.7153.5198.6第1步 分析:由于考虑的是一个控制变量(饲料)对一个观测变量(猪体重)的影响,而且是4种饲料,所以不适宜用独立样本T检验(仅适用两组数据),应采用单因素方差分析。第2步 数据的组织:数据分成两列,一列是猪的体重,变量名为“weight”,另一变量是饲料品种(变量值分别为1,2,3,4),变量名为“fodder”,输入数据并保存。 第3步 方差相等的齐性检验:由于方差分析的前提是各个水平下(这里是不同的饲料folder影响下的体重weight)的总体服从正态分布,且各组方差具有齐性。其中正态分布的要求并不是很严格,但对于方差相等的要求是比较严格的,因此必须对方差相等的前提进行检验。 方差齐性检验的方法:打开分析比较均值单因素ANOVA选项,在“方差同质性检验”前打钩就可以了。方差齐性检验的方法:方差齐性检验的H0假设是:方差相等。从上表可看出相伴概率Sig.=0.995>(0.05)说明应该接受H0假设(即方差相等)。故下面就用方差相等的检验方法。上表是几种饲料方差分析的结果,组间(Between Groups)平方和(Sum of Squares)为20538.698,自由度(df)为3,均方为6846.233;组内(Within Groups)平方和为652.159,自由度为15,均方为43.477;F统计量为157.467。由于组间比较的相伴概率Sig.(p值)=0.000<0.05,故应拒绝H0假设(四种饲料喂猪效果无显著差异),说明四种饲料对养猪的效果有显著性差异。从整个表反映出来四种饲料相互之间均存在显著性差异,从效果来看是第4种最好,其次是第3种,第1种最差。多因素方差分析:研究一个班三组不同性别的同学(分别接受了三种不同的教学方法)在数学成绩上是否有显著差异,数据如下表。姓名数学组别性别姓名数学组别性别张青华990m郭晓艳992m王洁云880f李福利702f吴凌风990m罗帆892m刘行890m宋丽君551f马萌940f辛瑞晶501m单玲玲900m王滢滢671f罗超波792m蔡春江671m尹珣562f武佳琪561f张敏892m陈雪吟561m第1步 分析:需要研究不同教学方法和不同性别对数学成绩的影响。这是一个多因素(双因素)方差分析问题。第2步 数据组织:如上表的变量名组织成4列数据。第3步 变量设置:方差齐性检验第4步 设置方差齐性检验:由于方差分析要求不同组别数据方差相等,故应进行方差齐性检验,选中“选项”中的“方差齐性检验” ,显著性水平设为默认值0.05。第5步 设置控制变量的多重比较分析:第6步 选择建立多因素方差分析的模型种类:打开“模型”对话框,本例用默认的“全因子”模型。此项为系统默认的模型类型。该项选择建立全模型。全模型包括所有因素变量的主效应和所有的交互效应。例如有三个因素变量,全模型包括三个因素变量的主效应、两两的交互效应和三个因素的交互效应。结果分析:表示了各控制因素的个案数,即分组描述情况。是进行方差齐性检验的结果,可以看出方差无显著差异。在全因子模式下,得到了2个因子的各自主效应以及两者的交互效应的显著度。这里只看交互效应的显著度为0.019<0.05,说明在不同性别和组别的组合上存在对成绩的附加影响。不同教学方法的比较,由于在前面检验方差具有齐性,故这里仅看LSD部分。再来单独分析2个因素中,在控制了一个因素的影响后,另一个因素是否有显著性影响。只需在模型选择中进行修改可以看到:在控制了组别因素的影响后,性别因素主效应的显著度P=0.079>0.05,因此性别因素单独作用下对成绩没有显著性影响。相反,组别因素单独作用下对成绩具有显著性影响。

    注意事项

    本文(统计分析软件SPSS详细教程.docx)为本站会员(叶***)主动上传,淘文阁 - 分享文档赚钱的网站仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知淘文阁 - 分享文档赚钱的网站(点击联系客服),我们立即给予删除!

    温馨提示:如果因为网速或其他原因下载失败请重新下载,重复下载不扣分。




    关于淘文阁 - 版权申诉 - 用户使用规则 - 积分规则 - 联系我们

    本站为文档C TO C交易模式,本站只提供存储空间、用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。本站仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知淘文阁网,我们立即给予删除!客服QQ:136780468 微信:18945177775 电话:18904686070

    工信部备案号:黑ICP备15003705号 © 2020-2023 www.taowenge.com 淘文阁 

    收起
    展开