统计分析软件SPSS详细教程.docx
《统计分析软件SPSS详细教程.docx》由会员分享,可在线阅读,更多相关《统计分析软件SPSS详细教程.docx(36页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、10.11统计分析软件&SPSS建立数据目录10.11统计分析软件&SPSS建立数据110.25数据加工作图111. 08绘图解答&描述性分析:32.描述性统计分析:3四格表卡方检验:(检验某个连续变量的分布是否与某种理论分布一致, 如是否符合正态分布)7第七章 非参数检验101.单样本的非参数检验10(1)卡方检验10(2)二项分布检验122.两独立样本的非参数检验133.多独立样本的非参数检验164.两相关样本的非参数检验165.多相关样本的非参数检验17第五章 均值检验与T检验201.Means过程(均值检验)(204. 单样本T检验215. 两独立样本T检验226.两配对样本T检验23
2、第六章 方差分析25单因素方差分析:25多因素方差分析:2910.25数据加工作图1.Excel中随机取值:=randbetween(55,99)2.SPSS中新建数据,一列40个,正态分布随机数:先在40那里随便输入一个数 表示选择40个可用的,然后按一下操作步骤:3.排序:个案排秩4.数据选取:数据-选择个案-如果条件满足:计算新变量:5.频次分析:分析-统计描述-频率还原:个案-全部6.加权:还原7.画图:11. 08绘图解答&描述性分析:1.课后题:长条图2.描述性统计分析:(1) 频数分析:(2) 描述性分析:描述性统计分析没有图形功能,也不能生成频数表,但描述性分析可以将原始数据转
3、换成标准化得分,并以变量形式存入数据文件中,以便后续分析时应用。操作:分析描述性分析:然后对结果进行筛选,去掉异常值,就得到标准化的数据: 任何形态的数据经过Z标准化处理之后就会是正态分布的错误!标准化是等比例缩放的,不会改变数据的原始分布状态,(3) 探索分析:(检验是否是正态分布:茎叶图、箱图)实例:操作:(4) 交叉列联表(探索定类型的变量间的相关性):【纯数值的变量用回归分析,名义变量用交叉分析】操作:实例:四格表卡方检验:(检验某个连续变量的分布是否与某种理论分布一致, 如是否符合正态分布)例子:第1步 建立数据文建:第2步:对数据进行预处理;(给数据加权)第3步 进行卡方检验:第4
4、步 结果分析P0.0110.05, 则在5%显著性水平下拒绝原假设, 差异有显著性意义,即药物加化疗与单用药物治疗癌症的疗效有显著性差异。如何选sig值:期望值就是T 是理论频数 N是样本数量(合计)对应:1)选第一个:2)选3)选配对卡方检验:第1步 建立数据文建:第2步 对数据进行加权处理第3步 进行配对卡方检验结果分析:第七章 非参数检验使用情况:在总体分布未知的情况下用非参数检验,分布已知用参数检验。1.单样本的非参数检验(1)卡方检验分析步骤 第1 步 提出零假设:卡方检验的零假设H0是“总体服从某种理论分布”,其对立假设H1是“总体不服从某种理论分布”。 第2步 选择检验统计量:卡
5、方分布选择的是Pearson卡方统计量。已证明,当n充分大时,它近似地服从自由度为k-1的卡方分布。 第3步 计算检验统计量的观测值和概率p值。 第4步 给出显著性水平,作出决策。 实例:某公司质检负责人欲了解企业一年内出现的次品数是否均匀分布在一周的五个工作日中,随机抽取了90件次品的原始记录,其结果如下表,问该企业一周内出现的次品数是否均匀分布在一周的五个工作日中?( ) 工作日12345次品数251581626第1步 分析:由于考虑的是次品是否服从均匀分布的问题,考虑用卡方检验。 第2步 数据的组织:数据分成两列,一列是工作日,其变量名为“weekday”,另一列是次品数,变量名为“nu
6、mber”,输入数据并保存。第3步 加权设置:将变量“number”定义为权变量。第4步 进行卡方检验: 第5步 主要结果及分析左表是频数分布情况表,第二列为实际观察值出现次数,第三列为理论上每天应出现的次数,第四列为残差右表是计算的卡方统计量及对应的相伴概率值,由于Sig.=0.0140.05,因此没有理由拒绝零假设。这说明此地新生儿男女比例与通常的男女比例相同。2.两独立样本的非参数检验【例7-3】 某公司希望了解两种品牌汽油A和B每加仑的行驶里程是否有区别,表7.15是两种品牌汽油每加仑的行驶里程数,在显著性水平0.05下,判断两个品牌间是否存在显著性差异?A30.428.729.232
7、.531.729.530.831.130.731.8B33.529.830.131.433.830.931.329.632.833第1步 分析:由于是两种品牌的汽油,可以认为是两个独立样本,但行驶里程数根本不知道服从何种分布,可用两独立样本的非参数检验进行分析。第2步 数据组织:由于独立样本的非参数检验所检验的数据只有一列,故应将A,B数据组织成一列,用另一列来区分A和B,作分组变量。第3步 进行独立样本的非参数检验双尾检验的相伴概率为0.151,大于0.05,说明两种汽油无显著性差异。两个相伴概率都大于显著性水平0.05,因此应接受零假设,认为两种汽油之间无显著性差异。Kolmogorov-
8、Smirnov Z值为0.894,相伴概率值为0.400,大于显著性水平0.05,因此应接受两种汽油之间无显著性差异的原假设;根据游程检验计算的Z统计量为-1.149,对应在单尾显著性概率为0.128,大于显著性水平,因此应接受两种汽油之间无显著性差异的原假设。从以上四种检验方法所得到的结果是相同的,即两种汽油之间无显著性差异。3.多独立样本的非参数检验4.两相关样本的非参数检验某企业提出了一项新工艺,为了检验新工艺是否能降低单位成本,随机抽取16个工人分别用新旧工艺生产产品,测得单位成本资料如下表,请在显著性水平0.05下检验是否新工艺降低了成本? new251214222117221617
9、18192422152223old18171619241928182224223025202421第1步 分析:由于是同一批工人和同一批机器,其先后的成本是相关的,同时也不知数据的分布情况,故应用两相关样本的非参数检验。第2步 数据组织:数据分成两列,第一列为新工艺的成本,第二列为旧工艺的成本。第3步 两相关样本的非参数检验 :设置如下图Z统计量为-2.160,相伴概率为0.031,小于显著水平0.05,故应拒绝原假设,即认为两样本不是来自于同一总体,说明有差异,新工艺可省成本。结果分析:Z统计量为-2.160,相伴概率为0.031,小于显著水平0.05,故应拒绝原假设,即认为两样本不是来自于
10、同一总体,说明有差异,新工艺可省成本。 其相伴概率为0.021,小于0.05,说明新工艺与旧工艺有显著性差异,这与Wilxocon检验结果是一致的。5.多相关样本的非参数检验某文艺晚会有5个节目,共有5个评委参与打分,其数据如下表。问这5个评委的判断标准是否一致 。节目1节目2节目3节目4节目5评委18.758.258.898.5评委2109.59.58.99.5评委39.69.19.18.59.6评委49.28.58.99.19.4评委59.659.29.19.18.9第1步 分析:由于5个评委打分是分别针对同一个节目,所以数据之间具有相关性,同时不知道数据所服从的分布,可以采用多相关样本的
11、非参数检验。第2步 数据组织:由于是分析的评委之间的评判标准是否一致,故应将每个评委所打的分各分成一列。第3步 多相关样本的非参数检验:结果分析:卡方值为9.102,自由度为4,相伴概率为0.0590.05,故应认为5个评委打分是一致的。卡方值为9.102,自由度为4,相伴概率为0.0590.05,也应认为5个评委的打分具有一致性,这与Friedman检验具有一致性。非参数检验与卡方检验比较:卡方检验是 数据总体是服从什么样的分布(都是 频次的方式呈现出来的)非参数检验 是总体分布情况未知第五章 均值检验与T检验 参数检验必须说明,他是服从某种分布的实例:1.Means过程(均值检验)(与非参
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 统计分析 软件 SPSS 详细 教程
限制150内