《SPSS统计分析软件实验报告.docx》由会员分享,可在线阅读,更多相关《SPSS统计分析软件实验报告.docx(42页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、SPSS统计分析软件实验报告实验报告二实验工程:描述性统计分析基本操作训练:(一)频率过程(二)描述过程(三)探索过程(四)交叉表过程实验目的:1、掌握数据集中趋势和离中趋势的分析方法;2、熟练掌握各个分析过程的基本步骤以及彼此之间的联系和区别。实验内容:(一)频率过程频数分布表是描述性统计中最常用的方法之一,Frequencies过程就是专门 为产生频数表而设计的。它不仅可以产生详细的频数表,还可以按要求给出某百 分位点的数值,以及常用的条图,圆图等统计图。和国内常用的频数表不同,几乎所有统计软件给出的均是详细频数表,即并 不按某种要求确定组段数和组距,而是按照数值精确列表。如果想用频率过程
2、得 到我们所熟悉的频数表,请先用第二章学过的Recode过程产生一个新变量来代 表所需的各组段。1 .界面说明频率对话框的界面如下所示:2 .分析实例以我们组所做的调查问卷中的203份为例,统计结果如下:统计量平均每学期发出谏遂的次数N有效缺失均值均值的标准误标准差偏度偏度的标准误峰度峰度的标准误 极小值极大值和百分位数595172311.9709 .05914 .77556.811.185.796.3681.004.00339.001.00004.0000平均每学期发中谏诺的次数频率百分比有效百分比累积百分比有效。次4421.725.625.613次9948.857.683.14-7次199
3、.411.094.28次以上104.95.8100.0合计17284.7100.0缺失 系统3115.3合计203100.0结果显示平均每学期发出速递的次数集中在13次,占了57.6%, 8次以上的只有10个人,占总体的5.8%,说明同学们每学期发出速递的次数比拟少。(二)描述过程描述过程是连续资料统计描述应用最多的一个过程,他可对变量进行描述性统计 分析,计算并列出一系列相应的统计指标。这和其他过程相比并无不同。但该过 程还有个特殊功能就是可将原始数据转换成标准正态评分值并以变量的形式存 入数据库供以后分析。1 .界面说明描述对话框的界面如下列图所示:2 .结果解释以新疆2010年各地区农民
4、居民家庭人均总收入及总支出(单位为元)为例,人均总支出人均总收入自治区8241.288806.87昌吉21737.121699伊犁州7923.988996.59塔城15547.8916061.1阿勒泰4472.356688.97巴音郭楞10398.2113238.2阿克苏7422.739389.51喀什4397.415181.59和田3240.363828.28极小值析;住圣人均总支出人均总收入有效的N (矶天状态)9993240.3600000000003828.28000000000021737.10000000000021699.0200000000009264.590000000000
5、0010432.233333333332005974.0235409772190005673.198111795056000描述统计量有极小值、极大值、均值、标准差、偏度、峰度等,都可以通过描述 由表格的方式给出。(三)探索过程Explore 过程可对变量进行更为深入详尽的描述性统计分析,主要用于对资料的性 质、分布特点等完全不清楚时,故又称之为探索性分析。它在一般描述性统计指 标的基础上,增加有关数据其他特征的文字与图形描述,如枝叶图、箱图等,显 得更加详细、全面,有助于用户制定继续分析的方案。1 .界面说明-输出曲者部但)统计里。图-输出曲者部但)统计里。图位探索因变量列表(R):统计垂)
6、 绘制(I) 选项地)0ootstrap(B.取消帮助选择我们需要探索的变量,添加到因变量列表,选择需要的输出结果,单击确定 按钮,得出如下结果:百、T1、5KMk t1 yh首先是例行的处理记录缺失值情况报告,可见9个数据均为有效值。描述统计量标准误人均总收入均值10432.233333333334001891.066037265019000均值的95%置信区间下限6071.42723146554700上限14793.039435201119005%修整均值中值8996.59000000000000方差32185176.816标准差极小值3828.280000000000极大值21699.0
7、20000000000范围17870.740000000000四分位距8714.355000000000偏度1.001.717峰度.6131.400上表详细列出了常用的描述统计量,如果有标准误也会列出(如偏度和峰度系数)。人均总收入 Stem-and-Leaf PlotFrequencyStem & Leaf1.000.35. 000. 568891.001.31.001.61.0021Stem width:10000.00Each leaf:1case (s)以上是茎叶图,整数位为茎,小数位为叶。这样可以非常直观的看出数据的分布 范围及形态,在国外非常流行。25,000-20,000-15.
8、000-10,000-5,000-o-人妈总收入以上是箱式图,中间的黑粗线为均数,红框为四分位间距的范围,上下两个细线为最大、最小值。(四)交叉表分析过程交叉表分析过程用于对计数资料和有序分类资料进行统计描述和简单的统计推 断。在分析时可以产生二维至n维列联表,并计算相应的百分数指标。统计推断 那么包括了我们常用的X2检验、Kappa值,分层X2 (X?)。如果安装了相应模块, M-H还可计算n维列联表确实切概率(Fishers Exact Test)值。交叉表分析过程不能产生一维频数表(单变量频数表),该功能由频率描述 过程实现。1 .界面说明选择我们所需的变量做行和列变量,如下列图所示。然
9、后单击统计量、单元格、 格式的按钮,分别选择需要的分析统计量。无交叉表行二行二sm S5h 效率sGa 料用sbj 平安性8c 港食时间s&d 服务态度86句 不解中通的途径SH 意认为中通速建的 您对中潮速建的服 收费过商31 1 fi 效率低下(S11bl 平安性低B1 1 c限后态度不好(S1 101生田J X11aS您觉得中油逆衽的收费在浅层5不S文里下耕晚09统计量().空元格(.格式同 BODtStf 旦。 显示里式条形图但)口取消表格(I)确定 J粘贴丝|圭连(里J |月唯 | 都明选择我们所需的变量做行和列变量,如上图所示。2 .分析实例还是以我们的调查问卷为例,行变量为性别,
10、列变量为对中通速递的收费满意度,结果如下:.历由1+MKZXLI/Z性别*您觉得中通速递的收18892. 6%157. 4%203u_1JJ100. 0%203份问卷中,有188份有效,缺失了 15个数据。交叉制表你常得中诵诔逐的收费标准如何合计偏低合理偏高,但能接 受太贵,不能接受性别田 力计数3646614147性别中的2.0%43.5%44.9%9.5%100.0%您觉得中通速递的收费 标准如何中的75.0%79.0%82.5%60.9%78.2%女计数11714941性别中的2.4%41.5%34.1%22.0%100.0%您觉得中通速递的收费 标准如何中的25.0%21.0%17.5
11、%39.1%21.8%合计计数4818023188,性别中的2.1%43.1%42.6%12.2%100.0%您觉得中通速递的收费 标准如何中的100.0%100.0%100.0%100.0%100.0%上表格中给出的男女生对中通速递的收费满意度的百分比都给出了,十分详细。卡方检蛤值df渐进Sig.(双 侧)Pearson 卡方4.974a3.174似然比4.4843.214线性和线性组合 有效案例中的N1.1631881.281a. 2单元格(25.0%)的期望计数少于5O最小期望计数为.87。上表格中为卡方检验,其P值为0.174,说明性别对中通速递的收费满意度表现的 没有差异,即性别不影
12、响对其的评价。实验三均值比拟实验目的学习利用SPSS进行单样本、两独立样本以及成对样本的均值检验。二、实验内容及步骤(一)描述统计(Means过程)实验内容:某医师测得血红蛋白值(g%)如表3.1,试利用Means过程作基本的描述性 统计分析。表3.1实验步骤:对象 编号性别年龄血红蛋 白值对象 编号性别年龄血红蛋 白值1234567891011121314151617181920女男女女男男女男女女男男男女女女男男女男181618171618161818171818161717171716161812.83 15.50 12.2510.06 10.889.65 8.36 11.668.54
13、7.78 13.66 10.57 12.56 9.878.99 11.35 14.56 12.408.0514.032122232425262728293031323334353637383940女男男女女女女男男男男女女女男男男男女男161618181718171616181616181818181717161611.36 12.7815.09 8.678.56 12.5611.5614.67 7.8812.35 13.659.8710.09 12.5516.0413.7811.67 10.98 8.7811.351 .建立数据文件。定义4个变量:ID、Gender、Age和HB,分别表示编
14、号、性别、年龄和血红 蛋白值。2 .选择菜单“Analyzef Compare Meansf Means”,弹出 “Means” 对话框。 在对话框左侧的变量列表中,选择变量“血红蛋白值进入Dependent List” 列表框,选择变量“性别”进入Independent List”,单击“Next”按钮,选 择变量“年龄”进入uIndependent List”。3 .单击“Options”按钮,在弹出的“选择描述统计量”对话框中设置输 出的描述统计量。4 .单击“0K”按钮,得到输出结果。(二)单样本T检验(One-Sample T Test过程)实验内容:某地区10年测得16-18岁人口
15、的平均血红蛋白值为10. 25o现在抽查测量了 该地区40个16-18岁人口的血红蛋白如表1,试分析该地区现在16-18岁人口 的血红蛋白与10年前相比,是否有显著的差异? 实验步骤:1 .翻开数据文件。2 .选择菜单 “ Analyze Compare Means -One-Sample T Test o 弹出 One-Sample T Test” 对话框。3 .在对话框左侧的变量列表中选择变量“血红蛋白”进入“ Test Variable (s)”框 在“Test Value”编辑框中输入过去的平均血红蛋白值10. 25.4 .单击“0K”按钮,得到输出结果。(三)双样本 T 检验(Ind
16、ependent-Samples T Test 过程)实验内容:分别测得14例老年性慢性支气管炎病人及11例健康人的尿中17酮类固醇 排出量(mg/dl)如下,试比拟两组均数有无差异。实验步骤:.建立数据文件。定义变量名:把实际观察值定义为X,再定义一个变量group来区分病人与健康人。输入原始数据,在变量group中,病人输入1,健康人输入2o实验一 SPSS基本操作实验目的1.熟悉SPSS的菜单和窗口界面,熟悉SPSS各种参数的设置;二、二、2.掌握SPSS的数据管理功能。实验内容及步骤(一)数据的输入和保存1. SPSS界面1. SPSS界面请注意窗口顶部显示为“SPSS for Win
17、dows Data Editor”,说明现在所看到的是SPSS的数据管理窗口。这是一个典型的Windows软件界面,有菜单栏、 工具栏。该界面和EXCEL极为相似,很多操作也与EXCEL类似,同学们可以自己 试试。2.定义变量选择菜单Data=二Define Variable。系统弹出定义变量对话框如下:2 .选择菜单 u AnalyzeCompare Means-Independent-samples T Test” 项,弹出uIndependent- samples T Test对话框。从对话框左侧的变量列表中选x, 进入 “Test Variable(s)” 框,选择变量 group”,
18、进入 “Grouping Variable” 框,点 击“Define Groups”钮弹出Define Groupsv定义框,在Group 1中输入1,在 Group 2中输入2。3 .单击“OK”按钮,得到输出结果。(四)成对样本T检验(Paired-Samples T Test过程)实验内容:某单位研究饲料中缺乏维生素E与肝中维生素A含量的关系,将大白鼠按性 别、体重等配为8对,每对中两只大白鼠分别喂给正常饲料和维生素E缺乏饲 料,一段时期后将之宰杀,测定其肝中维生素A含量(mol/L)如下,问饲料 中缺乏维生素E对鼠肝中维生素A含量有无影响?实验步骤:1.建立数据文件。定义变量名:正常
19、饲料组测定值为X1,维生素E缺乏饲料组测定值为x2, 输入原始数据。2,选择菜单 “Analyzef Compare Meansf Paired-samples T Test” 项,弹出uPaired - samples TTest对话框。从对话框左侧的变量列表中选择变量xl x2 进入 Variables 框。3.单击“0K”按钮,得到输出结果。实验报告四相关分析一、实验目的学习利用SPSS进行相关分析、偏相关分析、距离分析、线性回归分析和曲 线回归。二、实验内容及实验步骤(一)两变量的相关分析(Bivariate过程)实验内容:1、两变量的相关分析(Bivariate过程)案例:如下列图所
20、示为年人均消费支出与教育、人均可支配收入、外出就餐、教育 支出、人均使用面积等因素之间的关系。试分析人均可支配收入与人均消费性支出 的相关性。nfX1x2X3x4X6. ?! .OO306 OO299 OO.OOOOOOOO21979 OO340 OO332.00.OOOO0OO31980 OO429 OO41 9.00.OOOOOOOOA138 1 .OO482.0649 1. OZS6.2O35.99.OO.OOI 9B2 SDB 54-491 6257.404口746OO530 4550 1.895B.3Q39.57OO9 4771384 OO642.8756 1 37S0.OO39.5
21、1OO9 63e185 OO089 O108 1.64SO. 2033 ee09.719I SI85.OO1 108.931065.4850. IO43.42.OO9.B91 O-19BZ 1 191 .DD1075.275E.5D50 5BOO1O QB1 1QO151B 661460 5252.1057 21OO1O B71 21389 OO1741.611S42.52S6.4OS6.76001 1 49131A9O OO1983-101827 8456.2073 8930.2411 871 41391 .口口21 82.451864.2255.8093.4647r.311 1.961 5
22、1992 2B73.7422D3.BD52.5DB4 (5S57 5(512 i r.1993 QO3903 O13130 5S40.401 13 3771 OO12 06171994 OO6009-464442.0947.401G1 1S153 9012 94101995 OO7274 745565.8040.50239.52194 6213.061 91396.08353.655644.7345.20300.8 13OZ.3612.822D199Z 9DEB B17IBB 7143. BD33E.2B4 19 1913 D721-IMS OO9193.15791 1.9439.50342
23、33542 Z013 S6221399.009491 .697493.3140.80316.26558 9314.65232000 OO10921.317997.3739.80407 61656.2015.2624200 1 .OO1 1991.149453.0734.30610.101091 .8515.16252002 1 29E9.B9939 E . 4540.3D54.53T 0152 1 31B IB| 名称|类型 |宽度小数|标釜值 1缺失1nf数值(N)82年份无无2数值例)一82年人均可支配收.无J3x2数值小I)8年人均消费性支二无,004x3数值例)8g;恩格尔系数无二,0
24、05x4数值82在外就餐无,006x5数值(N)8婆教育支用无,007x6数值(N)82人均使用面积无,00首先假设:H0:它们之间的相关系数r为OHL它们之间的相关系数r不为0操作过程及结果分析如下:由上表的处理结果可知:应拒绝原假设H0,因为P值。=0.05,所以认为人均可 支配收入与人均消费性支出有很强的相关性。、2、偏相关分析(Partial过程)案例:数据资料引用上例,研究分析可支配收入与教育支出之间的关系。首先假设:H0:它们之间的相关系数r为0H1:它们之间的相关系数r不为0操作过程及结果分析如下:洋人小汹和里支出.陶陷小不/1X3夕在外我今3C4J.YP I 舁金.ch Ei
25、mr彳口一应在性金脸 欢刑心金后X O 地以叶至隹31)&5豆市亨?阿&性:加 斗(口)选项9Spot str op 但)力人B已依人XL舒钞百天出X51: 一M J I粘如|壬郎e J I 取泮e;I 用甲偏相关数掰集1 JDocument5 and Setting八Administrato”案面2OL1统计筷以实习案例数用资料相关回H分析(年人均消费支出和教育)控制变量年人锻支配敦音支出年均消费作吉战&恩陵年人均可支配收入相关性1.0DD-745使用面积呈著性,双恻).021dfD7翁言支出相关性-7451.000显著性,双恻).021orT0由上表的处理结果可知:应拒绝原假设H0,因为P
26、值&=0.05,所以认为人均可 支配收入与教育支出有很强的相关性。3、 距离分析(Distances过程) 案例:数据资料引用上例,研究年份、在外就餐、教育支出、人均使用面积、年 均消费性支出之间相似的关系。操作过程及结果分析如下:近似做【蛔睇1】C:DounnnTS and kEngs Sdminisrrator加面2011眈用0307B79.1 05OOO原假设为HO: B=B =3 =0备择假设Hl: B B 建木全为00、1、2有处理结果可知:P=0.000:I,人灶人心巧4k入】 O时刖奖标 33E I H7.7Tca Mwb 人向收入巳现小 LE因我量:人均食品支出日克里R人均收入
27、。力彳呈黑融汇息B儆怙计值R方FC1Hdf2Sig.K*攵til娓哇8481 62 035129000-50 946422有击,迷操作结果被心南阈南盅市可以拟合出一方程来表示人均收入与人均食品DATASET CLOSE m分2.支出之间的关系,进一步来预测未来。实验五聚类分析和判别分析实验目的:学习利用SPSS进行聚类分析和判别分析。实验内容及实验步骤:一、系统聚类法对31个省市和生活质量进行系统聚类的树状图如下:山东 河北 新磕 玄庆 山西 湖南 四川 黑龙江 陕西 江苏 浙江 内蒙占 湖北 吉林 史州西藏 广东 甘肃 用it 宁夏 安彼 何南 青海 广西 海南 江西 云闺 北京 上海天津
28、辽宁根据树状图的分析可以将其划分为四局部。也就是对31个省市的人民 生活质量情况分,可以将这些省市分为四局部。从图中可以看出北京、上海 被归为一类,天津、辽宁被归为一类。从中可以分析出省市居民的生活质量 可以按一定特征和规律分成不同地区和不同标准。1 .快速聚类法(K-Means Cluster过程)Define VariableVariableVftra fibl& BcseriptioiiType:ffumaricfl. 2V w l .bl 4HissingNm。Ali gximex.t:neasureiTientScale C* Or iinal oiriiiiaL对话框最上方为变量名
29、,现在显示为VAR00001,这是系统的默认变量 名;往下是变量情况描述,可以看到系统默认该变量为数值型,长度为8,有两 位小数位,尚无缺失值,显示对齐方式为右对齐;第三局部为四个设置更改按钮,分 别可以设定变量类型、标签、缺失值和列显示格式;第四局部实际上是用来定义 变量属于数值变量、有序分类变量还是无序分类变量,现在系统默认新变量为数值 变量;最下方那么依次是确定、取消和帮助按钮。假如有两组数据如下:GROUP 1: 0. 84 1.05 1.20 1.20 1.39 1.53 1.67 1.80 1.87 2.07 2. 11GROUP 2: 0. 54 0. 64 0. 64 0. 75 0. 76 0. 81 1. 16 1. 20 1. 34 1. 35 1.48 1. 561.87先来建立分组变量GROUPo请将变量名改为GROUP,然后单击0K按钮。现在SPSS的数据管理窗口如下所示:文件旧 桐辑 视图 数括I。)转换 分析 直稿)图形9)实用程序Q) sn(w)帮助名称类型宽度小数标箜S缺失1group数值N)82无无02X数值时82S :无8J 4C,第一列的名称已经改为了 “group ,这就是我们所定义的新变量“group”。例2: 30个月的分类CPI指数如下列图,有3个指标,故指定聚
限制150内