《SPSS实验报告册.doc》由会员分享,可在线阅读,更多相关《SPSS实验报告册.doc(29页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、 SPSS统计软件应用实验报告册 20 - 20 学年 第 学期班 级: 学 号: 姓 名: 授课教师: 实验教师: 实验学时: 实验组号: 目 录实验一 SPSS的数据管理3实验二 描述性统计分析5实验三 均值检验6实验四 相关分析7实验五 因子分析8实验六 聚类分析11实验七 回归分析13实验八 判别分析14实验一 SPSS的数据管理一、 实验目的1 熟悉SPSS的菜单和窗口界面,熟悉SPSS各种参数的设置;2掌握SPSS的数据管理功能。二、实验内容及步骤:1、定义spss数据结构。下表是某大学的一个问卷调查,要求将问卷调查结果表示成spss可识别的数据文件,利用spss软件进行分析和处理
2、。练习:创建数据文件的结构,即数据文件的变量和定义变量的属性。表1 大学教师基本情况调查表问题备选答案1姓名2 性别3年龄4学历5 工作年月6职称7本年度教学工作量(课时)4(1)专科(2)本科(3)硕士(4)博士(5)博士后6 (1)助教(2)讲师(3)副教授(4)教授7 (1)0120 (2)120240 (3)240320 (4)320480 (5) 480以上8 本年度公开发表论文数9 本年度您的科研经费总额(万元)10.您认为学校对科研人员每年的科研成果要求是否合理(1)合理 (2)不合理 (3)无所谓11 您最常用的全文期刊数据库的名称(多选,限选2个)(1)cnki (2)万方
3、(3)SpringerLink (4)EBSCO12 您对学校科研管理部门的工作是否满意(1)非常满意 (2)满意 (3)一般 (4)不满意实验内容:1.定义spss数据结构。下表是某大学的一个问卷调查,要求将问卷调查结果表示成spss可识别的数据文件,利用spss软件进行分析和处理。练习:创建数据文件的结构,即数据文件的变量和定义变量的属性。实验步骤:(1) 、打开定义变量的界面启动SPSS,进入主界面,单击图6-2所示的屏幕左下角的“Variable View”选项卡,打开定义变量的表格。(2) 、输入变量名,符合变量的命名规则在“Name”列的第一个单元格输入第一个变量名,如:“xm”。
4、(3) 、确定变量类型,单击“Type”列的第一个单元格,如图6-3所示,SPSS的默认变量类型为数值型。单击数值型变量后的“”,弹出如图6-4所示的对话框,用户可以从该对话框中选择其他的变量类型。(4) 、设置字段值(5) 、依次按要求输入完毕即可实验结果:实验分析:本实验,主要是按照要求一步一步来设置条件即可完满完成实验。 2 、高校提前录取名单的确定某高校今年对部分考生采取单独出题、提前录取的招生模式。现有20名来自国内不同省市的考生报考该校,7个录取名额。见数据文件compute.sav. 该校制定了如下录取原则:(1)文化课成绩由数学、语文、英语和综合四门成绩组成。文化课成绩制定最低
5、录取分数线:400分。(2)个人档案中若有“不良记录”,不予录取。(3)对西部考生和少数民族考生,给予加分优惠。少数民族考生加20分,西部考生加10分。(4)对参加过省以上竞赛并取得三等奖以上名次的考生,每项加10分。(5)文化课成绩和加分总和构成综合分,录取综合排名为前7名的学生。练习:利用spss软件,综合利用所学 ,给出成绩排名的操作步骤。实验内容:2.高校提前录取名单的确定某高校今年对部分考生采取单独出题、提前录取的招生模式。现有20名来自国内不同省市的考生报考该校,7个录取名额。见数据文件compute.sav. 练习:利用spss软件,综合利用所学 ,给出成绩排名的操作步骤。实验步
6、骤:(1)计算文化课总成绩:打开数据文件compute.sav.变量计算transform-compute,在弹出的computevariable对话框中,定义变量zcj,type&label中的label值设为“文化课总成绩”,numbericexpression设置“语文+数学+英语+综合”,单击ok按钮。(2)筛选出400分以上并且没有不良记录的学生:date-selectcase,在弹出的对话框中选择ifconditionissatisfied单选按钮并单击if按钮,在弹出的selectcase:if对话框中,设置不良记录=0&zcj=400的判断条件,单击continue,选择del
7、eted单选按钮,最后单击ok。(3)计算西部考生和少数名族加分项:transform-compute,targetvariable选择zcj。if条件中设置“名族=2or名族=3or民族=4”,numbericexpression中zcj+20;If条件中设置“名族=5”numbericexpression中设置zcj+10(4)计算最综成绩,并排序:transform-compute,numbericexpression,zcj奖项*10.选择“DataSortCases”命令,弹出“SortCases”对话框,把“zcj”变量选入“Sortby”中,并在SortOrder中选择“Asce
8、nding(降序)”选项,将学生成绩按升序排列,单击“OK”按钮。 实验结果:选取综合成绩升序排列后的前七名即可,如图所示:录取的分别是艾甫尔513分、孙悦婷495分、张囯欣471分、果冻样462分、杨乐451分、高超438分、易仲勃434分。实验分析:本实验,主要是按照要求一步一步来设置条件,最后边计算有点难,就是算加分。首先要解决不留空的,不然最后没法求和。根据结果选出符合要求的即可。三、实验小结:实验中遇到的问题及解决办法、心得体会等等.本实验,第一小题,主要考察我们创建数据文件的结构,即数据文件的变量和定义变量的属性。老师上课时给我们演示很到位,在老师的详细讲解下,我熟悉了spss软件
9、界面,以及一些主要组成部分,但是里面的一些具体参数还不太清楚,不过常用主要属性都掌握了,没有太大问题。第二小问,问题就相当大了,先是选择不小于400分的,经常排除不了,后来在同学的帮助下克服了。然后在加分部分比较难 ,最开始先符合一个加一个,但是后来发现不是,经过反复尝试,把需要加分的先列出来,最后汇总,但是没加粉的,我没计算,导致最后求和时,不能加,因为有的是空字符,而不是数字0,后来又经改进,把没有加分的同学,在相对加分位置是-表示,最后才完满完成实验。实验二 描述性统计分析一、 实验目的利用SPSS进行描述性统计分析。要求掌握频数分析(Frequencies过程)、描述性分析(Descr
10、iptives过程)、交叉列联表分析(Crosstabs过程)。二、 实验内容及步骤1、打开数据文件descriptives.sav,是从某校选取的3个班级共16名学生的体检列表,要求以班级为单位列表计算年龄,体重和身高的统计量,包括极差,最小最大值,均值,标准差和方差。给出操作步骤和分析结果。1) 打开数据文件descriptives.sav,选“数据”菜单的“选择个案”命令项,弹出对话框。选择“如果条件满足”单选按纽,点击“如果”钮,弹出对话框,输入条件:班级=1单击“继续”按纽。在“输出”栏选择“过滤掉未选定的个案”项,单击“确定”按钮。2)在主菜单栏单击“分析”,在出现的下拉菜单里移动
11、鼠标至“描述性统计”项上,在出现的次菜单里单击“描述性”项,打开对话框。从左则的源变量框里选择年龄、体重、身高三个变量进入“变量”框里。单击“选项”钮,弹出“选项”对话框,选中均值Std.deviation标准差最小值方差最大值范围复选框,单击“继续”按钮,单击“确定”按钮。3)2、3班操作类似,只需将条件改为“班级=2”、“班级=3”即可一班二班。三班:2、某医生用国产呋喃硝胺治疗十二指肠溃疡,以甲氰咪胍作对照组,问两种方法治疗效果有无差别三、练习题:1、打开数据文件descriptives.sav,是从某校选取的3个班级共16名学生的体检列表,要求以班级为单位列表计算年龄,体重和身高的统计
12、量,包括极差,最小最大值,均值,标准差和方差。给出操作步骤和分析结果。分析:1班年龄的最大值,最小值,平均数最小,方差和标准差最大;体重的极差,最大值,最小值,平均数,方差,标准差都最小;身高的极差,最大值,最小值,平均数,方差,标准差都最小。2班年龄的最大值,最小值,平均数居中,方差和标准差最小;体重的极差,最大值,最小值,平均数,方差,标准差都居中;身高的极差,最大值,最小值,平均数,方差,标准差都居中3班年龄的最大值,最小值,平均数最大,方差和标准差居中;体重的极差,最大值,最小值,平均数,方差,标准差都最大;身高的极差,最大值,最小值,平均数,方差,标准差都最大。2、某医生用国产呋喃硝
13、胺治疗十二指肠溃疡,以甲氰咪胍作对照组,问两种方法治疗效果有无差别处 理愈 合未愈合合计呋喃硝胺54862甲氰咪胍442064合 计9828126(提示:由于此处给出的直接是频数表,因此在建立数据集时可以直接输入三个变量行变量、列变量和指示每个格子中频数的变量,然后用Weight Cases对话框指定频数变量,最后调用Crosstabs过程进行X2检验。假设三个变量分别名为R、C和W,则数据集结构和命令如下):RCW1.001.0054.001.002.0044.002.001.008.002.002.0020.00分析:卡方检验统计量的p值=0.0130.1,接受原假设,即机器生产的产品均值
14、和322在90%的置信水平下是没有显著差异。2、在体育课上记录14名学生乒乓球得分的数据,男女各7名。数据如下:男:82.00 80.00 85.00 85.00 78.00 87.00 82.00女:75.00 76.00 80.00 77.00 80.00 77.00 73.00比较在置信度为95%的情况下男女生得分是否有显著差别。Levene检验中sig=0.4450.05说明总体方差相等,t统计量检验自由n1+n2-2,p值=0.0020.05、甘油三酯的水平的p值均小于0.05,使用该药之前和之后的体没有显著性变化,而甘油三酯的水平有显著性变化。四、实验小结:实验中遇到的问题及解决办
15、法、心得体会等等.1、学习利用SPSS进行单样本、两独立样本以及成对样本的均值检验。2、在分析问题前要判断是单样本T测验还是双样本T测验,在第一遍的实验过程中由于我没有分清楚这个问题导致了试压结果错误。实验四 相关分析一、 实验目的学习利用SPSS进行相关分析、偏相关分析、距离分析。二、 实验内容及实验步骤1、打开数据文件correlate1.sav, 要求分析汽车价格和汽车的燃油效率之间是否存在线性关系。选择菜单“AnalyzeCorrelateBivariate”,在对话框左侧的变量列表中选price,fuelefficiency使之进入“Variables”框,输出结果如图所示:2、 打
16、开数据文件pcorrelation.sav,对身高、体重和肺活量进行变量距离分析。选相似性测度。进行结果解释。选择菜单“AnalyzeCorrelateDistance”,在对话框左侧的变量列表中选变量身高、体重和肺活量进入“Variables”框。在“ComputeDistances”框中选择“Betweenvariables”,作变量之间的距离相关分析。在“Measure”栏中选择“Similarities”相似性测距。输出结果如图所示3、打开数据文件distance.sav, 文件是利用三种不同的仪器对飞机的10只叶片的半径分别进行了测量。要求对10只叶片进行距离分析。用Euclidea
17、n distance。进行结果解释。三 练习题:1、 打开数据文件correlate1.sav, 要求分析汽车价格和汽车的燃油效率之间是否存在线性关系。 两变量之间的相关系数r=-0.492,呈负的低度线性相关,在T的双尾检验中p值0.05,拒绝假设H0,汽车价格和汽车的燃油效率之间有显著线性相关关系。2、 打开数据文件pcorrelation.sav,对身高、体重和肺活量进行变量距离分析。选相似性测度。进行结果解释。 身高、体重、肺活量彼此之间都存在中度的线性关系3、打开数据文件distance.sav, 文件是利用三种不同的仪器对飞机的10只叶片的半径分别进行了测量。要求对10只叶片进行距
18、离分析。用Euclidean distance。进行结果解释。第一次测量与第二次测量和第一次测量与第三次测量之间的差异程度接近,第二次测量与第三次测量的差异程度较大。四 实验小结:实验中遇到的问题及解决办法、心得体会等等.1、通过对这一实验的学习,我学会了利用SPSS进行相关分析、偏相关分析、距离分析。2、距离相关分析是对观测量之间和变量之间相似或不相似的程度的一种测量。距离相关分析可用于同一变量内部各个取值间,以考察其相互接近程度;也可用于变量间,以考察预测值对实际值的拟合优度。实验五 因子分析一、实验目的:运用因子分析方法分析数据二、内容:1. SPSS操作2. 因子分析三、案例背景:现有
19、24名同学身高、体重、坐高、胸围、肩宽、盆骨宽此6项数据,有没有可能用更少的数据说明每位同学的身体状况?实验步骤:1.按AnalyzeDataReductionFactor顺序单击菜单项,打开因子分析主对话框。2.选PoliticalEconomy、Calculus1、ComputerCulture、Microeconomics、Algebra、Calculus2和VB为分析变量送到右边的Variables栏中。3.在主对话框中单击Extraction按钮,相应的对话框中:1)Method菜单中选Principlecomponents项,使用主成分分析方法。2)Analyz栏中选Correla
20、tionmatrix项,分析相关矩阵。3)Extract栏中选择Numberoffactors24)Display栏中选择Unrotatedfactorsolution,显示未旋转的因子结果。同样选择Screeplot,要求作出特征值的散点图。5)Maximumiterationconvagence25,结束迭代的判据为到达最大迭代次数25.4.主对话框中单击Score按钮。在相应的对话框中选择Saveasvariables,并在Method栏中选择Rregression,要求通过回归方法计算因子得分并把因子得分作为变量保存到数据文件中。5.单击Descriptives按钮,在对话框Stati
21、stics栏内选择Initialsolution选项。6.在主对话框中单击OK按钮执行运算。2)四、练习下表资料为25名健康人的7项生化检验结果,7项生化检验指标依次命名为X1至X7,请对该资料进行因子分析。X1X2X3X4X5X6X73.768.596.227.579.035.513.278.749.649.738.597.124.695.511.665.909.848.394.947.239.469.554.948.219.413.664.996.147.287.083.980.627.009.491.332.985.493.011.341.615.769.274.924.382.307.
22、315.354.523.086.440.541.344.527.072.591.300.443.311.031.001.173.682.171.271.571.551.512.541.031.771.044.254.502.425.115.2810.029.8412.6611.766.923.3611.6813.579.879.179.725.985.812.808.8413.6010.056.687.7912.0011.748.079.1012.509.777.502.171.794.545.337.633.5313.139.877.852.642.764.571.785.409.023.9
23、66.494.3911.582.771.793.752.4513.7410.162.732.106.227.308.844.7618.5211.069.913.433.555.382.097.5012.675.249.065.3716.183.512.104.663.104.782.131.090.821.282.408.391.122.353.702.621.192.013.433.721.971.751.432.812.272.421.051.291.720.91分析:系统首先输出各变量的均数与标准差,并显示共有25例观察单位进入分析;接着输出相关系数矩阵,经Bartlett检验表明:Ba
24、rtlett值=326.28484,P0.0001,即相关矩阵不是一个单位矩阵,故考虑进行因子分析。Kaiser-Meyer-OlkinMeasureofSamplingAdequacy是用于比较观测相关系数值与偏相关系数值的一个指标,其值愈逼近1,表明对这些变量进行因子分析的效果愈好。今KMO值=0.32122,偏小,意味着因子分析的结果可能不能接受。使用主成分分析法得到2个因子,因子矩阵如下,变量与某一因子的联系系数绝对值越大,则该因子与变量关系越近。如本例变量X7与第一因子的值为-0.88644,与第二因子的值为0.21921,可见其与第一因子更近,与第二因子更远。或者因子矩阵也可以作为
25、因子贡献大小的度量,其绝对值越大,贡献也越大。下面显示经正交旋转后的因子负荷矩阵和因子转换矩阵。旋转的目的是使复杂的矩阵变得简洁,即第一因子替代了X1、X2、X4、X7的作用,第二因子替代了X3、X5、X6的作用。五、实验小结:实验中遇到的问题及解决办法、心得体会等等. 本次实验主要学习的是因子分析,通过本次实验,我对因子分析有了一个基本的认识,因子分析是通过变量对变量之间关系的研究,找出能综合原始变量的少数几个因子,使得少数因子能够反映原始变了的绝大部分信息,然后根据相关性的大小将原始变量分组,使得组内的变量之间相关性较高,而不同组的变量之间相关性较低。因此,因子分析属于多元统计中处理维的一
26、种统计方法,其目的就是要减少变量的个数,用少数因子代表多个原始变量。还要分清楚谁是因变量谁是自变量。 但实验操作步骤掌握不熟练,对于实验结果的分析不是很了解,在以后还需加强。实验六 聚类分析一、实验目的:运用聚类分析方法分析数据二、内容:1SPSS操作2聚类分析三、案例背景:现有5名同学学科背景(1为文科,2为理科),抽象能力,形象能力,创新能力的资料,用聚类分析将其分类。实验步骤:1建立数据文件。定义变量名:钙、镁、铁、锰、铜和血红蛋白的变量名分别为x1、x2、x3、x4、x5、x6,之后输入原始数据。2 选择菜单“分析分类系统聚类”,弹出聚类分析对话框。从对话框左侧的变量列表中选x1、x2
27、、x3、x4、x5、x6,使之进入变量框;在“分群”处选择聚类类型(对变量聚类)3单击“统计”按钮,弹出“聚类分析:统计量”对话框,选择“相似性矩阵”以显示距离矩阵。4单击“绘制”按钮,弹出“聚类分析:图”对话框,选择“树状图”项。5单击“方法”按钮,弹出“聚类分析:方法”对话框,选择“组间连接”和“皮尔森相关性”。6单击“确定”按钮,得到输出结果。四、练习29名儿童的血红蛋白(g/100ml)与微量元素(g/100ml)测定结果如下表。由于微量元素的测定成本高、耗时长,故希望通过聚类分析(即R型指标聚类)筛选代表性指标,以便更经济快捷地评价儿童的营养状态。编号N0.钙X1镁X2铁X3锰X4铜
28、X5血红蛋白X6123456789101112131415161718192021222324252627282954.8972.4953.8164.7458.8043.6754.8986.1260.3554.0461.2360.1769.6972.2855.1370.0863.0548.7552.2852.2149.7161.0253.6850.2265.3456.3966.1273.8947.3130.8642.6152.8639.1837.6726.1830.8643.7938.2034.2337.3533.6740.0140.1233.0236.8135.0730.5327.1436.
29、1825.4329.2728.7929.1729.9929.2931.9332.9428.55448.70467.30425.61469.80456.55395.78448.70440.13394.40405.60446.00383.20416.70430.80445.80409.80384.10342.90326.29388.54331.10258.94292.80292.60312.80283.00344.20312.50294.70 0.012 0.008 0.004 0.005 0.012 0.001 0.012 0.017 0.001 0.008 0.022 0.001 0.012
30、0.000 0.012 0.012 0.000 0.018 0.004 0.024 0.012 0.016 0.048 0.006 0.006 0.016 0.000 0.064 0.0051.0101.6401.2201.2201.0100.5941.0101.7701.1401.3001.3800.9141.3501.2000.9181.1900.8530.9240.8171.0200.8971.1901.3201.0401.0301.3500.6891.1500.83813.5013.0013.7514.0014.2512.7512.5012.2512.0011.7511.5011.25
31、11.0010.7510.5010.2510.00 9.75 9.50 9.25 9.00 8.75 8.50 8.25 8.00 7.80 7.50 7.25 7.00分析:在结果输出窗口中将看到如下统计数据:共29例样本进入聚类分析,采用相关系数测量技术。先显示各变量间的相关系数,这对于后面选择典型变量是十分有用的。然后显示类间平均链锁法的合并进程,即第一步,X3与X6被合并,它们之间的相关系数最大,为0.;第二步,X1与X5合并,其间相关系数为0.;第三步,X2与第一步的合并项被合并,它们之间的相关系数为0.;第四步,它们与第二步的合并项再合并,其间相关系数为0.;第五步,与最后一个变量
32、X4合并,这个相关系数最小,为-0.。按类间平均链锁法,变量合并过程的冰柱图如下。先是X3与X6合并,接着X1与X5合并,然后X3、X6与X2合并,接着再与X1、X5合并,最后加上X4,六个变量全部合并。下面用更为直观的聚类树状关系图表示,即X1、X2、X3、X5、X6先聚合后与X4再聚合。这表明,在评价儿童营养状态时,可在微量元素钙、镁、铁、铜和血红蛋白5个指标中选择一个,再加上微量元素锰即可,其效果与六个指标都用是基本等价的,但更经济更迅速。五、实验小结:实验中遇到的问题及解决办法、心得体会等等.1、通过这次实验,使我学会了运用聚类分析当法分析数据。2、层次聚类分析中的R型聚类是对研究对象
33、的观察变量进行分类,它使具有共同特征的变量聚在一起。以便可以从不同类中分别选出具有代表性的变量作分析,从而减少分析变量的个数。3、聚类分析的实质是建立一种分类方法,将一批样本数据按照他们在性质上的密切程度在没有先验知识的情况下自动进行分类。实验七 回归分析一、实验目的:运用一元线性回归与多元线性回归进行预测二、内容:1spss操作2一元线形回归3多元线性回归 三、实验背景:已知某工厂14年间的产值,用回归分析法预测未来产值。实验步骤:步骤一:激活数据管理窗口,定义变量名:体表面积为Y,保留3位小数;身高、体重分别为X1、X2,保留1位小数。输入原始数据。点击“统计”菜单选“回归”中的“线性”项
34、,弹出“线性回归”对话框。从对话框左侧的变量列表中选y,点击钮使之进入“因变量”框,选x1、x2,点击钮使之进入“自变量”框;在“方法”处下拉菜单,选用“进入”法。点击“确定”钮即完成分析。 四、练习某医师测得10名3岁儿童的身高(cm)、体重(kg)和体表面积(cm2)资料如下。试用多元回归方法确定以身高、体重为自变量,体表面积为应变量的回归方程。儿童编号体表面积(Y)身高(X1)体重(X2)123456789105.3825.2995.3585.2925.6026.0145.8306.1026.0756.41188.087.688.589.087.789.588.890.490.691.2
35、11.011.812.012.313.113.714.414.915.216.0分析:标准化Y预测值作变量分布图结果显示,本例以X1、X2为自变量,Y为应变量,采用全部入选法建立回归方程。回归方程的复相关系数为0.94964,决定系数(即r2)为0.90181,经方差分析,F=34.14499,P=0.0003,回归方程有效。回归方程为Y=0.X1+0.X2-2.。五、 实验小结:实验中遇到的问题及解决办法、心得体会等等.回归分析法主要用于分析自变量和因变量之间的关系,通过标准化残差正态图可以看出,身高和体重两个变量服从正态分布,则绘制的概率图为一条从纵轴零点指向右上角的直线。回归模型的拟合程
36、度,第一列表示选择回归方法的种类,第二列表示负相关系数,其含义类似相关系数,反映的是自变量和因变量之间的密切程度。其值在0-1之间,越大表示相关程度越好。第三列表示负相关系数的平方,又称为决定系数。第四列表示调整后的负相关系数,该值是在考虑了模型中有自变量个数情况下计算的决定系数。第五列表示标准差。 实验八 判别分析一、实验目的:运用判别分析进行分类预测二、内容:1SPSS操作2聚类分析三、实验步骤: (1)执行AnalyzeClassifyDiscriminant命令,打开DisciriminantAnalysis主对话框。(2)如果需要使用部分观测量参与判别函数的推导时,可以单击Selec
37、t按钮,主对话框向下延伸。(3)单击Statistics按钮,打开统计量对话框。(4)如果在主对话框中选择Usestepwisemethod选项,对话框下面的Mehod按钮才能被激活,这时单击Method按钮,打开StepwiseMethod(逐步判别方法)对话框。(5)单击Classify按钮,打开如图11-20所示的Classification(分类)对话框。(6)单击Save按钮,打开Save对话框。如图11-21所示。在此对话框选择建立新变量将判别分析结果保存到当前工作文件中去。上述各项选项选择完毕以后,返回主对话框单击OK按钮运行。四、练习为研究舒张期血压和血浆胆固醇对冠心病的作用,某医师测定了50-59岁冠心病人15例和正常人16例的舒张压和胆固醇指标,结果如下,试作判别分析,建立判别函数以便在临床中用于筛选冠心病人。编号冠心病人组编号正常人组舒张压kPax1胆固醇mmol/Lx2舒张压kPax1胆固醇mmol/Lx2123456789101
限制150内