统计分析与应用实验报告.docx
统计分析与应用实验报告实验一建立与编辑数据文件一、实验目的1、理解数据文件的原理和方法;2、掌握编辑数据文件的菜单功能;3、熟练应用SPSS软件编辑数据文件。二、实验内容某单位将进行薪酬改革,2012年员工的工资与绩效评分等资料 如表。为了了解不同性别、不同工作性质的员工收入状况、绩效评 分等,以便为决策者制定合理的薪酬体系提供科学依据,进行一下 实验:1、建立数据文件2、选择个案。三、实验步骤1、建立数据文件1、单击“文件”菜单下的“新建-文件”命令。2、打开左下方的“变量视图”。单击“变量类型”的单元格,对 应宽度单元格将演示默认的宽度和样式。在“值标签”对话框中, 在“值”后输入变量中出现的数值“1”,然后在标签中输入对对应 的数值(“男”)含义,单击“添加”。默认系统的缺失值选项为“没 有缺失值”。选择需要的测度方式,默认为度量。单击“数据视 图”,录入数据文件。6. 003 .0000014. 003 .22234. 003 .44554. 003 .66771. 003 .84. 00Extremes0=40)Stem width:10Each leaf:1 case(s)100-80-35*284 60 -40-20-290O工五、分析与讨论SPSS的数据探索主要运用茎叶图和箱图,简明直观地表示总体 或样本中种类别或分组中个案的分布频数。它能够帮助研究者把握 数据的分布情况,发现数据的错误或异常情况。数据探索能够使用 于个案数量不是很大的总体或样本分析。实验四两独立样本t检验一、实验目的1、明确两独立样本t检验有关概念2、理解两独立样本t检验的基本思想与原理3、熟练掌握两独立样本t检验的方法4、能用SPSS软件进行两独立样本t检验5、培养运用两独立样本t检验 实际问题能力二、实验内容某省2010年25个旅游区的游客增长率、旅游投资、资金的投 资来源、投资类型、经济增长率见表4.1 (基本数据4-l.sav)。试 分析该省2010年不同投资类型(餐饮、景区设置)所对应的旅游投 资是否有显著性差异?三、实验步骤1、打开数据文件4T. sav。2、选择“分析一比较均值-独立样本T检验命令”。3、在独立样本T检验对话框左端的变量列表将要检验的变量“旅 游投资“添加到右边的检验变量列表中;把标识变量”投资类型“移入分组变量框中。4、单击“定义组”定义两总体的标识值,在组1后面的文本框输入1,在组2后面的文本框输入2。5、单击“选项”定义其他选项。6、返回独立样本T检验对话框,单击“确定”。四、实验结果Group Statistics投资类型NMeanStd. DeviationStd. Bror Mean旅游投资1121495.2597.48828.1422131536.3162.95017.459Independent Samples TestLevene's Test for Equality of Variancest-test foEquality of NleansFSiq.tdfSig. (2-tailed)Mean DifferenceStd. Error Difference95% Confidence Interval of the DifferenceLowerUpper旅游投资Equal variancesassumedEqual variances not assumed2.925.101-1.261-1.2402318.575.220.231-41.058-41.05832.55433.118-108.400-110.48226.28528.367五、分析与讨论1、两独立样本t检验要求两个样本应该是互相独立的,即从第一个 总体样本中抽取的一组样本对从第二个总体样本中抽取的一组样本 没有任何影响,两组样本的样本容量可以不同,样本顺序可以随意 调整。2、两独立样本t检验的前提是样本来自的两个总体应该服从或近似 服从正态分布,如果总体分布未知的情况下,则通常采用非参数检 验方法。3、两总体方差是否相等决定两独立样本t检验所采取的检验统计量 的关键,在进行检验之前,必须通过有效的方法对两总体方差是否 相等作出判断。实验五偏相关分析一、实验目的1、准确理解偏相关分析的方法原理和使用前提;2、熟练掌握偏相关分析的SPSS操作;3、了解偏相关分析在中介变量运用方法。二、实验内容研究人员收集了 26个旅游景点某年的商店投资数据、游客增长 率和风景区的经济增长率。问景区商业投资是否确实导致了风景区 的经济增长率?三、实验步骤1、打开数据文件6-2. savo2、选择“分析-相关-偏相关”命令。选择“商业投资”与“经济增长”作为相关分析变量;选择“游客增长率”作为控制变量。点击“选项”按钮,选择“均值和标准差”、“零阶相关系数”。返回主 分析框,点击“确定”。四、实验结果Descriptive StatisticsMeanStd. DeviationN商业投资万元1521.923185.0956726地区经济增长2.2019.4691426游客增长3.7173.6106626CorrelationsControl Variables商业投 资万元地区经 济增长游客增长-none-a商业投资万元Correlation1.000.644.791Significance (2-tailed)*.000.000df02424地区经济增长 Correlation.6441.000.773Significance (2-tailed).000*.000df24024游客增长Correlate n.791.7731.000Significance (2-tailed).000.000df24240游客增长商业投资万元 Correlation1.000.083Significance (2-tailed)*.695df023地区经济增长 Correlation.0831.000Significance (2-tailed).695df230a. Cells contain zero-order (Pearson) correlations.五、分析与讨论1、描述性统计分析由表可以看出,26个景点的商业投资平均值为1521.9231,标准 差为85. 09567,景区经济增长率和游客增长率均值分别为2. 2019和 3. 7173.2、偏相关分析表上半部分为零阶相关分析结果,下半部分为偏相关分析结果。在控制游客增长率后,商业投资与景点经济增长率的偏相关系数为 0. 083,显著性概率为0.6590.05,说明剔除游客增长率的变量影 响后,景点商业投资额与景点的经济增长率没有显著关系,因此, 也不能说明风景区的商业投资导致了风景区的经济增长。对比零阶 相关可以看出,商业投资与景点经济增长和游客增长率都是显著性 正相关,所以,单凭相关分析来判定两者关系有时会误导的。2、选择个案1、打开数据文件2-L sav。2、选择“数据-选择个案”命令。3、输入条件表达式“绩效评分二80&绩效评分二90";选择60%的 随机个案;在“精确”选项前后两个文本框中输入两个整数5和 10,表示从前10个个案中随机选取5个个案作为样本;在“观测 值”中输入“第一个个案”:5, “最后一个个案”:15;选择“使用 筛选器变量”,从变量列表框中选择一个数值型变量作为过滤器变量 移至矩形框中。4、输出。5、在“选择个案”主对话框中,单击“确定”。四、实验结果国第一次实验. sau - SPSS Data EditorFile Edi t View Data Transform Analyze Graphs Utilities Window Help诩口 |昌|吗| Hr /即 M|圄圄 U园睡1困圄|1:员工序号8C4员工序号性别|工作性质|年收入|绩效评分| filter $年收入mean 1I8122175065133440.00I21112730082131110.00 _312113105070031110.00 _4161431318123120085133440.00 F5113255085131110.00 _6124600060033440.00 _71360375801100350.00 _813110625701100350.00 _91513135000801100350.00 _1010211695084131110.00 _1111212115060131110.00 _129212400090131110.00 _136222625072033440.00 _1417213615087131110.00 _1572195213885080031110.00 _-16214080076031110.00 _|17224200075133440.00 _r is214230066131110.00 _r 19202392000800100350.00 _20423103750901100350.00五、分析与讨论1、建立数据文件需要对实验结果进行分析与讨论XIX XTX XTX <TX TX XTX XTX XTX XTX TX XTS XTX XT TX XTX XTX XTX XTX TX XfX XTX XTX XTX TX 7 XTX TX XTX XTX TX XT%TX XTX XTX XTX XTX XTX XTX XTX XT XjX <TX TX XTX XTX 7X XTS TX TX <TX !> 7 XTX XTX XTX XTXvlx slz fx viz vizsix vjx six >lz viz Jx six Lz six slzsl XIX >Lz vlx sl< >Lz six sj >1 %Lz xz six viz sl> sXz>IX six >L sjx >1 %tzxjx xjx Jx Tx xtx xjx Tx Jxxjx xjx Tx jxzjx zrx Jx Tx xrx xjx jxTx xjx xj xjx xjx xjx xrx Jx rx Jx jx Tx jx Jx xjx T>LXk!x XIX XlXXIXk!x vix XIX x!xvjxvlx k!xlxXIX VIXZT XTX XTX XTX XT ZT #T XT Xj XT ZT TX XTX XTX XT ZTXXTX#TS TX XTX ZTX XTX XTZT XT XTX XTX Zj XT ZTx XTX XtS XT2、选择个案需要对实验结果进行分析与讨论xjx KLXTXXTX XTX XTX XTX TX XTX XTX XTX XT XTX XTS XTX XTS XTX TX XTX XTX TX XTS XTX XTX XTX XT XTX XTX XTX XTX XTX XTX XTX TX XT%XTX XT XTX TX XTX XTX XTX XTX XT XTX XTX TX XTX XTX XTX XTX TX XTX XTX XT XTX XTX TX XT> XTX%|xxlxxlz xlzXT% XTS XT% Xj XT XT% Xj XTS TT Xj XjX XT XjX 7% XTX T% TX XT XT TX f% XTX XTX XJ XjX jX X|X#T% XJ T% XJ #7 XjX jX XJ TS XJX XTS XJS XjX XTX XjX T% XjX XJXTS XTX XT IX XTSk!xxj XTX XTX XTX XT xtx rx Tx xT xj xt zt Tx xtx xt Ztx Zt tx xt xtxts rx Tx xt T%XTX XT XTX XTX Zr #T XT xj rx XT实验二描述性统计分析一、实验目的1、理解和掌握基本描述统计量的意义及其构造原理;2、熟悉基本描述统计量的类别及其对数据的描述功能;3、熟悉获得基本描述统计量的SPSS操作方法;4、学习运用基本描述统计量分析问题的一般规范;二、实验内容运用数据文件3-1. sav,对机械厂职工的基本数据进行描述, 计算男女全体职工、男职工和女职工的月基本工资的情况:1、均值(及标准误)、中位数、众数2、全距(及最大值和最小值)、方差和标准差3、峰度和偏度三、实验步骤1、打开数据文件3T. sav。2、执行“分析一描述统计一描述”命令。3、在“描述性”对话框中,从左边源变量列表中选择“月基本工 资”移入右边的“变量”框中。4、点击“选项”,选择“均值”、“标准差”、“方差”、“范围”、“最小值”、“最大值”和“均值的标注误”、“峰度”和“偏度”。5、单击“确定”,提交系统运行。得到男女全体职工月基本工资的情况。6、对数据文件3-1. sav执行“数据一选择个案”命令,选择“如 果条件满足”项目,点击“如果”按钮,打开“选择个案:if”,输 入“sex=l”或“sexR”,点击“继续”,在“选择个案”对话框的 “输出”栏中,选择系统默认设置“过滤掉未选定的个案”,点击 “确定”,完成职工(个案)的性别选择。四、实验结果Descriptive StatisticsNRangeMinimumMaximumMeanStd.VarianceSkewnessKurtosisStatisticStatisticStatisticStatisticStatisticStd. ErrorStatisticStatisticStatisticStd. ErrorStatisticStd. Bror月基本工资(元)Valid N (listwise)429429350.00200.00550.00346.56633.8900980,572756491.968.376.118-.671.235Descriptive StatisticsNRangeMinimumMaximumMeanStd.VarianceSkewnessKurtosisStatisticStatisticStatisticStatisticStatisticStd. &rorStatisticStatisticStatisticStd. BrorStatisticStd. Bror月基本工资(元)Valid N (listwise)301301350.00200.00550.00361.23024.6950281.455506634.998.186.140-.707.280Descriptive StatisticsNRangeMinimumMaximumMeanStd.VarianceSkewnessKurtosisStatisticStatisticStatisticStatisticStatisticStd.&rorStatisticStatisticStatisticStd. ErrorStatisticStd. &ror月基本工资(元)Valid N (listwise)128128308.00200.00508.00312.08325.9273867,060664497.132.784,214-.129,425五、分析与讨论基本描述统计通过堆样本数据的集中趋势(均值(及标准误)、中位数和众数)、离散趋势(全距(及最大值和最小值)、方差和标 准差)和分布形态(峰度和偏度)的分析,可以使研究者清晰的把 握数据的分布特点。实验三数据探索一、实验目的1、了解数据探索的功能与统计原理2、掌握SPSS数据探索的操作方法3、学习通过数据探索,了解数据分布基本特征,识别数据中的界 外值和极端值二、实验内容运用数据文件3-1. sav,对机械厂男职工和女职工的工龄分布 进行频数分析。人数进行统计,输出频数分布表和条形图。三、实验步骤1、打开数据文件3T. sav。2、执行“分析一描述统计一探索”命令。3、在“探索”对话框中,从左边源变量列表中选择“工龄”、“年 龄,,“性别”和“Employeecode(id)”,分别移入右边的“因变量列 表”、“因子列表”、和“标注个案”下面的空白框中,;“输出”栏下 选择“图”选项。4、在“探索”对话框中点击“统计量”,选择系统默认设置。5、在“探索”对话框中点击“绘制”,选择默认系统设置。6、在“探索”对话框中点击“选项”,选择默认系统设置。7、在“探索”对话框中点击“确定”,提交系统运行。四、实验结果Case Processing Summary,性别CasesValidMissingTotalNPercentNPercentNPercent工龄(年)女128100.0%0.0%128100.0%男301100.0%0.0%301100.0%Descriptives,性别StatisticStd. Bror工龄(年)女Mean11.45.74695% Confidence Lower Bound9.97Interval for Mean Upper Bound12.925% Trimmed Mean10.82Median10.00Variance71.273Std. Deviation8.442Minimum1Max imum52Range51Interquartile Range13Skewness1.245.214Kurtosis3.154.425男Mean16.74.60095% Confidence Lower Bound15.56Interval for Mean Upper Bound17.925% Trimmed Mean16.19Median17.00Variance108.333Std. Deviation10.408Minimum1Max imum89Range88Interquartile Range12Skew ness1.907.140Kurtosis10.857.280工龄(年)Stem-and-Leaf Plot forsex=女Frequency Stem & Leaf14. 000 .9. 000 .22223333313. 000 .444445555555513. 000 .666677777777711. 000 .8888888899911. 001 .14. 001 .222222222333335. 001 .445555. 001 .6666712. 001 .8888999999997. 002 .00011118. 002 .22222333.002 .002 .2. 002 .881. 003 .02. 003 .231.00Extremes0=52)Stem width:10Each leaf:1 case (s)工龄(年)Stem-and-Leaf Plot forsex=男FrequencyStem & Leaf16. 000 .14. 000 .222222222233333. 000 .45522. 000 .666666666677777777777713. 000 .888888889999918. 001 .00000000000111111139. 001 .22222222222222222222222333333333333333319. 001 .444555555555555555515. 001 .66667777777777733. 001 .88888888888889999999999999999999923. 002 .0000000000000000111111127. 002 .22222222222222233333333333312. 002 .44444444555513. 002 .667777777777711. 002 .88888888999