2019SPSS简单数据统计分析报告(共20页).doc





《2019SPSS简单数据统计分析报告(共20页).doc》由会员分享,可在线阅读,更多相关《2019SPSS简单数据统计分析报告(共20页).doc(20页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、精选优质文档-倾情为你奉上2019SPSS简单数据统计分析报告目 录一、数据样本描述本次分析的数据为某公司474名职工状况统计表,其中共包含11个变量,分别是:id(职工编号),gender(性别),bdate(出生日期),edcu(受教育水平程度),jobcat(职务等级),salbegin(起始工资),salary(现工资),jobtime(本单位工作经历),prevexp(以前工作经历),minority(民族类型),age(年龄)。通过运用SPSS统计软件,对变量进行统计分析,以了解该公司职工总体状况,并分析职工受教育程度、起始工资、现工资的分布特点及相互间的关系。二、要解决的问题描述
2、1 数据管理与软件入门部分1.1 分类汇总以受教育水平程度为分组依据,对职工的起始工资和现工资进行数据汇总。1.2 个案排秩对受教育水平程度不同的职工起始工资和现工资进行个案排秩。1.3 连续变量变分组变量将被调查者的年龄分为10组,要求等间距。2 统计描述与统计图表部分2.1 频数分析利用了某公司474名职工基本状况的统计数据表,在性别、受教育水平程度不同的状况下进行频数分析,从而了解该公司职工的男女职工数量、受教育状况的基本分布。2.2 描述统计分析以职工受教育水平程度为依据,对职工起始工资进行描述统计分析,得到它们的均值、标准差、偏度峰度等数据,以进一步把握数据的集中趋势和离散趋势。3
3、假设检验方法部分3.1 分布类型检验3.1.1 正态分布分析职工的现工资是否服从正态分布。3.1.2 二项分布抽样数据中职工的性别分布是否平衡。3.1.3 游程检验该样本中的抽样数据是否随机。3.2 单因素方差分析把受教育水平和起始工资作为控制变量,现工资为观测变量,通过单因素方差分析方法研究受教育水平和起始工资对现工资的影响进行分析。3.3 卡方检验职工的起始工资水平和现工资水平与其受教育程度之间是否存在关联性。3.4 相关与线性回归的分析方法3.4.1 相关分析(双变量相关分析&偏相关分析)对受教育程度和现工资两个变量进行相关性分析。3.4.2 线性回归模型建立用受教育程度预测现工资水平的
4、回归方程4 高级阶段方法部分对该样本数据进行信效度检测三、具体步骤描述1 数据管理与软件入门部分1.1 分类汇总以受教育水平为分组依据,对职工的起始工资和现工资进行数据汇总。图 1.1分类汇总数据由图1.1所示,受教育等级以年为单位划分可分为8年、12年、14年等图中所示10个等级。以等级为8年为例,现工资均值为24399.06美元,起始工资均值为13064.15美元,统计量为53人。经比较可知,教育年限为12年和15年的职工在公司中占大多数,教育年限为20年和21年的职工在公司中的初始工资平均水平较高,但教育年限为19年的职工现工资平均水平较高。1.2 个案排秩对受教育水平程度不同的职工起始
5、工资和现工资进行个案排秩。表 1.2-1 现工资水平个案排秩统计量統計資料Rank of salary by educN有效遺漏4740平均數中位數標準偏差範圍最小值最大值60.4346046.5000050.189.0001.000190.000表 1.2-2 初始工资水平个案排秩统计量統計資料Rank of salbegin by educN有效遺漏4740平均數中位數標準偏差範圍最小值最大值60.4346047.5000050.189.0001.000190.0001.3 连续变量变分组变量将被调查者的年龄分为5组。表 1.3 被调查者年龄分布(已分组)agec次數百分比有效的百分比累積
6、百分比有效733343435353636373總計16267716762474.21.356.315.014.113.1100.0.21.356.315.014.113.1100.0.21.557.872.886.9100.0根据表1.3所示,该公司474名职员年龄几乎全部在33岁以上、73岁以下,年龄层分布集中在已有工作经验的人当中,其中3343岁的员工为该公司的主体。2 统计描述与统计图表部分2.1 频数分析利用了某公司474名职工基本状况的统计数据表,在性别、受教育水平程度不同的状况下进行频数分析,从而了解该公司职工的男女职工数量、受教育状况的基本分布。表 2.1-1 职工性别频数统计表
7、Gender次數百分比有效的百分比累積百分比有效FemaleMale總計21625847445.654.4100.045.654.4100.045.6100.0由表2.1-1可知,在该公司的474名职工中,有216名女性,258名男性,男女比例分别为45.6%和54.4%,该公司职工男女数量差距不大,男性略多于女性。下面对该公司员工受教育程度进行频数分析:表 2.1-2 职工受教育程度频数统计表Educational Level (years)次數百分比有效的百分比累積百分比有效8121415161718195319011.211.211.240.140.151.361.31.352.5116
8、24.524.577.05912.412.489.5112.32.391.891.91.993.7275.75.799.4202.4.499.8211.2.2100.0總計474100.0100.0图 2.1-2 职工受教育程度频数分布直方图表2.1-2及其直方图说明,被调查的474名职工中,受过12年教育的职工是该组频数最高的,为190人,占总人数的40.1%,其次为15年,共有116人,占总人数的24.5%。且接受过高于20年的教育的人数只有1人,比例很低。2.2 描述统计分析以职工受教育水平程度为依据,对职工起始工资进行描述统计分析,得到它们的均值、标准差、偏度峰度等数据,以进一步把握数
9、据的集中趋势和离散趋势。(由于输出结果较长,为了便于解释,仅截取职工受教育水平年限为8年的分析结果)图 2.2-1 职工起始工资描述统计表(部分)图 2.2-2 职工起始工资描述统计直方图(部分)图2.2给出的就是以受教育年限为8年时职工起始工资的描述统计,由此得出结论如下:(1) 集中趋势指标:由图2.2-1可知,职工起始工资均值为$13064.15,5%截尾均数为$13016.35,中位数为$13050.00,三者差异较大,说明数据分布的对称性较差。(2) 离散趋势指标:起始工资方差为.900,其平方根即标准差为2408.147,样本中极小值为$9750,极大值为美元18750,两者之差为
10、全距(范围)$9000,中间一半样本的全距为四分位间距$4875。(3) 参数估计:职工起始工资的标准误差为$330.784,相应的总体均数95%可信区间为$12400.38-$13727.92。(4) 分布特征指标:根据描述统计数据可知,该样本数据中偏度为0.1480,曲线右偏;峰度为-1.2193,曲线较为平缓(该结论也可从图2.2-2的直方图及其曲线中看出)。3 假设检验方法部分3.1 分布类型检验3.1.1 正态分布分析职工的现工资是否服从正态分布。H0:职工的现工资服从正态分布H1:职工的现工资不服从正态分布=0.05表 3.1.1 职工现工资正态分布检验结果單一樣本 Kolmogo
11、rov-Smirnov 檢定Current SalaryN474常態參數a,b平均數$34,419.57標準偏差$17,075.661最極端差異絕對.208正.208負-.143測試統計資料.208漸近顯著性 (雙尾).000ca. 檢定分配是常態的。b. 從資料計算。c. Lilliefors 顯著更正。图 3.1.1 K-S检验详细模型输出结果如表3.1.1所示:P=0.000P接受H0,认为抽样数据中职工性别比例无差异。3.1.3 游程检验该样本中的抽样数据是否随机(检测数据均以均值为分割点)。(1) 性别:H0:抽样数据中性别序列为随机序列H1:抽样数据中性别序列不为随机序列=0.05
12、表 3.1.3-1 性别序列游程检验連檢定gender測試值a.46觀察值 = 檢定值216總箱數474連個數110Z-11.692漸近顯著性 (雙尾).000a. 平均數图 3.1.3-1 性别序列游程检验详细模型输出P=0.000P接受H1,认为样本数据中性别序列不是随机序列。(2) 年龄:H0:抽样数据中年龄序列是随机序列H1:抽样数据中年龄序列不是随机序列=0.05表 3.1.3-2 年龄序列游程检验结果連檢定Years測試值a47.14觀察值 = 檢定值175總箱數473連個數196Z-2.519漸近顯著性 (雙尾).012a. 平均數图 3.1.3-2 年龄序列游程检验详细模型输出
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 2019 SPSS 简单 数据 统计分析 报告 20

限制150内