《2022年spss的数据分析报告范例.docx》由会员分享,可在线阅读,更多相关《2022年spss的数据分析报告范例.docx(14页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、关于某地区 361 个人旅行情形统计分析报告一、 数据介绍:本次分析的数据为某地区361 个人旅行情形状况统计表,其中共包含七变量,分别是:年龄,为三类变量;性别,为二类变量(0 代表女, 1 代表男);收入,为一类变量;旅行花费,为一类变量;通道,为二类变量(0 代表没走通道, 1 代表走通道);旅行的积极性,为三类变量(0 代表积极性差, 1 代表积极性一般, 2 代表积极性比较好, 3 代表积极性好 4代表积极性特别好); 额外收入 , 一类变量;通过运用 spss 统计软件,对变量进行频数分析、描述性 统计、方差分析、相关分析,以明白该地区上述方面的综合状况,并分析个变量的分布特点及相
2、互间的关系;二、 数据分析1、频数分析;基本的统计分析往往从频数分析开头;通过频数分地区359个人旅行基本状况的统计数据表,在性别、旅行的积极性不同的状况下的频数分析,从而明白该地区的男女职工数量、不同积极性情形的基本分布;统计量积极性性别N有效359359缺失00第一,对该地区的男女性别分布进行频数分析,结果如下频率性别百分比有效百分比累积百分比有效女19855.255.255.2男16144.844.8100.0合计359100.0100.0表说明,在该地区被调查的 359 个人中,有 198 名女性, 161 名男性,男女比例14 / 14分别为 44.8% 和55.2% ,该公司职工男
3、女数量差距不大,女性略多于男性;其次对原有数据中的旅行的积极性进行频数分析,结果如下表:有效差频率171百分比47.6有效百分比47.6累积百分比47.6一般7922.022.069.6比较好7922.022.091.6好246.76.798.3特别好61.71.7100.0合计359100.0100.0积极性其次对原有数据中的积极性进行频数分析,结果如下表:其次对原有数据中的是否进通道进行频数分析,结果如下表:Statistics通道NValid359Missing0Frequency通道PercentValid PercentCumulative PercentValid没走通道29381
4、.681.681.6通道6618.418.4100.0Total359100.0100.0这说明,在该地区被调查的 359 个人中,有没走通道的占 81.6% ,占绝大多数;上表及其直方图说明,被调查的 359 个人中,对与旅行积极性差的组频数最高 的,为 171 人数的 47.6%,其次为积极性一般和比较好的,占比例都为22.0%,积性为好的和特别好的比例比较低,分别为24人和6人,占总体的比例为 6.7%和1.7%;2、 描述统计分析;再通过简洁的频数统计分析明白了职工在性别和受训练水平上的总体分布状况后,我们仍需要对数据中的其他变量特点有更为精确的熟悉,这就需要通过运算基本描述统计的方法
5、来实现;下面就对各个变量进行描述统计分析,得到它们的均值、标准差、片度峰度等数据,以进一步把我数据的集中趋势和离散趋势;描述统计量微小N值极大值均值标准差方差偏度峰度统计量统计量统计量统计量统计量统计量统计量标准误标准统计量误收入359 7.426 6250.000 1032.93021 762.523942581442.7621.790.1296.869.257旅行花费359211006116.41130.71617086.7043.145.129 13.401.257有效的 N (列表状态)359如表所示,以起始工资为例读取分析结果,359个人中收入最小值为 7.426¥,最大值为 625
6、0.00000 ¥,平均 1032.9302 ¥,标准差为 762.5239 ¥ 偏度系数和峰度系数分别为 1.790 和6.869 ;其他数据依此读取,就该表说明该地区旅行花费的具体分布状况;3、探干脆数据分析(1) ) 交叉分析;通过频数分析能够把握单个变量的数据分布情形,但是在实际分析中,不仅要明白单个变量的分布特点,仍要分析多个变量不同取值下的分布,把握多个变量的联合分布特点,进而分析变量之间的相互影响和关系;就本数据而言,需要明白现工资与性别、年龄、受训练水平、起始工资、本单位工作经受、以前工作经受、职务等级的交叉分析;现以现工资与职务等级的列联表分析为例, 读取数据(下面数据分析表
7、为截取的一部分):Count性别*积极性交叉制表计数积极性差一般比较好好特别好合计性别女964741122198男753238124161合计1717979246359上联表及 Bar Chart 涉及两个变量,即性别与积极性的二维交叉,反映了在不同的性别对于旅行积极性分布情形;上表中,性别成为行向量,积极性列向量;(2) )性别与收入的探干脆分析性别Case Processing Summary性别NValidPercentNCases MissingPercentNTotalPercent收入女198100.0%0.0%198100.0%男161100.0%0.0%161100.0%Des
8、criptives性别StatisticStd. Error收入女Mean1005.2856249.51479695% Confidence Interval for MeanLower Bound907.63853Upper Bound1102.932725% Trimmed Mean957.92021Median937.50000Variance485439.577Std. Deviation696.734940Minimum7.426Maximum3125.000Range3117.574Interquartile Range937.563Skewness.896.173Kurtosis
9、.310.344男Mean1066.9279165.99321995% Confidence IntervalLower Bound936.59779for MeanUpper Bound1197.258025% Trimmed Mean986.95497Median937.50000Variance701171.907Std. Deviation837.360082Minimum58.630Maximum6250.000Range6191.370Interquartile Range718.750Skewness2.370.191Kurtosis10.166.380收入Stem-and-Le
10、af Plots收入 Stem-and-Leaf Plot for性别= 女FrequencyStem & Leaf18.000 .00111111111111111126.000 .2222222222222333333333333317.000 .4444444444455555533.000 .66666666666666666666677777777777722.000 .888999999999999999999913.001 .000000000111118.001 .22222222222222222318.001 .4444555555555555554.001 .77775.
11、001 .8888814.002 .00000111111111.002 .4.002 .55551.002 .62.002 .883.00 Extremes=3000Stem width: 1000.000 Each leaf:1 cases收入 Stem-and-Leaf Plot for性别= 男FrequencyStem & Leaf15.000 .00111111111111117.000 .2222223333333333313.000 .444444555555526.000 .6666666666666777777777777719.000 .88888999999999999
12、9913.001 .000000000001119.001 .222222222222222222313.001 .44445555555552.001 .776.001 .8888896.002 .00011112.00 Extremes=2351Stem width: 1000.000 Each leaf:1 cases结果分析如下收入女男平均数1005.285621066.92791均数的 95%可信区间(907.63853 , 1102.93272 ) ( 936.59779 , 1197.25802 )5%的调整均数957.92021986.95497中位数937.50000937.
13、50000标准差696.734940837.360082标准差485439.577701171.907最小值7.42658.630最大值3125.0006250.000极差3117.5746191.370四分位数间距937.563718.750偏度系数2.3702.370峰度系数.31010.166( 3) p-p图分析Age结果分析年龄在正态 p-p 图的散点近似成一条直线,无趋势正态p-p 图的散点匀称分布在直线 y=0 的上下,故可认为本资料听从正态分布4、相关分析; 相关分析是分析客观事物之间关系的数量分析法,明确客观事之间有怎样的关系对懂得和运用相关分析是极其重要的;函数关系是指两事
14、物之间的一种一一对应的关系,即当一个变量X 取肯定值时,另一个变量函数 Y 可以依据确定的函数取肯定的值;另一种普遍存在的关系是统计关系;统计关系是指两事物之间的一种非一一对应的关系,即当一个变量 X 取肯定值时,另一个变量 Y 无法依据确定的函数取肯定的值;统计关系可分为线性关系和非线性关系;事物之间的函数关系比较简洁分析和测度,而事物之间的统计关系却不像函数关系那样直接,但的确普遍存在,并且有的关系强有的关系弱,程度各有差异;如何测度事物之间的统计关系的强弱是人们关注的问题;相关分析正是一种简洁易行的测度事物之间统计关系的有效工具;Correlations收入旅行花费额外收入*收入 Pea
15、rson Correlation1.140.853Sig. 2-tailed.008.000N359359359旅行花费Pearson Correlation.140 *1.183 *Sig. 2-tailed.008.000额外收入NPearson Correlation359.853 *359.183 *3591Sig. 2-tailed.000.000N359359359*. Correlation is significant at the 0.01 level 2-tailed.上表是对本次分析数据中,旅行花费、收入、额外收入的相关分析,表中相关系数旁边有两个星号( * )的,表示显
16、著性水平为0.01 时,仍拒绝原假设;一个星号( * )表示显著性水平为0.05 是仍拒绝原假设;先以现旅行花费这一变量与其他变量的相关性为例分析,由上表可知,旅行花费与额外收入的相关性最大,5.回来分析有相关性分析可得收入,旅行花费呈线性相关,因此作回来分析Variables Entered/RemovedbModelVariables EnteredVariablesRemovedMethod1收入a. Entera. All requested variables entered.b. Dependent Variable:旅行花费Model SummarybModelRR Square
17、Adjusted R SquareStd. Error of the Estimate1.140 a.020.017129.604a. Predictors: Constant,收入b. Dependent Variable:旅行花费bANOVAModelSum of SquaresdfMean SquareFSig.a1Regression120443.8091120443.8097.170Residual5996596.23935716797.188Total6117040.048358.008a. Predictors: Constant,收入b. Dependent Variable:
18、旅行花费aCoefficientsUnstandardized CoefficientsStandardized CoefficientsModelBStd. ErrorBetatSig.1Constant91.56311.5287.943.000收入.024.009.1402.678.008a. Dependent Variable:旅行花费aResiduals StatisticsMinimumMaximumMeanStd. DeviationNPredicted Value91.74241.90116.4118.342359Std. Predicted Value-1.3456.842.
19、0001.000359Standard Error of Predicted Value6.84047.3629.0483.426359Adjusted Predicted Value92.09271.79116.5319.018359Residual-193.904891.785.000129.423359Std. Residual-1.4966.881.000.999359Stud. Residual-1.6076.891.0001.002359Deleted Residual-223.789894.316-.117130.229359Stud. Deleted Residual-1.6117.390.0041.025359Mahal. Distance.00046.811.9972.955359Cooks Distance.000.199.003.015359Centered Leverage Value.000.131.003.008359a. Dependent Variable:Charts旅行花费由上图可知回来方程:y=91.563 + 0.024 x1,PSig=0.0000.01即 旅行花费 =91.563 +0.024*收入 p0.05旅行花费不成显著性差异,由图中可知旅行的旅行花费较高;学号:姓名 :班级 :
限制150内