我国城镇居民人均消费的SPSS统计分析(18页).doc

资源ID：36325251 资源大小：4.62MB 全文页数：18页
资源格式： DOC 下载积分：15金币

快捷下载

会员登录下载

微信登录下载

三方登录下载：

微信扫一扫登录

下载资源需要15金币

邮箱/手机：
温馨提示：	快捷下载时，用户名和密码都是您填写的邮箱或者手机号，方便查询和重复下载（系统自动生成）。如填写123，账号就是123，密码也是123。
支付方式：
验证码：	换一换

账号：
密码：
验证码：	换一换
当日自动登录忘记密码？

友情提示

1、下载资料失败解决办法

2、PDF文件下载后，可能会被浏览器默认打开，此种情况可以点击浏览器菜单，保存网页到桌面，就可以正常下载了。

3、本站不支持迅雷下载，请使用电脑自带的IE浏览器，或者360浏览器、谷歌浏览器下载即可。

4、本站资源下载后的文档和图纸-无水印,预览文档经过压缩，下载后原文更清晰。

5、试题试卷类文档，如果标题没有明确说明有答案则都视为没有答案，请知晓。

网站客服

侵权投诉

我国城镇居民人均消费的SPSS统计分析(18页).doc

-2013年我国城镇居民人均消费的SPSS统计分析一、搜集到的2013年我国31个城市城镇居民人均消费水平的数据数据来源：国家统计局二、对数据的基本分析在数据文件建立好后，通常还需要对待分析的数据进行必要的预加工处理，这是数据分析过程中不可缺少的一个关键环节.（一）、对数据按人均消费（expend）进行降序排列操作步骤：（1）：选择“数据”“排序个案”菜单项（2）：将“人均消费（expend）”选入“排序依据”列表框，选中“降序” （3）：点击“确认”按钮，生成如下降序排列的数据集由数据的降序排列可以看出，全国只有上海、北京、广东等九个城市的城镇人均消费在全国城镇人均消费水平以上.（二）、作出人均收入和人均消费的直方图操作步骤：（1）：选择“图形”，打开“图表构建程序”菜单项（2）：从“库”中选择“直方图”将其拉入“图表预览使用数据实例” （3）：将变量“地区”设置为x轴，将“人均收入”和“人均消费”设置为y轴（4）：点击“确认”按钮，即生成如下直方图通过一个复合条形图，可以很明确的发现我国城镇居民生活水平存在很大的地区差异，地区发展很不平衡，从图中的生活消费支出和人均收入来看，北京，上海，浙江这些省市城镇居民消费水平最高，人均收入也是最高的，各省市的城镇居民消费水平差异较大，大多数省份城镇居民人均消费集中在15000元左右.（三）、对数据按照人均消费作出直方图，以统计我国农村人均消费的水平1、首先对数据分组，分组数目的确定.按照Sturges提出的经验公式来确定组数K,K=1+，计算得组数为6.2、确定组距组距=（最大值-最小值）/组数=（28155.00-12231.90）/6=2653.85，可近似取值为3000.00元.操作步骤：（1）：选择“转换”“可视离散化”菜单项，将“人均消费”选入“要离散的变量”列表框中，单击“继续”按钮进入主对话框. （2）：单击“生成分割点”按钮，设定分割点数量为6，宽度为3000.00，可见系统会自动会填充第一个分割点的位置为12231.90，单击“应用”返回到主对话框. （3）：此时可以看到下部数值标签网格里的“值”列已被自动填充，单击“生成标签”按钮，是标签列也得到自动填充. （4）：将离散的变量名设定为expendNew. （5）：单击“确定”按钮.3、频数分析操作步骤：（1）：选择“分析”“描述统计”“频率”，打开频率对话框. （2）：选定“expendNew”，点击“图表”，选择“条形图”点击继续. （3）：点击“确认”，生成如下三张表.Statistics人均消费(已离散化)NValid32Missing0Mean3.13Median3.00Std. Deviation1.314Minimum1Maximum7Percentiles252.00503.00753.75人均消费(已离散化)FrequencyPercentValid PercentCumulative PercentValid<= 12231.9013.13.13.112231.91 - 15231.901031.331.334.415231.91 - 18231.901340.640.675.018231.91 - 21231.9039.49.484.421231.91 - 24231.9039.49.493.824231.91 - 27231.9013.13.196.927231.91+13.13.1100.0Total32100.0100.0由上图的频数分析可以看出，我国2013年城镇居民人均消费支出集中在第二组和第三组，大约占到百分之七十.由于在表格中不存在缺失值，因此频数分布表中的百分比和有效百分比相同.从此次分析中可以看出，我国城镇家庭居民人均消费的总体水平比较集中，大约在12000元-18000元之间，还有少数省市的消费水平处在中等阶段，而有上海、北京、浙江等一些经济较发达的地区的城镇家庭居民人均消费达到了21000元以上.三、对数据的回归分析（一）、作出人均收入与消费支出散点图，以观察他们的线性关系如何操作步骤：（1）：选择“图形”，打开“图表构建程序”菜单项（2）：从“库”中选择“散点图”将其拖入“图表预览使用数据实例” （3）：将“人均收入”选定为x轴，将“人均消费”选定为y轴（4）：点击“确认”生成如下散点图由散点图可以看出，人均消费Y和人均收入X大概呈一元线性关系，因此可以建立一元线性模型进行回归分析.（二）假设回归模型为Y=a+b X,其中，Y表示城镇人均消费支出，为被解释变量，X表示人均收入，为解释变量，b为回归系数.操作步骤：（1）选择“分析”“回归”“线性”菜单项，打开“线性回归”对话框. （2）将“人均消费”选入“因变量”列表框，将“人均收入”选入“自变量”列表框. （3）单击“确定”按钮.得到如下（1）、（2）、（3）、（4）四张表格，依次分析如下：表（1）：移入/移出的变量Variables Entered/RemovedbModelVariables EnteredVariables RemovedMethod1人均收入a.Entera. All requested variables entered.b. Dependent Variable: 人均消费从上表可以看出，放入模型的变量只有一个即“人均收入”，选择变量的方法为强行进入法，也就是说将所有的自变量都放入模型中，模型的因变量为“人均消费”.表（2）：模型汇总Model SummaryModelRR SquareAdjusted R SquareStd. Error of the Estimate1.960a.922.9201106.90715a. Predictors: (Constant), 人均收入上表是对模型的简单汇总，其实就是对回归方程拟合情况的描述，通过这张表可以知道相关系数R=0.960，决定系数=0.922，调整决定系数=0.920,和回归系数的标准误=31106.90715.由于决定系数接近于1，说明模型的拟合程度较好.表（3）：方差分析表ANOVAbModelSum of SquaresdfMean SquareFSig.1Regression4.353E814.353E8355.256.000aResidual36757303.474301225243.449Total4.720E831a. Predictors: (Constant), 人均收入b. Dependent Variable: 人均消费F=355.256，P=0.000<0.05,表明回归方程高度显著，即农民人均收入对消费有高度影响.表（4）：系数CoefficientsaModelUnstandardized CoefficientsStandardized CoefficientstSig.BStd. ErrorBeta1(Constant)1897.504835.9832.270.031人均收入.599.032.96018.848.000a. Dependent Variable: 人均消费由上表知a=1897.504，b=0.599，由此可以得出以下回归方程：人均消费Y=1897.504+0.599人均收入X上述回归方程给出了如下信息：2013年中国城镇居民人均可支配收入增加1元，人均消费支出增加0.599元.四、单样本的T检验（一）：由频数分析可知，分组后，全国31个省市的城镇家庭居民平均每人生活消费支出合计，大约有23个城市都集中在第一组，数额主要12231.91 18231.90元之间，其中在15231.91 - 18231.90之间的占到了百分之四十，因此可推断，全国农村家庭居民平均每人生活消费支出的平均数应该在15000-20000元之间，假设为18000元，由于该问题涉及的是单个总体，且要进行总体均值检验，同时农村家庭居民平均每人消费的总体可近似认为服从正态分布，因此，应采用单样本t检验来分析推断全国农村家庭居民人均消费的平均值是否为18000元.分析结果如下：（二）：操作步骤：1、选择“分析”“比较均值”“单样本天t检验”菜单项，打开“单样本t检验”对话框如下图所示： 2、单击“确定”按钮.生成如下两张图表：表（1）：One-Sample StatisticsNMeanStd. DeviationStd. Error Mean人均消费3217216.60313902.16064689.81106表（2）：One-Sample TestTest Value = 18000 tdfSig. (2-tailed)Mean Difference95% Confidence Interval of the DifferenceLowerUpper人均消费-1.136310.265-783.39688-2190.2758623.4821由表（1）可知样本均值为17216.6031，低于基准线18000.00，标准差3902.16064，均值标准差689.81106.由表（2）为单样本t检验的分析结果，第一行注明了用于比较的假设总体均数为18000，下面从左到右依次为t值、自由度、p值、两均数的差值、差值.根据上面的检测结果t=-1.136，p=0.256，由于p>0.05，所以不能拒绝原假设，可以认为人均消费水平在18000元.同时，可知全国城镇居民2013年人均消费在95的置信水平下的置信区间为：（15809.7242,18623.4821）.五、非参数检验多配比样本分参数检验数据中我国城镇家庭居民人均消费包括食品、衣着、居住、家庭设备、交通及通讯、文教娱乐、医疗保健、和其他8个指标，为了比较清楚的了解这8项指标对我国城镇居民人均消费总体的影响，以及其大概的消费动向，可以利用多配比样本的非参数检验Friedman 检验对各个指标进行检验.（一）：操作步骤：（1）选择“分析”“非参数检验”“旧对话框”“k个相关样本”菜单项，打开如下对话框：（2）：单击“确定”按钮，得到如下两张表格：表（1）：RanksMean Rank食物消费8.00衣物消费5.09居住消费4.50家居设备2.66交通通讯6.38医疗保健2.34文教娱乐5.88其它1.16表（2）：Test StatisticsaN32Chi-Square198.604df7Asymp. Sig.000a. Friedman Test（二）、结果分析检验结果中的p值小于给定水平0.05，故拒绝原假设，认为八个指标对我国城镇居民人均消费的影响是有显著差异的.由表（1）知食物消费对人均消费的影响最大，其次是交通通讯和衣物消费，而影响最小的是其它.六、因子分析在研究我国城镇居民的消费情况时收集了食物、衣物、居住等八个影响居民消费情况的因素，以期对问题能够有比较全面、完整的把握和认识.由于数据过多，在实际建模时，这些变量未必能真正发挥预期的作用，会给统计分析带来许多问题，可以表现在：计算量的问题和变量间的相关性问题.为了解决这些问题，最简单和最直接的解决方案是削减变量个数，但这又必然会导致信息丢失和信息不完整等问题的产生.为此，人们希望探索一种更有效的解决方法，它既能大大减少参与数据建模的变量个数，同时也不会造成信息的大量丢失.因子分析正是解决这种问题的方法.（一）操作步骤（1）、选择菜单“分析”“降维”“因子分析”，出现因子分析对话框；（2）、把参与因子分析的样本选到变量对话框中，如下图：（3）单击“确定”按钮，得到如下11张图：图（1）原有变量的相关系数矩阵：Correlation Matrix食物消费衣物消费居住消费家居设备医疗保健交通通讯文教娱乐其它Correlation食物消费1.000.288.656.744.295.787.782.732衣物消费.2881.000.337.517.694.368.374.634居住消费.656.3371.000.676.505.849.750.771家居设备.744.517.6761.000.441.830.853.767医疗保健.295.694.505.4411.000.479.414.600交通通讯.787.368.849.830.4791.000.860.782文教娱乐.782.374.750.853.414.8601.000.831其它.732.634.771.767.600.782.8311.000从上图可以看到，大部分的相关系数都较高，各变量呈较强的线性关系，能够从中提取公共因子，适合进行因子分析.图（2）巴特利特球度检验和KMO检验KMO and Bartlett's TestKaiser-Meyer-Olkin Measure of Sampling Adequacy.833Bartlett's Test of SphericityApprox. Chi-Square233.009df28Sig.000由上图知，巴特利特球度检验统计量的观测值为233.009，相应的概率p为0.如果给出的显著性水平为0.05，由于概率p小于显著性水平，应拒绝零假设，认为相关系数矩阵与单位阵有显著地差异.同时，KMO值为0.833，根据Kaiser给出了KMO度量标准可知原有变量适合进行因子分析.图（3）因子分析的初始解CommunalitiesInitialExtraction食物消费1.000.798衣物消费1.000.862居住消费1.000.750家居设备1.000.812医疗保健1.000.821交通通讯1.000.897文教娱乐1.000.885其它1.000.872Extraction Method: Principal Component Analysis.由上图第二列可知，所有变量的共同度均较高，各个变量的信息丢失较少.因此，本次因子提取的总体效果较理想.图（4）因子解释原有变量总方差的情况：Total Variance ExplainedComponentInitial EigenvaluesExtraction Sums of Squared LoadingsRotation Sums of Squared LoadingsTotal% of VarianceCumulative %Total% of VarianceCumulative %Total% of VarianceCumulative %15.50468.79468.7945.50468.79468.7944.52456.54556.54521.19214.89883.6921.19214.89883.6922.17227.14783.6923.4735.91089.6024.2583.22292.8245.2372.96195.7856.1782.22798.0127.0911.13699.1478.068.853100.000Extraction Method: Principal Component Analysis.上图第一组数据项描述了初始因子解的情况.可以看到，第一个因子解的特征根值为5.504，解释原有八个变量总方差的68.794，累计方差贡献率为68.794.其余数据含义类似.在初始解中由于提取了八个因子，因此原有变量的总方差均被解释掉.第二组数据项描述了因子解的情况.可以看到，由于指定提取两个因子，两个因子共解释了原有变量总方差的83.692.总体上，原有变量的信息丢失较少，因子分析效果较理想.第三组数据项描述了最终因子解的情况.可见，因子旋转后，累计方差比没有改变，也就是没有影响原有变量的共同度，但却重新分配了各个因子解释原有变量的方差，改变了各因子的方差贡献，使得因子更容易解释.图（5）因子的碎石图：上图横坐标为因子数目，纵坐标为特征根.可以看到，第一个因子的特征根值很高，对原有变量的贡献最大；第3个以后的因子特征根都较小，对解释原有变量的贡献很小，已经成为可被忽略的“高山脚下的碎石”，因此提取两个因子是合适的.图（6）因子载荷矩阵：Component MatrixaComponent12其它.929.097交通通讯.921-.222文教娱乐.909-.241家居设备.895-.103居住消费.854-.143食物消费.822-.350衣物消费.599.710医疗保健.635.646a. 2 components extracted.上图因子载荷矩阵是因子分析的核心内容.根据该表可以写出本案例的因子分析模型：其它=0.929+0.097 交通通讯=0.921-0.222文教娱乐=0.909-0.241 家居设备=0.895-0.103居住消费=0.854-0.143 食物消费=0.822-0.350衣物消费=0.599+0.710 医疗保健=0.635+0.646由上表知，八个变量在第一个因子上的载荷都很高，意味着他们与第一个因子的相关度高，第一个因子很重要.图（7）旋转后的因子载荷矩阵：Rotated Component MatrixaComponent12交通通讯.915.244文教娱乐.914.222食物消费.889.084家居设备.836.336居住消费.819.281其它.770.528衣物消费.188.909医疗保健.250.871a. Rotation converged in 3 iterations.由上图知，交通通讯、文教娱乐、食物消费、家居设备、居住消费、其它在第一个因子上有较高的载荷，第一个因子主要解释了这几个变量；衣物消费、医疗保健在第二个因子上的载荷较高，第二个因子主要解释了这几个变量.图（8）因子旋转中的正交矩阵Component Transformation MatrixComponent121.879.4772-.477.879图（9）因子协方差矩阵：Component Score Covariance MatrixComponent1211.000.0002.0001.000从上表可以看出，两因子没有线性相关性，实现了因子分析的设计目标.图（10）旋转后的因子载荷图：由上图可以直观的看出，衣物消费和食物消费比较靠近两个因子坐标轴，表明如果分别用第一个因子刻画食物消费，用第二个因子刻画衣物消费，信息丢失较少，效果较好.图（11）因子得分系数矩阵：Component Score Coefficient MatrixComponent12食物消费.271-.187衣物消费-.188.576居住消费.194-.032家居设备.184.001医疗保健-.157.532交通通讯.236-.084文教娱乐.241-.099其它.110.152 根据上表可以得到以下因子得分函数：=0.271食物消费-0.188衣物消费+0.194居住消费+0.184家居设备-0.157医疗设备+0.236交通通讯+0.241文教娱乐+0.110其它=-0.187食物消费+0.576衣物消费-0.032居住消费+0.001家居设备+0.532医疗设备-0.084交通通讯-0.099文教娱乐+0.152其它可见计算两个因子得分变量的变量值时，食物消费和衣物消费的权重较高，但方向恰好相反，这与因子的实际含义是相吻合的.七、实验心得本科的时候有概率统计和数理分析的基础，但是从来没有接触过应用统计分析的东西，SPSS也只是听说过，从来没有学过.一直以为这一块儿会比较难，这学期最初学的时候，因为没有认真看教材，课下也没有认真搜集相关资料，所以学起来有些吃力，总感觉听起来一头雾水.老师说最后的考核是通过提交学习报告，然后我从图书馆里借了些教材查了些资料，发现很多问题都弄清楚了.结合软件和书上的例子，实战一下，发现SPSS的功能相当强大.这门课要学习完了，整个学习的过程是充满曲折和挑战的，我见证了自己从一无所知到困惑迷茫再到略懂再到会用的过程.甚至学完之后有些问题还没有彻底搞清楚，自己接下来还会不断的探索的.SPSS是个很神奇的工具，结合AMOS和EXCEL更是如虎添翼，相信学习了SPSS在以后的论文和数据分析中很有用.这门课给我的感觉是看起来很难，但是实际学起来就好很多，因为当我结合具体实例和软件的时候，很多抽象的问题就豁然开朗了.但是想给老师一个建议，这门课需要很强的统计和概率论的基础，要不然就会很难听懂或者听得半懂.然后这门课的很多方法的相关资料都是用在医疗卫生、自然科学领域的，在管理中的应用的资料不怎么多.老师希望我们上课的时候结合在管理中的应用来学习，但是资料有限，希望老师在这个方面多给学生一些引导.-第 18 页-

注意事项

本文（我国城镇居民人均消费的SPSS统计分析(18页).doc）为本站会员（1595****071）主动上传，淘文阁 - 分享文档赚钱的网站仅提供信息存储空间，仅对用户上传内容的表现方式做保护处理，对上载内容本身不做任何修改或编辑。若此文所含内容侵犯了您的版权或隐私，请立即通知淘文阁 - 分享文档赚钱的网站（点击联系客服），我们立即给予删除！

温馨提示：如果因为网速或其他原因下载失败请重新下载，重复下载不扣分。