Spss大作业.pdf
大作业大作业汽车市场研究汽车市场研究问题描述问题描述以往在我国各地汽车需求量的研究中,主要是根据国家政策、国民经济发展情况、各地区公路状况等,总和不同时期汽车保有量,对汽车市场进行定性分析和决策,这样往往带有主观因素,下面为一组可能影响汽车保有量的数据,部分数据如图,用合理的方法对数据进行研究。图一一 层次聚类层次聚类、求解思路、求解思路用层次聚类的方法,分析与预测各个地区的汽车市场发展情况。首先对原始数据进行标准化变换处理,经过运算使得每列数据的平均值为 0,方差为 1,这样原始数据中 5 列具有不同比较标准的数据就能放在一起比较;然后用标准化后的 30 个不同地区数据求出欧式距离;最后采用 Wald 离差平方和法。、问题求解与分析、问题求解与分析通过 SPSS 软件求解的结果与分析:结果分析:结果分析:图为层次分析的凝聚状态表,第一列为聚类步骤,表示共进行了 29 个步骤的分析;第二列和第三列表示某部聚类分析中,哪两个样本或聚类成了一类;第四列表示两个样本或类间距,从图看出,距离小的样本之间先聚类;第五列和第六列表示某步聚类分析中,参与聚类的是样本还是类,0 表示样本;第七列表示本步聚类分析结果在下面聚类的第几步中用到。Agglomeration ScheduleAgglomeration ScheduleClusterCombinedStage ClusterFirst AppearsStagCluste Cluste Coefficier 1r 2entsNextCluster 1 Cluster 2Stage12345678910111216142072653034829242713243157181922.0100.0250.0400.0560.0810.1070.1360.1690.2135.2693.328001701501001309023087120260240171213141516171819202122132151721113142328121911051329162325.3958.4694.5590.65012.7660.887101314181601501902021902224021230250250271115235819627247121017262512212029263792428275232322282835262729291325280图结果分析:结果分析:图将30个样本分为三类,第一类包括1、2、6、9、10、11,第二类包括3、4、7、12、15、16、18、19、22、26,第三类包括5、8、13、14、17、20、21、23、24、25、27、28、29、30。ClusterClusterMembershipMembership3ClusterCases1:北京2:天津3:河北4:山西5:内蒙古6:辽宁7:吉林8:黑龙江112231239:上海110:江1苏11:浙江12:安徽13:福建14:江西15:山东1233216:河2南17:湖北18:湖南19:广东20:广西21:海南22:四川32233223:贵3州24:云南25:西藏26:陕西27:甘肃28:青海29:宁夏33233330:新3疆图结果分析:图是层次聚类分析的树形图,由于部分样本或小类之间的距离较小,因此光从该图很难清晰看出哪几个样本先聚类,这时应借助于图进行判别。*HIERARCHICALCLUSTERANALYSIS*DendrogramusingWardMethodRescaledDistanceClusterCombineCASE0510152025LabelNum+-+-+-+-+-+安徽12河南16广东四川吉林陕西湖南河北山西19227261834山东15贵州青海西藏黑龙江2328258宁夏29内蒙古新疆湖北江西5301714广西20云南甘肃福建海南24271321天津2浙江11上海9北京1江苏10辽宁6图总分析:总分析:第一类反应的是我国经济发展较发达地区与相对欠发达地区。1、2、9 代表为北京、天津、上海三个直辖市,在全国具有举足轻重的地位,它们的汽车市场发展仍将处于全国领先水平;6、10、11 代表辽宁、江苏、浙江,由于地理、人口、气候及交通等原因,汽车市场的发展将作为今后发展的重要因素,带动这些地区经济的腾飞。第二类中 10 个元素,分别代表陕西、山东、陕西等,这些地区从经济发展看处于中等水平,将是今后汽车发展的大市场。第三类为内蒙古、宁夏、新疆等,这些地区相对来说经济发展较慢,汽车发展空间不大。二二 多元线性回归分析多元线性回归分析求解思路求解思路用多远线性回归的方法,分析国内生产总值、地区人口总数、地区公路长度、全社会货运量对汽车保有量是否有影响。首先自变量强制进入,不用管个因素质量如何,对回归方程是否有影响;然后选择输出默认输出项,输出回归系数的标准误差、标准回归系数等;最后选择 Model fit和 Descriptives,输出判定系数、自变量与因变量的均值、标准差等。问题求解与分析问题求解与分析通过 SPSS 软件求解的结果与分析:Descriptive StatisticsStd.MeanDeviationN汽车总保有量30(万辆)国内生产总值30(亿元)地区人口总数30(万人)地区公路长度30(km)全社会货运量30(万吨)图结果分析:结果分析:图为四个自变量和一个因变量的平均值、方差和个案数为30。Variables Entered/RemovedVariables Entered/Removedb bVariablesModelEnteredVariablesRemovedMethod1全社会货运量(万吨),地区公路长度(km),国内.Enter生产总值(亿元),地区人口总数(万人)aa.All requested variablesentered.Variables Entered/RemovedVariables Entered/Removedb bVariablesModelEnteredVariablesRemovedMethod1全社会货运量(万吨),地区公路长度(km),国内.Enter生产总值(亿元),地区人口总数(万人)ab.Dependent Variable:汽车总保有量(万辆)图结果分析:结果分析:图2.2中第二列为被引入的变量,第三列为从回归方程中被剔除的各个变量,第四列为进入方式。Model SummaryModel SummaryAdjusted R Std.Error ofModelRR SquareSquarethe Estimate1.916a.838.812a.Predictors:(Constant),全社会货运量(万吨),地区公路长度(km),国内生产总值(亿元),地区人口总数(万人)图结果分析:结果分析:图输出常用统计量关系数R为,调整的判定系数为,回归估计的标准误差S=。ANOVAANOVAb bSum ofModelSquaresdfMeanSquareFSig.1Regressi4.000aonResidual25Total29a.Predictors:(Constant),全社会货运量(万吨),地区公路长度(km),国内生产总值(亿元),地区人口总数(万人)b.Dependent Variable:汽车总保有量(万辆)图结果分析:结果分析:图为方差分析表,统计量F=;相伴概率p=0,说明多个变量与因变量之间存在线性回归关系。CoefficientsCoefficientsa aStandardizedUnstandardizedCoefficientsCoefficientsStd.ModelBErrorBetatSig.1(Constant).404.690国内生产总值.010(亿元).003.606.002地区人口总数.002.009(万人)地区公路长度.000(km).000.237.100全社会货运量.001(万吨).000.603.002a.Dependent Variable:汽车总保有量(万辆)图结果分析:图为回归系数分析,Unstandardized Coefficients为非标准化系数,Standardized Coefficients为标准化系数,t为回归系数检验统计量,Sig为相伴概率,从图看出各个自变量与因变量的线性回归分析关系不显著。总分析:四个因变量对因变量的影响作用不显著。