如何做统计分析.ppt
如何做统计分析?目录什么是统计?1如何区分数据类型?如何区分数据类型?2怎样利用统计分析方法?怎样利用统计分析方法?3什么是统计呢?你想过下面的问题吗?你想过下面的问题吗?当公司推行客户发当公司推行客户发货需保价时,告知客户货需保价时,告知客户发货时需要购买保险。发货时需要购买保险。说多了,客户会觉得高,说多了,客户会觉得高,以后不来发货;说少了,以后不来发货;说少了,公司会得不偿失,也是公司会得不偿失,也是损失。到底这个保价额损失。到底这个保价额是怎样决定的呢?是怎样决定的呢?保价这么高?这是公司定的你想过下面的问题吗?你想过下面的问题吗?任何客户都有任何客户都有一个信用问题。有些一个信用问题。有些客户试图发货时采用客户试图发货时采用月结或欠款方式付账月结或欠款方式付账时,如何根据它们的时,如何根据它们的财务和商业资料来判财务和商业资料来判断一个客户的信用等断一个客户的信用等级呢?级呢?这次我可以欠这次我可以欠款吗?款吗?可以!可以!你想过下面的问题吗?你想过下面的问题吗?如何通过员工调查来得到性别、年如何通过员工调查来得到性别、年龄、职业、收入等各种因素与员工对某龄、职业、收入等各种因素与员工对某项事物(比如公司某项制度或政策)的项事物(比如公司某项制度或政策)的态度的关系呢?态度的关系呢?他们会认同这项政策吗?你想过下面的问题吗?你想过下面的问题吗?绩效的高低与领导者花在沟通上绩效的高低与领导者花在沟通上时间的多寡成正比?时间的多寡成正比?统计是什么?l一般来说,统计先从现实世界收集数据(信一般来说,统计先从现实世界收集数据(信息),如营业额增长息),如营业额增长l然后,根据数据作出判断,称为模型然后,根据数据作出判断,称为模型l模型是从数据产生的模型是从数据产生的l模型也需要根据新的信息来改进模型也需要根据新的信息来改进l不存在完美的模型不存在完美的模型l模型的最终结局都是被更能够说明现实世界模型的最终结局都是被更能够说明现实世界的新模型所取代的新模型所取代一句话统计学统计学(statistics)是用)是用以收集数据,分析数以收集数据,分析数据和由数据得出结论据和由数据得出结论的一组概念,原则和的一组概念,原则和方法。方法。统计学的理念数据类型的分类数据类型数据类型品质型数据品质型数据(定性数据)(定性数据)数值型数据数值型数据(定量数据)(定量数据)数据类型举例例:花名册信息例:花名册信息籍贯:广东广州籍贯:广东广州姓名:张三姓名:张三性别:男性别:男民族:汉民族:汉家庭成员:家庭成员:4年龄:年龄:50(连续变量连续变量)身高:身高:172cm不同类型数据处理办法SPSS操作界面-定义变量SPSS操作界面-输入数据数值型数值型数据数据品质型品质型数据数据如何选取统计方法?该用哪该用哪种分析种分析方法?方法?关于美国选举的两个例子关于美国选举的两个例子(1)l谁会在谁会在1936选举中获胜选举中获胜?Alf London还还是是 F.D.R.(罗斯福罗斯福)?lLiterary Digest(文摘文摘)送出一千万份问送出一千万份问卷卷(返回二百四十万份返回二百四十万份)后后,预测预测London 会会赢赢.l而而Gallop(盖洛普盖洛普)只问了只问了5000人说人说 Roosevelt(罗斯福罗斯福)会赢会赢.l最后罗斯福和盖洛普都赢了最后罗斯福和盖洛普都赢了.文摘文摘倒闭了倒闭了关于美国选举的两个例子关于美国选举的两个例子(2)l谁会在谁会在1948选举中获胜选举中获胜?Thomas Dewey还是还是Harry Truman(杜鲁门杜鲁门)?lCrossley,Gallop(盖洛普盖洛普),Roper所有所有都预测都预测Dewey 会赢会赢(每个机构用了每个机构用了5000个问卷个问卷).l最后最后(包括盖洛普包括盖洛普)他们都输了他们都输了,而杜鲁门赢而杜鲁门赢了了.抽样方法一、简单随机抽样法二、系统抽样法三、分层抽样法四、整群抽样法抽样调查考虑因素时间时间/人力及预算成本人力及预算成本操作过程的精确性操作过程的精确性破坏性检验破坏性检验考考考考虑虑虑虑因因因因素素素素样本大小(1)利与弊利与弊样本太小样本太小结果不具代表性结果不具代表性,导致抽样误差可能导致抽样误差可能过大过大样本过大样本过大可以降低抽样误差可以降低抽样误差,增加了成本负担,包括增加了成本负担,包括时间,人力等时间,人力等一般样本以一般样本以50-5000之间为宜。之间为宜。样本大小(2)两个公式:两个公式:当估计当估计时,时,N=Z2*2/2其中:其中:Z为某一置信度所对应的临界值(可由正态分布表差得)为某一置信度所对应的临界值(可由正态分布表差得)为总体标准差(通常以样本标准差为总体标准差(通常以样本标准差S取代)取代)为可容许的误差范围(可有调查者自己决定可允许的误差)为可容许的误差范围(可有调查者自己决定可允许的误差)当估计当估计p时,时,N=Z2*p*(1-p)/2其中:其中:Z为某一置信度所对应的临界值(可由正态分布表差得)为某一置信度所对应的临界值(可由正态分布表差得)p为总体比例为总体比例(以样本比例以样本比例p取代取代)为可容许的误差范围(可有调查者自己决定可允许的误差)为可容许的误差范围(可有调查者自己决定可允许的误差)举例=NORMINV(A2,0,1)=B22*C2*(1-C2)/D22统计学的分类 统计分析方法根据研究方法的不同可分为描述性统计和推断性统计两大类。描述性统计描述性统计:就是运用各种表格、图形和数字来概括总体数量特征的方法。最常用的就是平均数。推断性统计推断性统计:在人们可以控制的范围内,根据样本资料的特征,对总体的特征作出估计和预测的方法。描述性统计(1)描述性统计(2)描述性统计(3)描述性统计离散程度离散程度集中趋势集中趋势SPSS和EXCEL比较峰度峰度偏度偏度总分平均156.8998738标准误差0.343950224中位数158众数164标准差23.7151123方差562.4065516峰度0.656194342偏度-0.334991065区域176最小值44最大值220求和745902观测数4754最大(1)220最小(1)44置信度(95.0%)0.674301746均值,中位数,众数对称种型分布对称种型分布对称种型分布对称种型分布对称种型分布对称种型分布 均值均值均值均值均值均值=中位数中位数中位数中位数中位数中位数=众数众数众数众数众数众数左偏分布左偏分布左偏分布左偏分布左偏分布左偏分布均值均值均值均值均值均值 中位数中位数中位数中位数中位数中位数 众数众数众数众数众数众数右偏分布右偏分布右偏分布右偏分布右偏分布右偏分布众数众数众数众数众数众数 中位数中位数中位数中位数中位数中位数 均值均值均值均值均值均值直方图几种常用统计方法线性回归分析线性回归分析卡方检验分析卡方检验分析均值比较分析均值比较分析均值比较分析(1)均值比较分析(2)均值比较分析(3)t-检验:成对双样本均值分析变量 1变量 2平均0.6951984430.7371432方差0.0229945320.0091781观测值1818泊松相关系数0.145129924假设平均差0df17t Stat-1.06433258P(T=t)单尾0.151031454t 单尾临界1.739606716P(T=t)双尾0.302062908t 双尾临界2.109815559单因素方差分析(1)单因素方差分析(2)单因素方差分析(3)单因素方差分析(4)单因素方差分析(5)单因素方差分析(6)描述统计描述统计方差齐性检验方差齐性检验方差分析结果方差分析结果单因素方差分析(7)两两比较两两比较多因素方差分析(1)多因素方差分析(2)多因素方差分析(3)多因素方差分析(4)多因素方差分析(5)多因素方差分析(6)多因素方差分析(7)多因素方差分析(8)多因素方差分析(9)多因素方差分析(10)区域区域NSubset123411,384150.89 5839 155.40 2222 158.48158.48 8236 158.92158.92 9505 159.43159.43 4408 159.82159.82 3221 160.19160.19 6787 162.37162.377152 165.14Sig.1.0000.0590.2100.107不同部门员工不同部门员工对工资水平的满对工资水平的满意度是否有差异意度是否有差异?卡方检验卡方检验员工性质员工性质满意度满意度合计合计12345(经营)1623421061471732009(运营)2574111140495622165(职能)39812256210387(会计类)4241121281193合计合计130875254710561464754卡方检验(卡方检验(1)卡方检验(卡方检验(2)卡方检验(卡方检验(3)卡方检验(卡方检验(4)卡方检验(卡方检验(5)卡方检验(卡方检验(6)卡方检验(卡方检验(7)卡方检验(卡方检验(8)卡方检验(卡方检验(9)分布表分布表结果结果Chi-Square Tests ValuedfAsymp.Sig.(2-sided)Pearson Chi-Square33.378120.001Likelihood Ratio37.283120.000Linear-by-Linear Association11.22610.001N of Valid Cases4,754 a.0 cells(.0%)have expected count less than 5.The minimum expected count is 5.28.统计预测l统计预测的步骤统计预测的步骤确定预测目的搜索和审核资料分析预测误差,改进预测模型选择预测模型和方法提出预测报告预测方法线性回归模型线性回归模型人数人数=600.038+171.926*序数序数预测值放映结束,如果觉得本文对你有帮助,请点放映结束,如果觉得本文对你有帮助,请点击下面,支持一下我们,谢谢!击下面,支持一下我们,谢谢!1 1、乐美雅、乐美雅