常用数据分析方法.pdf
常用数据分析方法常用数据分析方法统计分析工具统计分析工具 对帐单(检查表)对帐单(检查表);流程图;流程图;散布图;散布图;直方图;直方图;排列图;排列图;控制图;控制图;因果分析图;因果分析图;有一些统计分析工具可供公司用来解决经营问题,它们有助于收集有一些统计分析工具可供公司用来解决经营问题,它们有助于收集和分析数据以便为决策提供依据。和分析数据以便为决策提供依据。第一部第一部 数据分析概述数据分析概述1、什么是数据?数据是对服装销售业务全过程记录下来的、可以以鉴别的符号。数据是销售业务全过程的属性数量、位置及相通关系等等的抽象表示。数据表现形式数据表现形式表现形式一表现形式一2010年店铺销售分析报表2010年店铺销售分析报表12月月1月月2月月3月月4月月5月月6月月7月月8月月东朝阳东朝阳999998989898100100101101108108108108114114110110金桥金桥676770707373747475757777828280808080太平洋太平洋878784848888858579798585919192929393二道国贸二道国贸148148143143143143145145137137141141136136134134139139国三国三757576767676777779797878828278787878春城春城878786869292100100103103100100979789899191跑一跑一益民益民数据列表数据表现形式二数据表现形式二2482482692692242242452453813815955952552552542542372372112111711711661662472474224223033033203204124124204206676674704703663664104104034033303303433434774770 010010020020030030040040050050060060070070080080012月12月1月1月2月2月3月3月4月4月5月5月6月6月7月7月8月8月9月9月10月10月11月11月12月12月描述性分析:数据分时段走势、差距变化情况以及描述性分析:数据分时段走势、差距变化情况以及相应的时间背景相应的时间背景销售码洋趋势图销售码洋趋势图数据表现形式三数据表现形式三31.0%31.0%36.2%36.2%43.4%43.4%36.4%36.4%64.3%64.3%85.3%85.3%57.5%57.5%60.2%60.2%53.5%53.5%47.4%47.4%39.5%39.5%35.5%35.5%33.0%33.0%13.2%13.2%21.1%21.1%30.8%30.8%36.1%36.1%49.0%49.0%67.0%67.0%51.5%51.5%47.3%47.3%43.3%43.3%37.4%37.4%30.4%30.4%25.5%25.5%27.3%27.3%0%0%10%10%20%20%30%30%40%40%50%50%60%60%70%70%80%80%90%90%12月12月1月1月2月2月3月3月4月4月5月5月6月6月7月7月8月8月9月9月10月10月11月11月12月12月销售码洋结构比销售码洋结构比2、数据分析目的让数据说话;行动的向导;杜绝浪费;提供决策的依据。3、数据的分类按数据的性质一般可归纳为:定性数据。往往用于频数或频率分析。定量型数据。可以用数字量化的数值。按数据的来源可分为:人力资源数据;财务数据;营销数据;采购数据;仓储数据;生产数据;编辑数据。4、运用统计方法应遵循的原则坚持用数据说话的基本观点。有目的地收集数据。掌握数据的来源。认真整理数据。5 5、统计分析流程、统计分析流程确定问题确定分析目标采用科学方法收集数据考察数据时效性整理数据统计分析出具分析报告,提出解决意或建议5 5、数据分析误区、数据分析误区误区一误区一:展示元素不宜大于展示元素不宜大于3 3个个0 01000001000002000002000003000003000004000004000005000005000006000006000007000007000008000008000009000009000001000000100000012月12月1月1月2月2月3月3月4月4月5月5月6月6月7月7月8月8月9月9月10月10月11月11月12月12月5、数据分析误区、数据分析误区误区二误区二:时间序列数据最好使用折线图,而不宜使时间序列数据最好使用折线图,而不宜使用柱状图等用柱状图等0 01000001000002000002000003000003000004000004000005000005000006000006000007000007000008000008000009000009000001000000100000012月12月1月1月2月2月3月3月4月4月5月5月6月6月7月7月8月8月9月9月10月10月11月11月12月12月误区三:研究用数据最好不使用三维立体图研究用数据最好不使用三维立体图12月12月1月1月2月2月3月3月4月4月5月5月6月6月7月7月8月8月9月9月10月10月11月11月12月12月S1S1S3S30 0100000100000200000200000300000300000400000400000500000500000600000600000700000700000800000800000900000900000100000010000005、数据分析误区、数据分析误区误区四:为避免图表的欺骗性,图线最好占据误区四:为避免图表的欺骗性,图线最好占据2/3 2/3 至至3/43/4的高度(调整的高度(调整Y Y轴刻度)轴刻度)73.7%73.7%68.1%68.1%69.0%69.0%72.9%72.9%73.1%73.1%75.6%75.6%70.9%70.9%71.9%71.9%71.6%71.6%69.0%69.0%62.2%62.2%67.1%67.1%75.7%75.7%83.5%83.5%71.5%71.5%75.4%75.4%79.0%79.0%75.8%75.8%76.9%76.9%74.5%74.5%68.9%68.9%72.9%72.9%77.3%77.3%67.7%67.7%75.5%75.5%79.6%79.6%0%0%10%10%20%20%30%30%40%40%50%50%60%60%70%70%80%80%90%90%100%100%12月12月 1月1月 2月2月 3月3月 4月4月 5月5月 6月6月 7月7月 8月8月 9月9月 10月10月 11月11月 12月12月73.7%73.7%68.1%68.1%69.0%69.0%72.9%72.9%73.1%73.1%75.6%75.6%70.9%70.9%71.9%71.9%71.6%71.6%69.0%69.0%62.2%62.2%67.1%67.1%75.7%75.7%83.5%83.5%71.5%71.5%75.4%75.4%79.0%79.0%75.8%75.8%76.9%76.9%74.5%74.5%68.9%68.9%72.9%72.9%77.3%77.3%67.7%67.7%75.5%75.5%79.6%79.6%60%60%65%65%70%70%75%75%80%80%85%85%12月12月 1月1月 2月2月 3月3月 4月4月 5月5月 6月6月 7月7月 8月8月 9月9月 10月10月 11月11月 12月12月5、数据分析误区、数据分析误区第二部第二部 常用的数据分析方法常用的数据分析方法抽样方法抽样方法学用的统计抽样方法主要有以下三种学用的统计抽样方法主要有以下三种随机抽样法随机抽样法分层抽样法分层抽样法系统抽样法系统抽样法公公司司抽样方法抽样方法随机抽样随机抽样指总体中每一个个体都有同等可能的机会被抽到。这种抽样方法事先不能考虑抽取哪一个样品,完全用偶然方法抽样,常用抽签或利用随机数表来抽取样品以保证样品代表性。抽样当商品款式不多时,随机抽样是一种有效的抽样方法;抽样方法抽样方法分层抽样分层抽样分层抽样是先将总体按照研究内容密切有关的主要因素分类或分层,然后在各层中按照随机原则抽取样本。分层抽样可以减少层内差异,增加样本的代表性。抽样样本当到货产品较多时,分层抽样是一种有效的抽样方法;当到货产品较多时,分层抽样是一种有效的抽样方法;总体、样本、数据间的关系总体、样本、数据间的关系总体总体样本样本结论结论数据数据抽样分析管理测试检查表检查表合计合计检查数检查数不良率不良率在销售公司日常管理中最强调的是事实管理,就是要掌握事实,要掌握事实就必须设计检查表收集数据。业务记录用检查表业务记录用检查表排列图(帕累拉图)排列图(帕累拉图)关键的少数,次要的多数。通常所说的80/20法则。针对问题所收集的数据按其重要性的顺序,记录在帕累托分析表中。公司80%的销售来自于20%来自篮球产品。排列图的作用排列图的作用公司要解决的问题很多,但从何入手呢?公司要解决的问题很多,但从何入手呢?事实上,大部分的问题,只要能找出几个影响较大的因素,并加以处置及控制,就可解决问题的80%以上。柏拉图是根据收集的数据,以不良原因、不良状况发生的现象,有系统地加以项目别分类,计算出各项目所产生的数据(如作业准确率、损失金额)及所占的比例,再依照大小顺序排列,再加上累积值的图形产品销售排列图产品销售排列图销售名次产品名称销售码洋所占%备注合计排列图的作图方法步骤排列图的作图方法步骤 将用于排列图所记录的数据进行分类。确定数据记录的时间。按分类项目进行统计。计算累计频率。准备坐标纸,画出纵横坐标。按频数大小顺序作直方图。按累计比率作排列曲线。记载排列图标题及数据简历。因果图因果图运用因果图有利于找到问题的症结所在,然后对症下药,解决问题。因果图再经营管理活动中,尤其是在物流作业中、问题分析中有着广泛的用途。库存不足库存不足人的因素技术不佳粗心缺乏培训无责任心对策表对策表对策表对策表当利用鱼刺图确定了经营问题产生的主要原因后,有必要采取措施去消除这些原因,以达到改进的目的。这时,可以采用对策表的方法。用以针对经营问题产生的原因制定对策或措施,作为实施时的依据。对策表的目的对策表的目的频数分布表频数分布表频数分布表是一种把分散和不规则的数据,整理成一个能顺着其度量的尺度,清楚地显示出该数据的集中趋势和离散程度的一种统计方法。频数直方图频数直方图以坐标横轴表示组距,坐标纵轴表示频数,所画出的矩形图称为频数直方图,简称直方图。0 05 510101515202025253030订货码洋订货码洋11.405 11.505 11.605 11.705 11.805 11.905 12.005 12.105 12.205 12.305 12.405 频数不正常直方图不正常直方图孤岛型直方图孤岛型直方图双峰型直方图双峰型直方图折齿型直方图折齿型直方图绝壁型直方图绝壁型直方图孤岛型直方图孤岛型直方图在主体直方图的左侧或右侧出现孤立的小块,像一个孤立的小岛。出现孤岛型直方图,说明有特殊事件发生。造成原因可能是一时供货发生变化,或者一段时间内出版商断故障,或者短时间内从第三方进货等。所以,只要找出原因,就能使直方图恢复到正常型。双峰型直方图双峰型直方图双峰型直方图是指在直方图中有左右两个峰,出现双峰型直方图,这是由于观测值来自两个总体、两种分布,数据混在一起。往往是由于将两季教辅销售列示在一起所造成的。折齿型直方图折齿型直方图折齿型直方图形状凹凸相隔,象梳子折断齿一样。出现折齿型直方图,多数是由于备货不合理,或处理数据时分组不适当等原因造成。绝壁型直方图绝壁型直方图绝壁型直方图左右不对称,并且其中一侧像高山绝壁的形状,当用剔除了客户退货特性值数据作直方图时,往往会出现绝壁型直方图。此外,亦可能是操作者的工作习惯,习惯于偏标准下限,于是出现左边绝壁的直方图。偏态型直方图偏态型直方图某种原因使下(上)限受到限制时,容易发生“偏左型”(偏右型)。平顶型直方图平顶型直方图与双峰型类似,由于多个总体、多种分布混在一起。直方图与标准比较直方图与标准比较对于正常型直方图,将其分布范围B=S,L(S为一批数据中的最小值,L为一批数据中的最大值)与标准范围T=SL,Su,SL为标准下界限,Su为标准上界限)进行比较,就可以看出订货特性值的分布是否在标准范围内,从而可以了解销售过程是否处于所希望的状态。为了方便,可在直方图上标出标准下界限值和标准上界限值。直方图在标准范围内的情况直方图在标准范围内的情况直方图的分布范围直方图的分布范围B位于标准范围位于标准范围T内,但有余量内,但有余量;直方图的分布中心与标准直方图的分布中心与标准中心近似重合,这是理想的直方图。此时,销售处于正常管理状态。中心近似重合,这是理想的直方图。此时,销售处于正常管理状态。TBSL (S)(L)Su直方图在标准范围内的情况直方图在标准范围内的情况直方图的分布范围直方图的分布范围B B位于标准范围位于标准范围T T内,数据变化仍比较集中,但分布中心偏内,数据变化仍比较集中,但分布中心偏移标准中心,并且直方图的一侧已达到标准界限,移标准中心,并且直方图的一侧已达到标准界限,此时状态稍有变化,产品此时状态稍有变化,产品就可能超出标准,出现销量下滑。因此,需要采取措施,使得分布中心与标就可能超出标准,出现销量下滑。因此,需要采取措施,使得分布中心与标准中心重合。准中心重合。TBSL (S)(L)SuTBSL (S)(L)Su 直方图在标准范围内的情况直方图在标准范围内的情况直方图的分布范围直方图的分布范围B B没有超出标准范围没有超出标准范围T T,但没有余量。此时分布中心稍有偏,但没有余量。此时分布中心稍有偏移便会出现跑单,所以应及时采取措施,缩小订货特性值的分布范围。移便会出现跑单,所以应及时采取措施,缩小订货特性值的分布范围。TBSL (S)(L)Su直方图在标准范围内的情况直方图在标准范围内的情况客户订货特性值的分布非常集中,致使直方图的分布范围客户订货特性值的分布非常集中,致使直方图的分布范围B B与标准范围与标准范围T T之间之间的余量过大。此时,可对客户订货管理等适当放宽要求,从而降低渠道库存的余量过大。此时,可对客户订货管理等适当放宽要求,从而降低渠道库存积压积压TBSL (S)Su (L)直方图超出标准范围内的情况直方图超出标准范围内的情况直方图的分布范围直方图的分布范围B B超出标准范围超出标准范围T T,此时,在标准上界限和下界限都出现不,此时,在标准上界限和下界限都出现不合格品。这种情况通常是由于产品销售疲软,这时,应及时采取促销措施,合格品。这种情况通常是由于产品销售疲软,这时,应及时采取促销措施,降低分布的标准差。如果属于标准定得不合理,可以放宽标准范围。降低分布的标准差。如果属于标准定得不合理,可以放宽标准范围。TB(S)SLSu (L)直方图超出标准范围内的情况直方图超出标准范围内的情况直方图的分布范围直方图的分布范围B B大大超出标准范围大大超出标准范围T T,此时已出现市场大面积少货,必须,此时已出现市场大面积少货,必须立即分析原因,采取紧急措施立即分析原因,采取紧急措施;如果营销政策允许改变,就重新修订营销政如果营销政策允许改变,就重新修订营销政策。策。TB(S)SLSu (L)直方图的缺点直方图的缺点 0.090.080.070.060.01波动图直方图时间直方图直方图(练习练习)0 02 24 46 68 810101212141416161818X14.2 14.5 14.8 15.1 15.4 15.7 16.0频数频数多边形频数多边形以坐标横轴表示组中值,坐标纵轴表示频数,所画出的多边形图称为频数多边图,简称多边图。多边图的作法与直方图类似,不同的只是多边图以组中值为横坐标,频数为纵坐标,在坐标平面上依次标出各点的位置,然后把相邻各点用直线段连接起来,由此得到频数多边形。销售码洋销售码洋0 05 510101515202025253030频数请大家参与讨论