常用的数据分析方法.pdf
《常用的数据分析方法.pdf》由会员分享,可在线阅读,更多相关《常用的数据分析方法.pdf(85页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、常用数据分析方法常用数据分析方法1 1、了解数据、总体、样本的含义及随机抽样的一般方法;、了解数据、总体、样本的含义及随机抽样的一般方法;2 2、掌握排列图、因果分析图的作图方法和应用;、掌握排列图、因果分析图的作图方法和应用;3 3、掌握分层法、统计图表法的应用;、掌握分层法、统计图表法的应用;4 4、了解直方图的原理、作用、作图方法及应用;、了解直方图的原理、作用、作图方法及应用;培训要求培训要求培训主要内容:培训主要内容:统计分析工具统计分析工具 对帐单(检查表)对帐单(检查表);流程图;流程图;散布图;散布图;直方图;直方图;排列图;排列图;控制图;控制图;因果分析图;因果分析图;有一
2、些统计分析工具可供书业公司用来解决经营问题,它们有助于有一些统计分析工具可供书业公司用来解决经营问题,它们有助于收集和分析数据以便为决策提供依据。收集和分析数据以便为决策提供依据。第一部第一部 数据分析概述数据分析概述1、什么是数据?数据是对图书销售业务全过程记录下来的、可以以鉴别的符号。数据是销售业务全过程的属性数量、位置及相通关系等等的抽象表示。数据表现形式数据表现形式表现形式一表现形式一2006年客户销售分析报表2006年客户销售分析报表A客户A客户12月月1月月2月月3月月4月月5月月6月月7月月8月月B客户999898100101108108114110B客户999898100101
3、108108114110C客户677073747577828080C客户677073747577828080D客户878488857985919293D客户878488857985919293E客户148143143145137141136134139E客户148143143145137141136134139F客户757676777978827878F客户757676777978827878G客户878692100103100978991G客户878692100103100978991H客户132134141142160154150136137H客户132134141142160154150
4、136137合计合计696692712724735743746723728696692712724735743746723728数据列表数据表现形式二数据表现形式二2482482692692242242452453813815955952552552542542372372112111711711661662472474224223033033203204124124204206676674704703663664104104034033303303433434774770100200300400500600700800010020030040050060070080012月1月2月3月4月5
5、月6月7月8月9月10月11月12月12月1月2月3月4月5月6月7月8月9月10月11月12月描述性分析:数据分时段走势、差距变化情况以及描述性分析:数据分时段走势、差距变化情况以及相应的时间背景相应的时间背景销售码洋趋势图销售码洋趋势图数据表现形式三数据表现形式三31.0%31.0%36.2%36.2%43.4%43.4%36.4%36.4%64.3%64.3%85.3%85.3%57.5%57.5%60.2%60.2%53.5%53.5%47.4%47.4%39.5%39.5%35.5%35.5%33.0%33.0%13.2%13.2%21.1%21.1%30.8%30.8%36.1%3
6、6.1%49.0%49.0%67.0%67.0%51.5%51.5%47.3%47.3%43.3%43.3%37.4%37.4%30.4%30.4%25.5%25.5%27.3%27.3%0%10%20%30%40%50%60%70%80%90%0%10%20%30%40%50%60%70%80%90%12月1月2月3月4月5月6月7月8月9月10月11月12月12月1月2月3月4月5月6月7月8月9月10月11月12月销售码洋结构比销售码洋结构比2、数据分析目的让数据说话;行动的向导;杜绝浪费;提供决策的依据。3、数据的分类按数据的性质一般可归纳为:定性数据。往往用于频数或频率分析。定量型数
7、据。可以用数字量化的数值。按数据的来源可分为:人力资源数据;财务数据;营销数据;采购数据;仓储数据;生产数据;编辑数据。4、运用统计方法应遵循的原则坚持用数据说话的基本观点。有目的地收集数据。掌握数据的来源。认真整理数据。5 5、统计分析流程、统计分析流程确定问题确定分析目标采用科学方法收集数据考察数据时效性整理数据统计分析出具分析报告,提出解决意或建议5 5、数据分析误区、数据分析误区误区一误区一:展示元素不宜大于展示元素不宜大于3 3个个01000002000003000004000005000006000007000008000009000001000000010000020000030
8、0000400000500000600000700000800000900000100000012月1月2月3月4月5月6月7月8月9月10月11月12月12月1月2月3月4月5月6月7月8月9月10月11月12月5、数据分析误区、数据分析误区误区二误区二:时间序列数据最好使用折线图,而不宜使时间序列数据最好使用折线图,而不宜使用柱状图等用柱状图等01000002000003000004000005000006000007000008000009000001000000010000020000030000040000050000060000070000080000090000010000001
9、2月1月2月3月4月5月6月7月8月9月10月11月12月12月1月2月3月4月5月6月7月8月9月10月11月12月误区三:研究用数据最好不使用三维立体图研究用数据最好不使用三维立体图12月1月2月3月4月5月6月7月8月9月10月11月12月12月1月2月3月4月5月6月7月8月9月10月11月12月S1S3S1S301000002000003000004000005000006000007000008000009000001000000010000020000030000040000050000060000070000080000090000010000005、数据分析误区、数据分析误区
10、误区四:为避免图表的欺骗性,图线最好占据误区四:为避免图表的欺骗性,图线最好占据2/3 2/3 至至3/43/4的高度(调整的高度(调整Y Y轴刻度)轴刻度)73.7%73.7%68.1%68.1%69.0%69.0%72.9%72.9%73.1%73.1%75.6%75.6%70.9%70.9%71.9%71.9%71.6%71.6%69.0%69.0%62.2%62.2%67.1%67.1%75.7%75.7%83.5%83.5%71.5%71.5%75.4%75.4%79.0%79.0%75.8%75.8%76.9%76.9%74.5%74.5%68.9%68.9%72.9%72.9%7
11、7.3%77.3%67.7%67.7%75.5%75.5%79.6%79.6%0%10%20%30%40%50%60%70%80%90%100%0%10%20%30%40%50%60%70%80%90%100%12月1月2月3月4月5月6月7月8月9月10月11月12月12月1月2月3月4月5月6月7月8月9月10月11月12月73.7%73.7%68.1%68.1%69.0%69.0%72.9%72.9%73.1%73.1%75.6%75.6%70.9%70.9%71.9%71.9%71.6%71.6%69.0%69.0%62.2%62.2%67.1%67.1%75.7%75.7%83.5%
12、83.5%71.5%71.5%75.4%75.4%79.0%79.0%75.8%75.8%76.9%76.9%74.5%74.5%68.9%68.9%72.9%72.9%77.3%77.3%67.7%67.7%75.5%75.5%79.6%79.6%60%65%70%75%80%85%60%65%70%75%80%85%12月1月2月3月4月5月6月7月8月9月10月11月12月12月1月2月3月4月5月6月7月8月9月10月11月12月5、数据分析误区、数据分析误区第二部第二部 常用的数据分析方法常用的数据分析方法总体总体:总体、个体总体、个体个体个体:总体又叫母体,是研究对象的全体。总体又
13、叫母体,是研究对象的全体。出版商一个批次到货出版商一个批次到货的全部都可以称为总体。的全部都可以称为总体。构成总体的基本单位,称为个体。构成总体的基本单位,称为个体。每册书都是一个个体。每册书都是一个个体。来货检验常用抽样方法进行,即从来货总件数中抽出一部分件数,并来货检验常用抽样方法进行,即从来货总件数中抽出一部分件数,并测试每件的有关册数是否够数的特性数据,进行统计分析后,对总体测试每件的有关册数是否够数的特性数据,进行统计分析后,对总体作出估计和判断。作出估计和判断。样本样本:样本样本样本样本又叫又叫子样子样,是从总体中抽出来一部分个体的集合。,是从总体中抽出来一部分个体的集合。样本中每
14、个个体叫样本中每个个体叫样品样品,样本中所包含样品数目称为样本大小,样本中所包含样品数目称为样本大小,又叫又叫样本量样本量,常用,常用n n表示。表示。对样本的特性进行测定,所得的数据称为对样本的特性进行测定,所得的数据称为样本值样本值。当样本个数越多时,分析结果越接近总体的值,样本对总体的代当样本个数越多时,分析结果越接近总体的值,样本对总体的代表性就越好。表性就越好。抽样方法抽样方法学用的统计抽样方法主要有以下三种学用的统计抽样方法主要有以下三种随机抽样法随机抽样法分层抽样法分层抽样法系统抽样法系统抽样法书书业业公公司司抽样方法抽样方法随机抽样随机抽样指总体中每一个个体都有同等可能的机会被
15、抽到。这种抽样方法事先不能考虑抽取哪一个样品,完全用偶然方法抽样,常用抽签或利用随机数表来抽取样品以保证样品代表性。抽样当图书品种不多时,随机抽样是一种有效的抽样方法;抽样方法抽样方法分层抽样分层抽样分层抽样是先将总体按照研究内容密切有关的主要因素分类或分层,然后在各层中按照随机原则抽取样本。分层抽样可以减少层内差异,增加样本的代表性。抽样样本当到货产品较多时,分层抽样是一种有效的抽样方法;当到货产品较多时,分层抽样是一种有效的抽样方法;抽样方法抽样方法系统抽样系统抽样从总体中每隔K个个体抽取一个个体的抽样方法,比值K是总体容量N与样本容量n之比;当出版商批量发货及产品特别多时,并且易作某种次
16、序的整理时,当出版商批量发货及产品特别多时,并且易作某种次序的整理时,系统抽样比分层抽样好;系统抽样比分层抽样好;1,2,.KK+1,K+2,.,2K2K+1,2K+2,.,3K直到 N为止例,从具有1000个个体的总体中抽取50个个体。总体、样本、数据间的关系总体、样本、数据间的关系总体总体样本样本结论结论数据数据抽样分析管理测试数理整理和统计数理整理和统计抽样的目的是通过样本来反映总体。抽样的目的是通过样本来反映总体。在书业公司经营管理中,常常将测试的样本数据,通过整理加工,在书业公司经营管理中,常常将测试的样本数据,通过整理加工,找出它们的特性,从而推断总体的变化规律、趋势和性质。找出它
17、们的特性,从而推断总体的变化规律、趋势和性质。一批数据的分布情况,可以用中心倾向及数据的分散程度来表示,一批数据的分布情况,可以用中心倾向及数据的分散程度来表示,表示中心倾向的有平均值、中位值等,表示数据分散程度的有方差、表示中心倾向的有平均值、中位值等,表示数据分散程度的有方差、标准偏差、极差等。标准偏差、极差等。描述总体数据离散程度的参数为方差描述总体数据离散程度的参数为方差2 2,描述总体数据中心倾向的,描述总体数据中心倾向的数为均值数为均值。若利用样本参数近似描述总体状况时,可以利用样本。若利用样本参数近似描述总体状况时,可以利用样本方差方差S S2 2近似代替总体方差近似代替总体方差
18、2 2,利用样本均值,利用样本均值X X近似代替总体均值近似代替总体均值p p。数理整理和统计数理整理和统计样本平均值样本平均值样本中位值样本中位值X=X1+X2+X3.+Xnn中位值是按照数据大小顺序排列位于中间的数值,中位值记为X若n为偶数,则取位于中间两个数值的平均值为中位值;数理整理和统计数理整理和统计样本极差样本极差样本方差和样本标准偏差样本方差和样本标准偏差样本方差和样本标准差就是用来度量数据波动幅度大小的一个重要特性值。样本方差是一组数据中每一个数值与平均值之差的平方和的平均值,通常记为S2;样本方差的平方根S称作样本标准偏差,它与样本方差一样,是反映一组数据分散程度的特性值:样
19、本极差表示一组数据分布的范围,是指数据中最大值与最小值的差:R=Xmax-Xmin检查表检查表检查项目检查项目8月1日8月2日8月3日8月1日8月2日8月3日.8月19日合计8月19日合计报订报订2424开单开单10131013拣货拣货2828返单返单4848收货收货1212合计合计19351935检查数检查数100100100100不良率不良率19351935在书业公司日常管理中最强调的是事实管理,就是要掌握事实,要掌握事实就必须设计检查表收集数据。业务记录用检查表业务记录用检查表层别法层别法层别法是所有手法中最基本的概念,即将多种多样的层别法是所有手法中最基本的概念,即将多种多样的数据,因
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 常用 数据 分析 方法
限制150内