六西格玛分析阶段29655.pptx
六西格六西格玛玛普及培普及培训训-分析分析第七步第七步确定关键因素确定关键因素目目 录录一、分析阶段目的一、分析阶段目的 二、图表分析二、图表分析三、多变量分析三、多变量分析第一部分第一部分 分析阶段目的分析阶段目的分析阶段要做什么分析阶段要做什么最佳化的过程最佳化的过程30-504-83-6重要重要 X Xs s 选选定定5-8定义、测量定义、测量分析分析确认重要确认重要 X Xs s改进改进重要重要 X Xs s最佳最佳化化控制控制2-4重要重要 X Xs s 控控制制q分析阶段的目的:分析阶段的目的:通过对数据的分析,确认通过对数据的分析,确认在测量阶段得出的对在测量阶段得出的对Y Y有有影响的重要影响的重要XsXs对对Y Y影响小的影响小的XsXs进行现进行现水准管理水准管理 把关键因素把关键因素(Xs)(Xs)压缩到压缩到4 48 8个左右之后个左右之后,在改进在改进阶段找出最适合的条件阶段找出最适合的条件分析阶段的步骤分析阶段的步骤v制定数据收集计划制定数据收集计划确定确定X X的量化指标,数据类型、以及数据收集目标的量化指标,数据类型、以及数据收集目标根据根据X X的特点确定采用的分析方法,可以每个因子单独验证的特点确定采用的分析方法,可以每个因子单独验证(如比较分如比较分析析),也可以几个因子合在一起验证,也可以几个因子合在一起验证(如多变量分析、回归分析、如多变量分析、回归分析、DOE)DOE)制作数据收集表,包括制作数据收集表,包括X X及其响应及其响应(Y)(Y)的数据,确定收集的样本量的数据,确定收集的样本量如需要通过试验来收集,如通过人为改变如需要通过试验来收集,如通过人为改变X X的状态来观察的状态来观察Y Y的变化,还的变化,还需要做好试验计划需要做好试验计划v分析潜在关键因子对分析潜在关键因子对Y Y的影响的影响根据数据表收集数据根据数据表收集数据根据事先确定的分析方法来确认每个潜在的关键因子对根据事先确定的分析方法来确认每个潜在的关键因子对Y Y是否有显著是否有显著影响,或影响有多大影响,或影响有多大v确定关键因子确定关键因子对对Y Y有显著影响的潜在因子确认为真正的关键因子,需要进行优化有显著影响的潜在因子确认为真正的关键因子,需要进行优化主要使用的工具主要使用的工具q图表分析图表分析确确认认分分布布:直直方方图图,点点图图,箱箱线线图图、散散点点图图、矩矩阵阵图图、边边际际图图、柏拉图、时间序列图柏拉图、时间序列图.q多变量分析多变量分析q比较分析比较分析均均值值检检验验:1 1-sample-sample t,t,2-sample 2-sample t,t,Paired Paired t t(样样本本中中同同一一个个体测量两次前后比较总体不独立体测量两次前后比较总体不独立),ANOVA),ANOVA(正态总体(正态总体=2=2)方方差差检检验验:Test Test for for Equal Equal variance-F variance-F testtest(正正态态总总体体2 2),Bartletts Bartletts Test(Test(正正态态总总体体=2)=2),Levenes Levenes TestTest(非非正正态态总总体)体)比比率率检检验验:1 1 Proportion,Proportion,2 2 Proportions,Proportions,Chi-square Chi-square testtest(总体(总体=2=2)q回归分析回归分析第二部分第二部分 图表分析图表分析 用图形对测量阶段找出的变量(KPIV)的“形态”进行描述,通过视觉来判断变量是否满足我们的期望,确定是否关键的KPIV好的图表才能说明问题好的图表才能说明问题引入图表引入图表分析分析的目的的目的图表分析可以把数据转化为我们需要的信息图表分析可以把数据转化为我们需要的信息数据是信息的数据是信息的“原料原料”加工处理的数据是提供可靠信息的源泉加工处理的数据是提供可靠信息的源泉可靠的信息是我们作决策的基础可靠的信息是我们作决策的基础图表分析的作用图表分析的作用六西格玛管理强调以数据为基础,六西格玛管理强调以数据为基础,以事实为依据!以事实为依据!图表分析的作用(续)图表分析的作用(续)q 掌握变量分布的形状掌握变量分布的形状,平均值的位置及方差平均值的位置及方差q 比较各变量分布的特性比较各变量分布的特性q 明确两个以上的变量之间的差异明确两个以上的变量之间的差异q 比较变量相对重要度比较变量相对重要度q 掌握变量数据随时间的变化掌握变量数据随时间的变化图表分析的步骤图表分析的步骤重点重点:可靠数据的收集和正确的图表解释可靠数据的收集和正确的图表解释选定要分析的变量选定要分析的变量搜集及整理数据搜集及整理数据进行图表分析进行图表分析结果解释结果解释选择要分析的变量选择要分析的变量 我我们们要要分分析析的的变变量量来来自自测测量量阶阶段段的的结结果果,在在利利用用图图表表分分析析前前我我们们首首先先要要确确定定变变量量的的类类型、分析的目的、选择什么方法等型、分析的目的、选择什么方法等搜集及整理数据搜集及整理数据在运用图表分析时,应该明确以下重要问题在运用图表分析时,应该明确以下重要问题:由谁收集数据由谁收集数据谁运用这些数据谁运用这些数据收集数据的类型是什么收集数据的类型是什么数据怎样收集数据怎样收集收集的数据在过程的哪个环节收集的数据在过程的哪个环节 收集数据的频率收集数据的频率在数据收集前别忘了先做测量系统分析在数据收集前别忘了先做测量系统分析图表分析的主要方法图表分析的主要方法连续型数据连续型数据分析什么问题分析什么问题分析方法分析方法数据类型数据类型 点点 图图 箱线图箱线图 柏拉图柏拉图 饼饼 图图连续型数据连续型数据 描述性统计描述性统计 点图、箱线图点图、箱线图 直方图直方图 确定单个变量(研究确定单个变量(研究对象)的分布对象)的分布比较在比较在2 2个、多个或者个、多个或者1 1个变量(研究对象)在个变量(研究对象)在多种状态下分布的差异多种状态下分布的差异连续型数据连续型数据 散点图散点图 边际图边际图 矩阵图矩阵图 时间序列图时间序列图确定确定2 2个或者多个因个或者多个因素之间的关系素之间的关系确定变量(研究对象)确定变量(研究对象)的组成的组成离散型数据离散型数据图表菜单图表菜单Minitab 15 Minitab 15 提供分析数据的图表工具提供分析数据的图表工具!在工作表中输入数据或把在工作表中输入数据或把EXCELEXCEL中的数据粘贴过来中的数据粘贴过来图表图表的选定及操作的选定及操作单个变量分布图单个变量分布图目的目的:确定变量的基本信息确定变量的基本信息,包括分布的形状(是否正态分包括分布的形状(是否正态分布布?)、居中趋势(平均值和我们期望的有什么差距)、居中趋势(平均值和我们期望的有什么差距?)、)、离散情况(波动是否超出了我们的要求离散情况(波动是否超出了我们的要求?)等)等我们想了解某些过程的基本信息我们想了解某些过程的基本信息 例如例如:1.:1.顾客投诉问题的处理时间顾客投诉问题的处理时间 2.2.加工尺寸加工尺寸 3.3.输出功率输出功率 与我们的要求与我们的要求(期望期望)有什么差异有什么差异?通过分布分析可以解决以上问题通过分布分析可以解决以上问题确认基本统计量描述性统计确认基本统计量描述性统计描描述述性性统统计计(Descriptive Descriptive StatisticsStatistics)可可提提供供多多种种图图表表和和数数据据的的平平均均值值及及标标准准差差,偏偏度度,峰峰度度,置置信信区区间间,正正态态分分布布等等信信息息,帮助我们确认基本统计量。帮助我们确认基本统计量。统计统计 基本统计量基本统计量 显示描述性统计显示描述性统计要养成首先做出基本统计量的习惯要养成首先做出基本统计量的习惯下面得到的数据,是某生产厂家统计的两个月材料采购计划下面得到的数据,是某生产厂家统计的两个月材料采购计划时间和实际交货时间的差值。时间和实际交货时间的差值。数据的收集来源:数据的收集来源:-该生产厂家该生产厂家2 2大类产品的物料;大类产品的物料;-记录两大类产品材料采购订单的执行情况记录两大类产品材料采购订单的执行情况(60(60个订单)。个订单)。用用MinitabMinitab分析一下该生产厂家分析一下该生产厂家A A类产品材料采购订单的基本类产品材料采购订单的基本统计值(统计值(打开数据文件打开数据文件:A A0101采购订单采购订单.MTW.MTW)举举 例例描述性统计描述性统计统计统计 基本统计量基本统计量 显示描述性统计显示描述性统计选择图形不仅可以查看基本统计量选择图形不仅可以查看基本统计量,还可以看出全体分布的柱状图还可以看出全体分布的柱状图输出结果分析输出结果分析:标准差标准差(StDev(StDev):):四分之一分位数四分之一分位数:把数据从小到大排列时把数据从小到大排列时,分位数为分位数为25%25%;四分之三分位数四分之三分位数:把数据从小到大排列时把数据从小到大排列时,分位数为分位数为75%75%;Trimmed Mean:Trimmed Mean:把数据的上下分位各去掉把数据的上下分位各去掉5%5%后求平均。后求平均。标准误差标准误差(SE Mean):描述性统计描述性统计描述性统计描述性统计:A:A类产品差值类产品差值 平均值平均值 下四分下四分 上四分上四分变量变量 N N*N N*平均值平均值 标准误标准误 标准差标准差 最小值最小值 位数位数 中位数中位数 位数位数A A类产品差值类产品差值 30 0 1.40 1.84 10.06 -18.00 -6.00 4.00 6.0030 0 1.40 1.84 10.06 -18.00 -6.00 4.00 6.00变量变量 最大值最大值A A类产品差值类产品差值 30.0030.00输出图表分析输出图表分析:描述性统计描述性统计统计统计 基本基本 图形化汇总图形化汇总图形结果汇总图形结果汇总点击输出图表分析输出图表分析:图形结果汇总图形结果汇总点图点图Dot plotDot plot通过对通过对A01采购订单采购订单例子的分析,做出例子的分析,做出A A类产品材料采购订单的分布图,利用类产品材料采购订单的分布图,利用Dot Dot PlotPlot对订单时间的变动进行分析对订单时间的变动进行分析q 对数据的平均、波动、倾向、分布都很容易看出来对数据的平均、波动、倾向、分布都很容易看出来q 利用变量功能的话,集团之间的变动也容易区分出来利用变量功能的话,集团之间的变动也容易区分出来图形图形 点图点图通通过过点点图图可可以以看看出出大大部部分分订订单单的的时时间间差差值值集集中中在在-6-68 8天天左左右右,最最低低为为-18-18,最最高高为为3030,波波动动较较大大。有有几几个个订订单单相相对对异异常,需分析原因。常,需分析原因。输出图表输出图表:通过点图通过点图,可以看出过程中异常状态的数据可以看出过程中异常状态的数据.点图点图Dot plotDot plot异常点异常点这几单发生了什这几单发生了什么事情?么事情?图形图形 点图点图箱线图箱线图Box plotBox plot通过对通过对A A0101采购订单采购订单例子的分析例子的分析,做出来做出来A A类产品材料采购订单的分布图类产品材料采购订单的分布图,利用利用 Box PlotBox Plot对订单执行情况的变动对订单执行情况的变动进行分析进行分析q 对数据的中位数、波动、倾向都很容易看出来对数据的中位数、波动、倾向都很容易看出来q 利用变量功能的话,集团之间的变动也容易区分出来利用变量功能的话,集团之间的变动也容易区分出来图形图形 箱线图箱线图箱线图箱线图Box plotBox plot图形图形 箱线图箱线图点击点击箱线图箱线图Box plotBox plot通过通过 Box plotBox plot可以看出:可以看出:50%50%的的订订单单集集中中在在基基本本集中在集中在-6-6和和6 6之间左右之间左右出现了异常点出现了异常点Box plotBox plot的数据数量在的数据数量在1010以下时很容易失去有效性!以下时很容易失去有效性!箱线图箱线图的理解的理解注:注:箱子的高度箱子的高度内四分位极差内四分位极差IQR Inter Quartile Range Q3-Q1*异常点异常点 75%数数(3/4分位分位)Q3Q1MaxMinimum,Q1-1.5 IQRQ3+MinMaximum,Q3+1.5 IQR 25%的数的数(1/4分位分位)Q1中位数中位数(1/2分位分位)Q2数据的中间数据的中间50%50%(箱子的高度箱子的高度)数据由小到大排列数据由小到大排列HistogramHistogram直方图直方图q 主要应用在了解数据的形状及形态主要应用在了解数据的形状及形态q 便于掌握数据的集中倾向、位置、平均、分布等便于掌握数据的集中倾向、位置、平均、分布等通通过过对对A A0101采采购购订订单单例例子子的的分分析析,作作出出A A类类产产品品材材料料采采购购订订单单的的倾倾向向、位位置置、平平均均、分布等,利用直方图进行分析分布等,利用直方图进行分析 图形图形 直方图直方图直方图的制作必须要直方图的制作必须要有有5050个以上的数据。个以上的数据。HistogramHistogram直方图直方图图形图形 直方图直方图点击点击输出图表分析输出图表分析:直方图的形态直方图的形态HistogramHistogram直方图直方图下面四个直方图是同样数据形成的,它的形状下面四个直方图是同样数据形成的,它的形状受柱子个数和间距的影响受柱子个数和间距的影响581015随随 着着 区区 间间的的调调整整,数数据据 的的 形形 状状分分 布布 不不 尽尽相同相同直直 方方 图图 可可掌掌 握握 数数 据据的的 分分 布布、居居 中中 趋趋 势势等等HistogramHistogram直方图直方图如何掌握图表分析如何掌握图表分析通过图表分析可掌握通过图表分析可掌握 通通过过Descriptive Descriptive StatisticsStatistics确确认认了了数数据据的的平平均均值值,标标准准差差,倾倾斜斜度度,陡陡峭峭度度,置置信信区区间间,数数据据的的正正态态分分布布,还有四分位数;还有四分位数;通通过过Dot Dot plotplot的的图图表表分分析析,可可确确认认全全体体数数据据平平均均值值的的倾向、异常点及分布;倾向、异常点及分布;通通过过Box Box plotplot的的图图表表分分析析,可可确确认认全全体体数数据据中中位位数数值值的位置、异常点及分布;的位置、异常点及分布;通过直方图可掌握全体数据的形态。通过直方图可掌握全体数据的形态。某公司为了改进采购计划的准确性,减小材料采购不准确某公司为了改进采购计划的准确性,减小材料采购不准确造成生产和库存方面的压力,收集了造成生产和库存方面的压力,收集了2 2月份月份B B类产品材料采购订类产品材料采购订单的数据进行分析,以找出需要改进的重点。下列数据是在单的数据进行分析,以找出需要改进的重点。下列数据是在2 2月份统计的各种材料订单计划时间和实际入库时间的差值月份统计的各种材料订单计划时间和实际入库时间的差值(单单位天位天)。试问:试问:1.B1.B类产品材料采购订单计划时间和实际入库时间的均值及标类产品材料采购订单计划时间和实际入库时间的均值及标准偏差分别为多少?从分布图中能看到什么问题?准偏差分别为多少?从分布图中能看到什么问题?2.2.做出做出dot plot/box plotdot plot/box plot及直方图并解释。及直方图并解释。数据文件:数据文件:A01-采购订单采购订单.mtw练习时间:练习时间:10分钟分钟练习一练习一通过图表分析比较单个变量分布通过图表分析比较单个变量分布 我我们们在在做做项项目目的的过过程程中中,经经常常会会碰碰到到这这种种情情况况:要要对对两类或更多种类的数据进行比较分析两类或更多种类的数据进行比较分析 例例如如:通通过过图图表表分分析析很很容容易易理理解解不不同同工工序序加加工工同同一一位位置置尺尺寸寸的的差差别别,不不同同型型号号刀刀具具加加工工寿寿命命之之间间的的差差别别,不不同同员员工工加加工工能能力力之之间间的的差差别别。那那么么对对多多个个数数据据进进行行比比较较时时经经常使用哪些图表常使用哪些图表现在通过具体事例,利用图表分析比较分布现在通过具体事例,利用图表分析比较分布Box plot用于数据间的分布差异、中位数和波动大小的比较用于数据间的分布差异、中位数和波动大小的比较利用利用A A0101采购订单采购订单例子,对两大例子,对两大类产品材料订单执行情况进行比较,类产品材料订单执行情况进行比较,用用Box plotBox plot图表分析。图表分析。箱线图箱线图Box plotBox plot图形图形 箱线图箱线图箱线图箱线图Box plotBox plot图形图形 箱线图箱线图点击点击输出图表分析输出图表分析箱线图箱线图Box plotBox plot两两类类产产品品的的订订单单执执行行情情况况没没有有明明显显的的差差异异,B B类类产产品品订订单单执执行行情情况况的的波波动动大大于于A A类产品。类产品。q单因素多组数据点图单因素多组数据点图-Multiple Dot Plot-Multiple Dot Plot显示多个过程的平均值倾向、变动、分布显示多个过程的平均值倾向、变动、分布可比较两个或两个以上数据间的差别可比较两个或两个以上数据间的差别利利用用A A0101采采购购订订单单例例子子对对两两大大类类产产品品材材料料订订单单执执行行情情况况进进行行比比较较,平平均均值值的的倾倾向向、变变动动及及分分布布进进行行Multiple Dot plotMultiple Dot plot对比分析对比分析 点图点图Dot plotDot plot图形图形 点图点图点图点图Dot plotDot plot图形图形 点图点图点击点击通通过过Dot Dot plotplot可可以以看看出出两两类类产产品品的的材材料料采采购购订订单单执执行行情情况没有明显的差异。况没有明显的差异。Multiple Multiple Dot Dot plotplot的的分分布布在在数数据据很很多多的的时时候候很很容容易易看看出出两两个个或或多多个个分分布布的的区别区别点图点图Dot plotDot plot输出图表分析输出图表分析单个变量分布的构成单个变量分布的构成目的目的:确定某些特定事件在整个事件中所占的比例或者问题主确定某些特定事件在整个事件中所占的比例或者问题主要集中在哪些方面要集中在哪些方面?我们想知道以下问题我们想知道以下问题 例如例如:1.:1.发动机缺陷集中在哪些方面发动机缺陷集中在哪些方面?2.2.顾客反馈的意见主要集中在哪些方面顾客反馈的意见主要集中在哪些方面?3.3.成本浪费主要集中在哪里成本浪费主要集中在哪里.通过变量分布构成的分析我们就可以解决以上问题通过变量分布构成的分析我们就可以解决以上问题柏拉图柏拉图Pareto chartPareto chart统计统计 质量工具质量工具 Pareto Pareto 图图 确定不良品、缺陷数、争议点、事故的现象或原因等集确定不良品、缺陷数、争议点、事故的现象或原因等集中在哪些方面,掌握主要的问题点(中在哪些方面,掌握主要的问题点(80/2080/20原则)原则)打开文件打开文件:A A0202费用费用.MTW.MTW利用利用柏拉图柏拉图进行分析进行分析柏拉图柏拉图Pareto chartPareto chart统计统计 质量工具质量工具 Pareto Pareto 图图 广告费的支出广告费的支出占大头占大头饼图饼图Pie chartPie chart 主要用于对原因或现象的构成比例进行分析,掌握某主要用于对原因或现象的构成比例进行分析,掌握某种现象在过程中的构成比例。种现象在过程中的构成比例。打开文件打开文件:A A0202费用费用.MTW.MTW利利用用饼图饼图进行分析进行分析图形图形 饼图饼图饼图饼图Pie chartPie chart图形图形 饼图饼图点击点击利用利用饼图饼图很容易知道各个类别在全体很容易知道各个类别在全体中所占的比率中所占的比率饼图饼图Pie chartPie chart利用图表分析对分布进行比较利用图表分析对分布进行比较到目前为止通过分布比较及构成比较分析得出到目前为止通过分布比较及构成比较分析得出通过通过Box plotBox plot可以对不同数据的偏差可以对不同数据的偏差,中心位置和离散程度中心位置和离散程度进行确认进行确认通过通过Multiple Dot plotMultiple Dot plot可以确认各数据间分布展开的程度可以确认各数据间分布展开的程度及异常点及异常点通过通过Pareto chartPareto chart把少数核心问题用图表更容易地表现出来把少数核心问题用图表更容易地表现出来通过通过Pie chartPie chart可以确认该项目在全体中所占的构成比可以确认该项目在全体中所占的构成比请用的数据做以下分析请用的数据做以下分析1.1.不同型号的加工尺寸有什么区别?不同型号的加工尺寸有什么区别?2.2.不同操作员的加工尺寸有什么区别?不同操作员的加工尺寸有什么区别?数据文件:数据文件:A A加工尺寸加工尺寸.mtw.mtw3.3.不同型号的缺陷构成如何?不同型号的缺陷构成如何?4.4.不同缺陷类型的缺陷构成如何?不同缺陷类型的缺陷构成如何?数据文件:数据文件:A A产品缺陷产品缺陷.mtw.mtw练习二练习二两个变量间关系两个变量间关系利用一些时间看一下利用一些时间看一下MINITABMINITAB提供的图表有哪些技能提供的图表有哪些技能q 在许多情况下当在许多情况下当两个因素或一个因素与两个因素或一个因素与Y Y有密切有密切关系时,把它们作成一个图表,更容易知道问题关系时,把它们作成一个图表,更容易知道问题点的所在点的所在q 另外,随着时间有什么变化另外,随着时间有什么变化(周期或倾向周期或倾向),可,可以推测其产生问题的原因以推测其产生问题的原因相关分析相关分析目的目的:分析输入变量分析输入变量(X)(X)之间或者输入变量之间或者输入变量(X)(X)和输出变量和输出变量(Y)(Y)之间的相关关系,为我们深入分析它们之间的函数关系奠定之间的相关关系,为我们深入分析它们之间的函数关系奠定了基础。了基础。我们想知道以下问题我们想知道以下问题例如例如:1.1.广告费用和销售额之间有什么关系?广告费用和销售额之间有什么关系?2.2.用户的消费与其收入、年龄有什么关系用户的消费与其收入、年龄有什么关系 .通过相关分析我们就可以解决以上问题。通过相关分析我们就可以解决以上问题。相关关系相关关系相关关系可以用数据来看出两个变量相关关系可以用数据来看出两个变量(Y(Y与与X,X,或两个或两个X)X)间紧间紧密程度如何。两者之间关系的强度通过相关系数密程度如何。两者之间关系的强度通过相关系数(r)(r)计数化计数化-1.0-1.0 0 0+1.0+1.0 负的相关系负的相关系 正的相关关系正的相关关系 没有相关关系没有相关关系 决定点决定点r值值 r 接近-1 r 接近+1(+)(+)正的相关关系正的相关关系()负的相关关系负的相关关系接近接近0 0时几乎没有相关关系时几乎没有相关关系相关性的分类相关性的分类弱的正相关弱的正相关 弱的负相关弱的负相关 强的正相关强的正相关 强的负相关强的负相关 其它关系其它关系没有相关关系没有相关关系相关关系图示相关关系图示相关性的判断原则跟样本容量有很大的关系相关性的判断原则跟样本容量有很大的关系 如果样本容量大于如果样本容量大于9 9,相关系数达到,相关系数达到0.70.7时,我们就认为时,我们就认为两个变量之间确实存在相关性;两个变量之间确实存在相关性;如果样本容量大于如果样本容量大于1515,相关系数达到,相关系数达到0.50.5时,我们就认时,我们就认为两个变量之间确实存在相关性;为两个变量之间确实存在相关性;如果样本容量大于如果样本容量大于2525,相关系数达到,相关系数达到0.40.4时,我们就认时,我们就认为两个变量之间确实存在相关性。为两个变量之间确实存在相关性。相关性的判断基准相关性的判断基准事例分析事例分析利用利用A A0303销售能力销售能力分析销售人员销售额与其销售经验等因素分析销售人员销售额与其销售经验等因素之间的关系之间的关系统计统计 基础统计量基础统计量 相关相关相关的滥用与误用相关的滥用与误用q即即使使证证明明Y Y与与X X间间具具有有相相关关关关系系,也也并并不不意意味味着着Y Y的的变变动动一一定定是是X X的的变变动动引引起起的的,即即两两个个变变量量间间有有相相关关关关系系并并不不意意味味着着必必然然有有因因果果关关系系,可可能能存存在在引引起起X X与与Y Y同同时时变变动动的的第第3 3个个隐隐藏藏变变量量。要要想想真真正正了了解解变变量量之之间间的的因因果果关关系系,有有必必要要进行试验设计分析。进行试验设计分析。q相相关关分分析析主主要要考考察察两两个个变变量量之之间间是是否否存存在在线线性性的的相相关关关关系系。相相关关系系数数接接近近“0”0”表表示示两两个个变变量量间间直直线线关关系系弱弱,并并不意味着两个变量间没有关系。不意味着两个变量间没有关系。散点图散点图Scatter plotScatter plot利用利用A A0303销售能力销售能力画出散点图,画出散点图,以便直观判断销售经验与销售额之间以便直观判断销售经验与销售额之间的关系的关系q主要用于评价主要用于评价两因素间两因素间的相互关系,在视觉上判断因素之的相互关系,在视觉上判断因素之间的关系间的关系q两因素的数据分布的密集度及相关性两因素的数据分布的密集度及相关性图形图形 散点图散点图 散点图散点图Scatter plotScatter plot图形图形 散点图散点图 点击点击从视觉上可以从视觉上可以看出,销售额看出,销售额与销售经验之与销售经验之间有较密切的间有较密切的正相关关系,正相关关系,即销售经验越即销售经验越多,其销售额多,其销售额越高。越高。散点图散点图Scatter plotScatter plot边际图边际图Marginal plotMarginal plot图形图形 边际图边际图q从视觉从视觉可以知道可以知道两个因素两个因素之间关系之间关系q直方图和相关图同时出现在视觉上,更容易知道分布的倾向直方图和相关图同时出现在视觉上,更容易知道分布的倾向利用利用A A0303销售能力销售能力对销售额与资对销售额与资历的关系进行图表分析历的关系进行图表分析边际图边际图Marginal plotMarginal plot图形图形 边际图边际图点击点击确认销售额与资历的关系,在这个图上即可以看出确认销售额与资历的关系,在这个图上即可以看出两因素间的关系,也可以了解单个变量的分布。两因素间的关系,也可以了解单个变量的分布。边际图边际图Marginal plotMarginal plot运用边际图运用边际图在散点图里在散点图里画出直方图画出直方图矩阵图矩阵图Matrix plotMatrix plotq 应用于比较应用于比较多个因素多个因素间的相互关系间的相互关系q 与与Scatter PlotScatter Plot相比较更适用于多个因素一起比较相比较更适用于多个因素一起比较利用利用A A0303销售能力销售能力例子对资历、例子对资历、年龄、受教育程度、销售经验之间的年龄、受教育程度、销售经验之间的关系进行关系进行Matrix plotMatrix plot分析分析 图形图形 矩阵图矩阵图矩阵图矩阵图Matrix plotMatrix plot图形图形 矩阵图矩阵图点击点击利用矩阵图可以在图表利用矩阵图可以在图表里看出全部因素间的关里看出全部因素间的关系系销售经验、资历与消费之间均有很强的相关关销售经验、资历与消费之间均有很强的相关关系,而受教育程度和年龄则与销售额之间没有系,而受教育程度和年龄则与销售额之间没有显著的相关关系显著的相关关系矩阵图矩阵图Matrix plotMatrix plot时间序列图时间序列图Time Series plotTime Series plotq 随时间的变化对观测值进行推测及排列,主要使随时间的变化对观测值进行推测及排列,主要使用用Time series plotTime series plot进行分析进行分析图形图形 时间序列图时间序列图时间序列图时间序列图分析是对未来数据的倾向或周期的一种分析方法分析是对未来数据的倾向或周期的一种分析方法受时间影响的数据叫受时间影响的数据叫Time SeriesTime Series数据,先画出图表,掌数据,先画出图表,掌握大概的握大概的Time SeriesTime Series数据形态后,对受时间变化影响较数据形态后,对受时间变化影响较大的数据进行分析大的数据进行分析收集收集Time SeriesTime Series资料资料设定统计模型设定统计模型未来成果未来成果时间序列数据的形态时间序列数据的形态时间序列数据的各种类型时间序列数据的各种类型tyt偶然变动偶然变动(Random Variation)Random Variation)平均在一定水准时,平均在一定水准时,只显示偶然变动的变化只显示偶然变动的变化tyt随时间变化的数据随时间变化的数据,反复于一定的周期反复于一定的周期季节变动季节变动(Seasonal Variation)Seasonal Variation)tyt显示出数据随时间变化的形态显示出数据随时间变化的形态倾向是线形还是二次型倾向是线形还是二次型tyt倾向变动倾向变动(Trend Variation)Trend Variation)政策的变化政策的变化,市场变化对数据市场变化对数据的影响的影响,反映出的变动反映出的变动其它变动其它变动 利用利用Minitab Minitab 图表分析方法图表分析方法(时间序列数据分析时间序列数据分析)对以对以上数据进行趋势分析上数据进行趋势分析打开数据文件打开数据文件:A A0404销售额销售额.MTW.MTW事例分析事例分析 某区域经理为了了解某一个销售网点每月销售额的变某区域经理为了了解某一个销售网点每月销售额的变化情况,每月收集了该网点销售额的数据,希望从中找出化情况,每月收集了该网点销售额的数据,希望从中找出变化的规律。变化的规律。为此收集了为此收集了20052005年年1 11212月的数据,通过时间序列图月的数据,通过时间序列图来了解销售额的变化情况。来了解销售额的变化情况。时间序列图时间序列图Time Series plotTime Series plot图形图形 时间序列图时间序列图点击点击 利用时间序列图利用时间序列图进行分析进行分析,很容易很容易确认长期的趋势确认长期的趋势指标呈稳定的趋势,但指标呈稳定的趋势,但5 5月份和月份和1010月份的突变值得研究?月份的突变值得研究?时间序列图时间序列图两因素间关系及时间序列图分析两因素间关系及时间序列图分析q 到目前为止通过图表分析可以从视觉上判断因素间的关到目前为止通过图表分析可以从视觉上判断因素间的关系是怎样的系是怎样的 通过通过Scatter plotScatter plot分析因素间的相关关系;分析因素间的相关关系;通过通过Marginal plotMarginal plot可同时分析因素之间的关系及可同时分析因素之间的关系及分布;分布;通过通过Matrix plotMatrix plot可同时分析多个因素间关系;可同时分析多个因素间关系;通过通过Time series plotTime series plot可分析某因素随时间变化的可分析某因素随时间变化的倾向。倾向。A A0303客户消费客户消费,利用,利用 Scatter plotScatter plot分析消费与客户收分析消费与客户收入之间的关系;入之间的关系;A A0303客户消费客户消费,利用,利用Marginal PlotMarginal Plot分析消费与用户收分析消费与用户收入之间的关系;入之间的关系;A A0303客户消费客户消费,利用,利用Matrix plotMatrix plot分析消费与年龄及收分析消费与年龄及收入之间的关系;入之间的关系;A A0404销售额销售额,利用,利用Time series plotTime series plot分析分析B B区域和区域和C C区区域销售额随时间变化的倾向。域销售额随时间变化的倾向。给大家给大家20分钟练习时间,把刚才讲的例子重新操作一遍!分钟练习时间,把刚才讲的例子重新操作一遍!练习三练习三注意要点注意要点q 收集数据画图表收集数据画图表q 应用哪个图表分析工具应用哪个图表分析工具 可能的话使用全部工具;可能的话使用全部工具;然后选择最能说明问题的图表;然后选择最能说明问题的图表;q 通过对图表的分析能看出问题发生的主要原因通过对图表的分析能看出问题发生的主要原因q 进行图表批注进行图表批注 题目;题目;资料来源;资料来源;记录特别的原因事件。记录特别的原因事件。第三部分第三部分 多变量分析多变量分析(Multi-vari ChartMulti-vari Chart)多变量分析的目的多变量分析的目的 为了发现因异常原因而产生的变动;为了发现因异常原因而产生的变动;为知道过程随着时间变化所构成的要因;为知道过程随着时间变化所构成的要因;为掌握过程的状态为掌握过程的状态,分析变动原因时分析变动原因时,确定是群确定是群内变动还是群间引起的。内变动还是群间引起的。多变量分析多变量分析Multiple Kinds of VariationMultiple Kinds of Variation是帮助我们确定影响过程是帮助我们确定影响过程输出结果(输出结果(Y Y)的多种因素()的多种因素(X X)中,哪些因素对)中,哪些因素对Y Y影响最影响最大的一种方法。大的一种方法。多变异图多变异图 :适用的条件:适用的条件:p Y Y为连续型数据,为连续型数据,X X为离散型数据(例如类别信息)为离散型数据(例如类别信息)举举 例例 1 1、某某产产品品的的装装配配时时间间受受到到产产品品本本身身的的型型号号、不不同同生生产产线线、白白夜夜班班的的影影响响,在在这这三三个个因因素素中中,到到底底哪哪个个因因素素对产品的装配时间影响更大?对产品的装配时间影响更大?2 2、假假设设销销售售网网点点顾顾客客的的满满意意度度受受营营业业员员的的学学历历、工工作作经经验验、对对产产品品性性能能的的熟熟悉悉程程度度的的影影响响,哪哪个个因因素素对对客客户的满意度影响更大?户的满意度影响更大?案案 例例实际问题:实际问题:为了提高某产品的装配效率,经过生产部门的人员为了提高某产品的装配效率,经过生产部门的人员讨论,认为产品的型号、不同的生产线、白夜班对成表讨论,认为产品的型号、不同的生产线、白夜班对成表的装配时间产生影响。为了确认哪个因素对装配时间影的装配时间产生影响。为了确认哪个因素对装配时间影响更大,负责生产的管理人员收集了产品的装配时间。响更大,负责生产的管理人员收集了产品的装配时间。试问:在这三个影响因素中,哪一个对装配的时间试问:在这三个影响因素中,哪一个对装配的时间影响最大?影响最大?打开数据文件打开数据文件:A A多变量分析多变量分析.MTW.MTW续上续上统计统计 质量工具质量工具 多变异图多变异图输入输入Y Y输入影响因素输入影响因素X X结果分析结果分析绿色的线代表绿色的线代表不同生产线平不同生产线平均装