2022年数据分析培训提纲.doc
《2022年数据分析培训提纲.doc》由会员分享,可在线阅读,更多相关《2022年数据分析培训提纲.doc(21页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、数据分析培训提纲1概论1.1数据分析的重要性(1)贯彻质量治理8项原则的需要QM的8项原则之一为:基于事实的决策方法。要防止决策失误必须提供足够的信息,以及进展科学决策。信息:有意义的数据。数据:能客观反映事实的材料和数字。要使数据提升为信息,才能将其增值。为此,必须从数据搜集和分析上运用科学的方法,使之便于利用。(2)通过数据的搜集和分析可证明QMS是否适宜和有效。(3)协助识别和评价QMS持续改良的时机。(4)加强对各种意见和决策的分析、推断、评审、质疑才能 因而,数据分析是保障QMS有效运转的重要手段。1.2数据分析的一般过程1.2.1数据搜集(1)搜集范围产品、体系和过程的数据,如:产
2、品检测中的不合格,QMS质量目的完成情况、持续改良情况、过程监视和测量情况等。事实上在QMS的各个过程中,都会产生一些数据,在治理中必须依照当前及长远目的的需要,确定应搜集那些数据,重点如何。(2)搜集方法 1)各种报表和原始记录(留意分类) 2)区域网中的数据库 3)留意明确搜集人、搜集时间、搜集方式、传递方式。(3)搜集的要求 1)及时 2)精确 数据的质量,“进来的是垃圾,出去的依然垃圾” 3)完好 数据工程齐全,数量符合要求。1.2.2数据分析、处理(1)数据的审查和挑选 剔除奇异点,确定数据是否充分(2)数据排序 按其重要度进展排序,以确定分析处理的对象和顺序(3)确定分析内容,进展
3、统计分析(4)分析推断 在统计分析的根底上,以目的值或标准为依照,对统计分析结果(绘图或计算)作进一步分析,以获得指导过程改良的明确信息,找出主要咨询题和薄弱环节,并提出相应的改良建议。(5)编写报告 对分析推断得出的规律、趋势整理成报告(附有直观的图表)-1-1.2.3数据的利用不能为分析而分析,要有“的”放矢,数据分析应指导治理。数据分析是为了科学决策,决策的结果,可通过前后比照来分析推断其有效性。数据分析应对其全过程做到闭环治理。为此,应将数据分析信息有效地传递,做到信息共享。在风险评估的根底上,采取适当措施。2统计分析技术2.1概述2.1.1什么是统计分析技术(1)统计技术 运用数理统
4、计的方法对数据进展分析,找出其规律和趋势。如:常用的操纵图、回归分析、试验设计等。(2)分析技术运用逻辑分析的方法对数据进展分析,找出妨碍事物的要素及其妨碍程度。如常用的陈列图、因果图、饼图、QFD和 FMEA等方法。2.1.2统计技术应用的根底条件(1)日常治理秩序健全,产质量量有可追溯性。(2)消费过程相对稳定。 妨碍质量的要素已标准化,过程质量处于受控状态。(3)具备必要的物质、技术根底 测试手段适用,必要的图表及计算处理器具或软件。(4)大量的数据计算和处理运用计算机2.2统计技术的根底知识2.2.1随机变量及其分布(1)什么是随机变量: 变量数值有变化的量,相对常量而言。 随机要素随
5、机(不是人为偏向)要素(多种要素),如:年降雨量,抛硬币。 加工尺寸由模具磨损、机器磨损、材料、人的操作重复性、环境等决定。 随机变量受随机要素妨碍的在一定范围内取值的量抽样必须随机,不能有倾向性,。(2)分布间距X 直方图: fini n数据总数n参数 频率:fi= ni第i组的频数 连续型随机变量: X O 为一光滑曲线,此曲线为分布函数。 分布的特征:形状(对称、偏斜)、位置、分布宽度(最大值最小值)。2.2.2总体与样本 总体研究对象的全体,如一批电缆,可视为总体,研究其总长,每一根(或段)电缆则为总体中的一个个体(成员),一批所有电缆的总长为总体。 总体用变量X表示-2- 样本从总体
6、中抽出的部份个体组成的集合称为样本。 抽样 由于不可能研究每一个个体。 从样本推断总体,必须正确反映总体的信息,正确抽样。 随机抽样简单随机样本、随机数表 Xi 099 能够构成2500个随机数。2.2.3正态分布 钟形曲线,曲线下的面积表示概率 对称,中间高,两边低 X(, 2) X 总体的均值;总体标准差 正态分布检验: 直方图 概率纸 横坐标X的等距取值 ;纵坐标不等距0.01%99.99% 在概率纸上描出的点呈不断线,则为正态分布。 正态分布的分布函数值 近似正态分布总趋势符合正态分布,但有个别的奇异点。2.2.4常用统计特征量(样本) 统计量不含未知数的样本函数称为统计量。 统计量是
7、由样本得出,但其对可能总体情况(产品的某些特性值)具有重要意义。(1)反映样本位置的统计量 1)均值样本的算术平均值 X 样本中的数据多数分布在样本均值附近,因而它是表示样本位置的最好的统计量。 局限性:容易受数据中的特大、特小值(异常值)的妨碍。 假设有5个样本,观测值为 3,5,7,9,11 X=7 假如误将11记为21 X=9 当数据异常时,把X作为数据的代表不太适宜,需要引入新的统计量。 2)中位数样本中的数据从大到小陈列后处在中间位置上的数。 样本容量 n为奇数时,它为中间的一个数 n为偶数时,它为中间的两个数的平均值,记为M 如样本为 10,15,23,30 则M=(15+23)/
8、2=19 10,15,23,30,35 则M=23 中位数受异常值的妨碍较小,如:其M均为7 3,5,7,9,11 3,5,7,9,21(2)反映数据波动的统计量 1)极差 R=Xmax Xmin 极差计算简便,但对样本信息利用不够,且它受异常值的妨碍较大。两者极差差异相当大,但中位数一样 如:前例中 3,5,7,9,21 则极差为18 3,5,7,9,11 极差为8 2)方差和标准差 样本方差:较充分利用数据,反映数据的波动 S22= (XiX)2/(n1)-3- 即单个样本数据与样本均值之差的平方和除以(样本容量1) 假设样本为 3,5,7,9,11 n=5 S2=(37)2+(57)2+
9、(77)2+(97)2+(117)2/4=10 5,6,7,8,9 则S2=2.5 S2小说明数据波动小,即数据较为集中。 标准差方差的平方根 S2 =S, 如S2=16, 则S=4 由于方差虽可反映数据的波动,但其量纲为原始数据的量纲的平方,在量纲上不明确,故引入标准差。2.2.5正态分布总体参数可能当一个特征量(总体函数)服从正态分布时,其分布可由,2唯一确定,假设样本的观察数据服从正态分布时,则可用样本的均值和方差去可能总体。可能值 =X 2=S2 这时需留意三个层次对应的三种符号、总体; X、S样本; 、2可能值2.3常用统计分析方法2.3.1记实统计(描绘性统计)(1)记实统计的概念
10、记实统计是提醒数据分布特性的概述和显示定量数据的程序。重要的数据特性: 1)趋中性(多数常常分布在中间)能够通过模型或中位数来描绘。 2)数据范围 如最大、最小值的区间,标准区域 3)数据分布 如对称度,分布规律(可用数学模型描绘)(2)记实统计的表达方法 常用简单的图形来有效地传递信息,如:饼图、条形图表、直方图等,其优点在于能显示定量分析中不易发觉的数据的异常特性,能够显示复杂数据,适于非专业人员分析相关数据,它易于理解并能够在所有层次用于分析和推断。(3)记实统计的应用用于数据的概述并描绘特征, 通常是定量数据分析的第一步,它可提供抽样数据特性(如均值和标准偏向)的定量量值,然而其量值取
11、决于抽样大小和所采纳的抽样方法。记实统计对搜集定量数据的所有领域均适用,如:描绘产品特性的关键量值(如中值或范围)描绘过程参数(如温度)对顾客调查中搜集数据的统计。2.3.2抽样检查抽样是为得到关于一个总体的一些特性的信息,而去研究总体的代表性部份(即样本),通过样本的特性来推断总体的特性的方法。可利用抽样技术,如简单随机的、系统的、连续的、跳批等,来获取样本。抽样方法的选择取决于抽样的目的和详细条件。针对不同的对象和目的,有许多抽样标准,如GB/T2828是针对连续批产品验收,GB/T15239针对孤立批产品验收。2.3.3统计过程操纵(SPC)2.3.3.1概述(1)历史:休哈特1924年
12、创造操纵图,3060年代世界质量治理以此为根底来操纵质量特性。(2)统计过程操纵的作用:-4- 1)完成QC的重要任务,即“监测”妨碍质量的全部消费过程的变量和过程参数。 2)确定过程参数和产品特性是在期望的范围内,依然偏离了上述范围。 3)当过程中的咨询题暴露无遗时,将危及产品特性,因而需要统计过程操纵来预见咨询题马上出现,从而降低消费费用。 4)理解过程变差,并协助到达统计操纵状态,处于统计操纵状态,其功能可预测。 5)改良受控状态。(3)SPC的应用条件 1)测量系统误差必须能被识别或给予补偿、消除,测量系统误差可按(MSA)去操纵。 2)测量过程参数的偏向,都应是随机误差,同时效劳正态
13、分布。 3)过程在统计操纵之下,均值和标准差近于恒定,分布范围在3之内。2.3.3.2操纵图根底知识(1)操纵图的优点 1)简便,便于现场操作者使用 2)有助于稳定过程和本钱 3)促进过程信息交流(二、三班制工人间,工艺、质管人员) 4)易识别造成变差的缘故,防止混淆、减少时间和资源的浪费(2)应留意区别以下概念: 公差(容差):同意的参数变动范围 偏向:与公称值之差 变差:一批样本中参数的变动范围(3)变差的两类缘故 1)一般缘故 造成随时间推移,稳定且可重复的分布过程的变差缘故,关于稳定系统的偶尔缘故(如周期振动),需要采取系统措施: 消除普遍缘故 大都由治理人员纠正 85%咨询题属此类
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 2022 数据 分析 培训 提纲
限制150内