第11章 描述统计.pdf
《第11章 描述统计.pdf》由会员分享,可在线阅读,更多相关《第11章 描述统计.pdf(69页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、1第十一章第十一章第十一章第十一章第十一章第十一章第十一章第十一章 描述统计描述统计描述统计描述统计描述统计描述统计描述统计描述统计概率论是研究随机现象统计规律的学问,它为数理统计奠定了理论基础。所谓数理统计,是以概率论为基础,通过合理地获取随机现象的少量数据资料,估计和检验反映随机现象的某种数字特征,或分析和判断随机现象所具有的统计规律性的学问。数理统计的应用相当广泛,它已成为工业、农业、商业、医药卫生、教育、社会学、经济学、生物学、气象学等各领域必不可少的数学工具和分析方法,因此又被称为统计技术。描述统计是通过图表或数学方法,对数据资料进行整理、分析,并对数据的分布状态、数字特征和随机变量
2、之间关系进行估计和描述的方法。它是统计技术的重要组成部分,并在以后各章的统计推断技术中被应用。11.1 数据的收集数据的收集数据的收集数据的收集11.2 数字特征描述数字特征描述数字特征描述数字特征描述(估计估计估计估计)11.3 分布状态描述分布状态描述分布状态描述分布状态描述频数直方图频数直方图频数直方图频数直方图11.4 排列图排列图排列图排列图、因果分析图因果分析图因果分析图因果分析图、趋势图趋势图趋势图趋势图211.1 11.1 数据的收集数据的收集数据的收集数据的收集数据的收集数据的收集数据的收集数据的收集科学研究中,若无定量分析,就不会有明确的概念,也就不易找出科学的规律。质量管
3、理如果不进行定量分析,也就不会有明确的质量概念,就不会有科学的质量管理。因此质量管理是一种以数据为基础的活动。人们必须通过有目的的搜集数据,从中获取有关产品质量或生产状态的正确情报,从而做出正确的判断和决策,更有效地管理生产。一一一一 数据及其实质数据及其实质数据及其实质数据及其实质二二二二 总体总体总体总体、个体个体个体个体、样本样本样本样本、样品样品样品样品三三三三 数据收集的原则数据收集的原则数据收集的原则数据收集的原则四四四四 数据的分类数据的分类数据的分类数据的分类3一一一一一一一一 数据及其实质数据及其实质数据及其实质数据及其实质数据及其实质数据及其实质数据及其实质数据及其实质数据
4、数据数据数据:在质量管理的各项活动中,记录有关科学试验、质量特征、生产状态及管理现状得到的数字资料统称为数据。实质实质实质实质:收集的数据绝大多数都 既 具 有 随机性(偶然性)又具有统计规律性。也就是说它们具有随机现象的某些特征,或者说是随机变量的一组取值。4二二二二二二二二 总体总体总体总体、个体个体个体个体、样本样本样本样本、样品样品样品样品总体总体总体总体、个体个体个体个体、样本样本样本样本、样品样品样品样品1 总体与个体总体与个体总体与个体总体与个体定义定义定义定义:研究对象的全体,称为总体总体总体总体或母体母体母体母体;组成总体的每个单元称为个体研究对象的全体,指的是研究对象某 个
5、数量 指 标 的 全部取值,由于一个数量指标通常就是一个随机变量,因此,总体是指某随机变量的取值的全体。而其中的每 个 值 都 是 一 个 个 体。例如,工厂生产一批晶体管,共10000件。其直流放大系数是一个随机变量,10000件产品直流放大系数数据的全体称为总体,而其中的一个数据则是一个个体。如果要研究的不是一个,而是几个数量指标,如对一批晶体管不仅要研究其直流放大系数,还有研 究 集电极-发射电极反向电流时,则要分为几个总体来研究。总体的有限和无限 类 型 随 研究的问题而定,对于上述的一批晶体管而言,总体是有限的;但有时根据研究的需要,我们常把相同条件下的生产的所有晶体管看成一个总体,
6、显然,此时,它是一个无限总体。2 样本与样品样本与样品样本与样品样本与样品3 样本与总体样本与总体样本与总体样本与总体52 2 样本与样品样本与样品样本与样品样本与样品样本与样品样本与样品样本与样品样本与样品定义定义定义定义:从总体中随机抽取的若干个个体的总和称为样本样本样本样本或子样子样子样子样;组成样本的每个个体称为样样样样品品品品;样本中所有的样品的数目称为样本容量样本容量样本容量样本容量或子子子子样大小样大小样大小样大小,样本容量常用符号n代表例例例例:从批量为10,000的一批晶体管中随机抽取20件进行检查,被抽查的20件产品称为样本,而其中每一件产品称为样品;样本大小为20。由于人
7、们通常只获得样本数据,故简称为数据63 3 样本与总体样本与总体样本与总体样本与总体样本与总体样本与总体样本与总体样本与总体人们从总体中抽取样本的目的是根据样本数据对总体的数字特征和分布规律进行推断、估计和检验。自然,由样本推断和估计总体很难做到完全精确和可靠。但是必须采取措施获得比较精确和具有一定可靠性的推断。其措施涉及两方面的问题:即抽取样本的方法和统计推断的方法。当样本的抽取满足下列两个条件时,样本将能很好地反映总体的统计规律性:(1)样本容量n足够大。样本容量越大,推断的结论越准确,可靠性越高;(2)采用随机抽样,即总体中每个个体被抽到的机会均等,即使一个个体被抽取后,总体的成分不变。
8、换句话说,每个样品的抽取都是一次独立、重复试验。至于应采用的统计推断方法将在以后各章讨论7样本与总体的关系样本与总体的关系样本与总体的关系样本与总体的关系样本与总体的关系样本与总体的关系样本与总体的关系样本与总体的关系个体具有随机性总体具有统计规律性总体样本样本随机性样本具有统计规律性条件抽样方法正确:n足够大随机抽取统计推断方法正确结果:样本的统计规律性在一定程度上反映总体的统计规律性决定8三三三三三三三三 数据收集的原则数据收集的原则数据收集的原则数据收集的原则数据收集的原则数据收集的原则数据收集的原则数据收集的原则数据的收集是一项重要的基础工作,为了给质量管理工作提供可靠的准确的情报,搜
9、集数据时,必须遵循以下原则1 随机抽样随机抽样随机抽样随机抽样2 数据的分层数据的分层数据的分层数据的分层3 明确数据收集的目的和方法明确数据收集的目的和方法明确数据收集的目的和方法明确数据收集的目的和方法4 作好数据记录作好数据记录作好数据记录作好数据记录,保证数据真实保证数据真实保证数据真实保证数据真实、可靠可靠可靠可靠、准确准确准确准确91 1 随机抽样随机抽样随机抽样随机抽样随机抽样随机抽样随机抽样随机抽样定义定义定义定义:是指从总体抽取样品时,使每个个体被抽到的机会均等以使所抽取的样本数据能够很好地代表总体的抽样方法。方法方法方法方法:鉴于实际情况产品的大小、形状、存取状态等方面的差
10、异及条件限制,常用的随机抽样方法为:(1)简单随机抽样法:(单纯随机抽样)抽签法(或掷骰子法)随机数表法(2)分层随机抽样(3)系统随机抽样(4)多级随机抽样10随机数表法随机数表法随机数表法随机数表法随机数表法随机数表法随机数表法随机数表法(1)定义定义定义定义:用随机数表查出样本号码的方法(2)步骤步骤步骤步骤:随机决定所用数表页码(瞎子点点法或掷骰子法)决定起点(瞎子点点法)查样本号数:N10,查一位数字即可,取到n个样品为止,重复的数字取消11n100,查两位数字,大于n的以n除之取余数,重复数字去掉n100,向下取三位,大于n的以n除之取余数,重复数字去掉(3)例例例例:从批量N=5
11、0的产品中抽n=4的样本采用掷骰子采用掷骰子法确定选随机数表“I”;用瞎子点点法确定起点为11行第1 列,随机号码为18、18、07、92、45、44取18、7、42、4511分层随机抽样分层随机抽样分层随机抽样分层随机抽样分层随机抽样分层随机抽样分层随机抽样分层随机抽样1560751600800150=CBAnnn定义定义定义定义:将总体按产品的某些特征把整批产品划分为若干层(即小批),即分为层,同一层内的产品质量尽可能均匀一致,在各层内分别用简单随机抽样法抽取一定数量的个体组成一个样本的方法分层按比例随机抽样分层按比例随机抽样分层按比例随机抽样分层按比例随机抽样:若按各层在整批中所占比例分
12、别在各层内抽取就称为分层按比例随机抽样例例例例:某批产品批量为N=1600,由A、B、C三条生产线加工而成,NA=800,NB=640,NC=160。取n=150的样本。解:12系统随机抽样法系统随机抽样法系统随机抽样法系统随机抽样法(间隔随机抽样间隔随机抽样间隔随机抽样间隔随机抽样)系统随机抽样法系统随机抽样法系统随机抽样法系统随机抽样法(间隔随机抽样间隔随机抽样间隔随机抽样间隔随机抽样)定义定义定义定义:当批中产品可以按某个次序排列时,给批中每个 产 品 编号1N,以整数部分为抽样间隔,用简单随机抽样法在1至之间随机 抽 取 的 一个整数作为第一个单位产品号码,每隔个产品抽取一个,直到抽出
13、n个样本为止例例例例:某工序每天生产200件产品,规定巡检员在一天中抽取n=10的样本进行检查,试用系统随机抽样确定抽取的样本号码解:,第一个样品号码用抽签法确定为13,则被抽取的样品号码为13、33、53、193nNnNnN1nN20=nN13多级随机抽样法多级随机抽样法多级随机抽样法多级随机抽样法多级随机抽样法多级随机抽样法多级随机抽样法多级随机抽样法定义定义定义定义:整批产品由许多群组成,每群又分若干组组成,以前三种方法任一种抽取一定数量的群,该群的单位产品组成样本,称为整群抽样法或一级随机抽样法,若在各群中按随机抽样法抽取若干组组成样本,称为二阶段或二级随机抽样例例例例:某产品批N=2
14、0000,分为200箱,每箱100个,分为4盒,每盒25个,抽取n=100的样本解:从200箱中随机抽取1箱,作为样本为整群随机抽样从200箱中随机抽取4箱,每箱中随机抽取1盒作为样本称为二级随机抽样从200箱中随机抽取10箱,每箱中随机抽取2盒,每盒中随机抽取5个作为样本,称为三级随机抽样142 2 数据的分层数据的分层数据的分层数据的分层数据的分层数据的分层数据的分层数据的分层定义定义定义定义:所谓数据的分层就是将收集来的样本数据根据不同的使用目的和要求,按其性质、来源、影响因素等对其进行分类的方法,它是分析产品质量问题产生原因的有效方法。注意事项注意事项注意事项注意事项:(1)数据的分层
15、与数据收集目的紧密联系,目的不同,分层的方法与粗细也不同(2)分层的粗细与对生产过程了解的程度有关(3)分层是一项细致的工作,分层不当,将会造成问题原因不清的后果分层原则分层原则分层原则分层原则:操作人员工艺装备加工方法时间材料环境其他例例例例1例例例例215例例例例例例例例1 1在磨床上加工某零件外圆,由甲乙两工人操作各磨100个零件,其产生废品45件,试分析废品产生的原因。452223小计18117碰伤21183锥 度 不 合 格321椭圆度超标准312光洁度不合格200100100合计乙甲若只对工人,不对不合格原因进行分层:两工人的废品率相差无几,找不出重点。若只对不合格原因,不对工人进
16、行分层:则会得到主要因素为锥度不合格、碰伤两原因。对工人及不合格原因分层后:甲工人主要因素为碰伤;乙工人主要因素为锥度不合格16例例例例例例例例2 2在某产品装配过程中,经常发现齿轮箱盖漏油的现象,为解决该问题,对该工艺进行了现场调查,收集数据n=50;漏油数f=19;试用分层法找出影响产品质量的原因1 通过分析:造成漏油的原因有两个(1)齿轮箱密封垫是由甲、乙两厂分别供给的(2)涂粘结剂的工人A、B、C操作方法不同2 为分析问题原因,采用分层法分别对操作者和齿轮箱垫供货单位分层3 措施:采用乙厂的齿轮箱垫,工人B的操作方法4 效果:漏油率不但未降低,反而增加了5 再次分析原因:只是单纯地分别
17、考虑不同工人,不同供应厂造成的漏油情况,而没有进一步考虑不同工人用不同供应厂提供的齿轮箱垫造成的漏油情况,即由于没进行更细致的综合分析造成的。作综合分层结论:使用甲厂齿轮箱垫时B的操作方法好使用乙厂的齿轮箱垫时A的操作方法好采用措施后漏油率大大降低17操作者分层表操作者分层表操作者分层表操作者分层表383119合计53910C2593B32136A漏油率(%)不漏油漏油工人383119合计32178乙441411甲漏油率(%)不漏油漏油供货厂齿轮箱垫供货单位分层表齿轮箱垫供货单位分层表齿轮箱垫供货单位分层表齿轮箱垫供货单位分层表18综合分层表综合分层表综合分层表综合分层表综合分层表综合分层表综
18、合分层表综合分层表502525合计311714不漏19811漏计927不漏1055漏C945不漏330漏B13112不漏606漏A乙甲计齿轮箱垫供货厂操作者193 3 明确数据收集的目的及方法明确数据收集的目的及方法明确数据收集的目的及方法明确数据收集的目的及方法明确数据收集的目的及方法明确数据收集的目的及方法明确数据收集的目的及方法明确数据收集的目的及方法目的通常有下列几种:(1)为掌握生产现状收集数据(2)为分析问题收集数据(3)为判定产品质量合格与否收集数据(4)为控制生产状态收集数据(5)为掌握与调节工艺状态收集数据目的不同,收集的方法(数量、时间、地点、取样方式、测试方法、精确度以及
19、定性质量指标数量化的方法及标准等)不同204 4 作好数据记录作好数据记录作好数据记录作好数据记录,保证数据真实保证数据真实保证数据真实保证数据真实、可信可信可信可信、准确准确准确准确作好数据记录作好数据记录作好数据记录作好数据记录,保证数据真实保证数据真实保证数据真实保证数据真实、可信可信可信可信、准确准确准确准确(1)为避免数据遗漏,在收集的同时进行数据整理和简单的分层,应尽量使用预先设计的数据记录表格调查表调查表是为了掌握生产和试验现场情况,根据分层的思想设计出的数据及不合格记录表格。是收集数据并对数据进行粗略整理的有效工具。根据使用目的,使用场合,使用对象以及使用范围不同,调查表的形式
20、,内容也多种多样,在实际中可以灵活设计和应用(2)注意记录与数据有关的数据背景,如测试时间、地点、数量、测试者、零件号、批号、名称规格及必要的环境条件等。有利于分析问题,且可以避免不同条件的数据混淆(3)数据必须真实、可靠、准确21不良项目调查表不良项目调查表不良项目调查表不良项目调查表不良项目调查表不良项目调查表不良项目调查表不良项目调查表69148938合计2T其他3一T折叠5一一夹渣20正正正正气孔10一正缩裂29正一正正正正欠铸小计检查记录铸件缺陷原始记录表零件名称:盖子零件图号:日期:单位:车间工段操作者:填号人:部位缺陷项目22缺陷位置调查表缺陷位置调查表缺陷位置调查表缺陷位置调查
21、表缺陷位置调查表缺陷位置调查表缺陷位置调查表缺陷位置调查表机翼划伤位置记录表单位:车间工段日期:年月日操作者:填号者:严重划伤:轻划伤0 :压坑23四四四四四四四四 数据的分类数据的分类数据的分类数据的分类数据的分类数据的分类数据的分类数据的分类不同的样本数据来源于不同的总体,即是不同的随机变量的一组(某些)取值,不同的随机变量有不同的统计规律。因此在进行数据分析前必须分清数据的类型1 计量值数据计量值数据计量值数据计量值数据:可以连续数值的数据如长度、温度、硬度、强度、化学成分、时间它是连续型随机变量的一组取值具有连续型随机变量的分布特征2 计数值数据计数值数据计数值数据计数值数据:是对单位
22、产品或产品上的缺陷进行检查时得到正整数数据如不合格品数、出勤人员、疵点数等注意:表示百分率的数据(如出勤率、不合格品率、退修率等)其类型取决于其分子数据的类型分类:(1)计件值数据:对产品 按件检查时得到的数据(如批产品中的不合格品数)(2)计点值数据:检查 单件产品上质量缺陷时得到的数据如单位棉织品上的 疵点数、铸件上的砂眼数、收音机底版焊点数等)3 顺序值数据顺序值数据顺序值数据顺序值数据:为了把定性指标定量化,按某种标准进行评分以比较优势程序,确定评定等级或类别得到的数据24 11.2 11.2 11.2 11.2 11.2 11.2 11.2 11.2 数字特征描述数字特征描述数字特征
23、描述数字特征描述数字特征描述数字特征描述数字特征描述数字特征描述(估计估计估计估计估计估计估计估计)一一一一 统计量统计量统计量统计量二二二二 样本平均值样本平均值样本平均值样本平均值三三三三 众数众数众数众数四四四四 中位数中位数中位数中位数五五五五 极差极差极差极差六六六六 样本方差样本方差样本方差样本方差七七七七 样本均方差样本均方差样本均方差样本均方差25一一一一一一一一 统计量统计量统计量统计量统计量统计量统计量统计量?描述样本数据统计性质的度量值称为统计特征量,简称统计量。统计量是随机变量X数字特征的估计值?统计量的数值大小是由收集的样本数据决定的,统计量是样本数据的函数,但其中不
24、包含未知的参数。如果说,在一个函数中,既包括样本数据,又有未知参数,那么这个函数就不能称为统计量。?鉴于样本抽取的随机性,作为样本的函数,统计量也是一个随机变量。统计量的分布是由X的分布决定的?常用统计量有样本平均值、中位数、众数、极差R、方差S2、均方差S等xx26二二二二二二二二 样本平均值样本平均值样本平均值样本平均值样本平均值样本平均值样本平均值样本平均值1 概念概念概念概念从总体中随机抽取大小为n的样本,其数据分别为x1、x2、xn,则其样本平均 值记为样本平均值是总体X数学期望的估计值若样本数据的种类数为k,第j种数据的数值为xj;xj出现的频数为fj;此时可用下式计算:例例例例1
25、 1 1 12 性质性质性质性质=kjjjxfnx1127例例例例例例例例1 1 1 1 1 1 1 1从某工序加工的一批零件中随机抽取样本大小为12的数据。其尺寸分别为:25.5,25.8,25.9,25.7,25.8,25.6,25.9,25.8,25.8,25.6,25.9,25.8。试估计该批零件的均值。解:或76.25)39.2526.2515.25(121=+=Lx282 性质性质性质性质是一个随机变量,若总体的数学期望为,方差为2,则随机变量的数学期望和方差分别为:可以看出,n越大,的散布越小。例2 从一批产品中随机抽取5件测量其尺寸,得数据如下:14.5,14.0,13.2,1
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 第11章 描述统计 11 描述 统计
限制150内