实验室统计技术和实践分析.pptx
《实验室统计技术和实践分析.pptx》由会员分享,可在线阅读,更多相关《实验室统计技术和实践分析.pptx(208页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、实验室统计技术和实践分析,Analysis of Statistical Technology and Practice in Laboratory 主讲人 吴有炜,实验室统计技术和实践分析,第一章 实验室质量控制导论和基础统计概念 第一节 实验室质量控制导论 第二节 基础统计概念 以下问题:产品质量指标的重要参数(譬如指标的均值、波动大小、具有某性质的比例)如果未知,怎么推断出这些参数?-参数估计与假设检验。其中单总体用于将过程均值(或比率)与目标值比较、估计过程的均值;双总体用于确定两组数据是否存在差异、确定一组是否优于另一组、确定两组差异是否为一特定值。实验室指标中心值的确定;实验室里确
2、定实验员(或方法或设备)有无系统偏差;实验室分析稳定性均匀性 第二章 参数估计与假设检验 第一节 参数估计与假设检验问题的提出 第二节 参数估计问题和软件操作 第三节 假设检验问题的各类案例与软件操作,以下问题:实验结果分析(提高产量质量、降低成本、处理质量问题、新产品研发)中,如何确定诸参数对产品指标 的影响大小?-方差分析(影响力分析),其中单因素方差分析用于比较多组数据的均值差异、寻求最佳组、在多组间进行二二比较;双因素(及多因素)方差分析用于研究各因素(及交互作用)对指标的影响力、寻求最佳水平组合 。 第三章 方差分析 第一节 方差分析的统计原理 第二节 单因素方差分析和程序应用 第三
3、节 双因素(有重复、无重复)方差分析和程序应用,问题:响应变量和(一个或多个)控制变量间的关系如何分析?也就是如何求得因变量和自变量间的经验公式?如何进行预测与控制?-回归分析 第四章 回归分析 第一节 一元线性回归和最小二乘法 第 二节 多元线性回归与方程优化 第三节 可转化为线性回归的非线性模型,问题: 如何安排实验获取数据并分析提取信息?-实验设计 问题:如何进行因子删选?-方法1.正交表L8(27) . 方法2.二水平正交设计的部分实施。 问题:对显著因子如何进一步分析? 方法1.正交表L9(34). 方法2.二水平正交组合设计与响应面分析 第五章 实验设计 第一节 实验设计概述 第二
4、节 用正交表L8(27)删选因子 第三节 用三水平正交表L9(34)分析显著因子 第四节 用正交表L9(34)进行配比配方实验 第五节 用二水平正交设计的部分实施删选因子 第六节 二水平正交设计的完全实施分析显著因子,第六章 多指标综合 第一节 实验指标综合 第二节 多指标模糊综合评价 第七章指标标准值的确定 第一节实验室指标中心值的确定 第二节 指标公差的确定 第八章实验室误差处理 第一节 随机误差和随机误差大小的估计 第二节 系统误差与系统误差的判别 第三节过失误差与离群值(奇异值)的判别 第四节 误差传递 第九章实验室转向小试或生产的风险管控 第一节 FEMA简介 第二节 FMEA表的填
5、写和FEMA的风险分析和控制,第一章实验室质量控制导论和基础统计概念,第一节实验室质量控制导论 1.1. 质量管理及质量控制的内涵 任何组织都需要管理。当管理与质量有关时,即为质量管理。对于实验室,质量管理既是实验室生存的基础,也是实验室发展永恒的主题。 质量管理指”在质量方面指挥和控制组织的协调活动”,包括制定质量方针、目标以及质量策划、质量控制、质量保证和质量改进等活动。 质量控制是质量管理的一个重要组成部分,致力于满足质量要求。 质量控制的目标就是确保产品的质量能满足顾客、法律法规等方面的质量要求,如适用性、可靠性、安全性。,1.2 实验室的质量要求,实验室的最重要的质量要求是检测结果/
6、报告准确、可靠、及时,满足客户的需求。 检测质量控制的工作要围绕这些要求来展开,主要包括专业技术和管理技术两个方面,涉及检测结果和检测报告形成全过程的各个环节,需要对影响检测工作质量的人、机、料、法、环等多个因素进行控制,并对质量活动的结果进行分析验证,以及时发现问题,采取相应措施,尽可能减少或防止不合格发生,以符合质量要求。实验室质量控制也应贯彻事前预防为主的原则。在检测过程中充分利用各种质量控制技术,以确保这些过程或因素不产生质量问题,或在过程中尽早发现问题并及时纠正。,1.3 质量管理发展历史 质量管理的发展分为以下三个阶段 (1) 质量检验阶段 质量管理的初始阶段,由专职检验部门实施质
7、量检验,对已完成的产品(最终成品)进行质量检验,这种检验虽然至今仍不可缺少,但靠的是事后把关,是一种防守型质量管理。 (2) 统计质量控制阶段SPC 美国的休哈特将数理统计理论引入到质量管理中,利用SPC理论和控制图对生产(服务)包括实验室检测过程进行实时的质量监控,这种监控能及时发现和消除不正常原因,防止废品的产生。这是一种积极的事先控制和预防。 (3) 全面质量管理(TQM) 保留前两者的长处,并对整个系统采取措施,不断提高质量,是一种全员全局性的质量管理模式。,.1.4 实验室相关质量标准的发展 现代实验室质量控制技术的核心思想是伴随着质量管理体系发展和实验室认可逐步推广而发展的。实验室
8、质量标准是在各国产品质量标准和国际质量管理、质量保证质量标准产生并应用基础上产生的。 国际标准化组织ISO符合性评定委员会(CASCO)制定了专门适用于实验室质量管理标准:ISO/IEC导则25:1990校准和检验实验室能力的要求,后来又修订为ISO/IEC17025:2005校准和检验实验室能力的通用要求,为评价实验室校准或检测是否达到要求提供依据,为实验室质量控制提供有效方法。 目前,中国合格评定国家认可委员会(CNAS)是我国唯一的实验室认可机构,所有的校正和检测实验室均可采用和实施ISO/IEC17025:2005标准。按照国际惯例,凡是通过ISO/IEC17025认可的实验室提供的数
9、据均具备法律效应,应得到国际认可。,第二节 统计基本概念和统计量,实验室质量管理和质量控制技术离不开数理统计理论, 以下介绍数理统计的一些基本概念 2.1 描述性统计量 统计学(Statistics) 收集、整理、展示、分析解释统计资料 由样本(sample)推论母体群体(population) 能在不确定情况下作决策 是一门科学方法、决策工具,抽样,推论,采集数据X1,X2,Xn,数据的(不含未知参数的)函数称统计量 1)反映位置 样本均值 (Sample Average、Samplemean) Md 中位数(median) 2)反映变差(波动 ) 样本方差/变异( Sample Varia
10、nce) s 样本标准差( Sample Standard Deviation) R 极差(range) 变异系数 (Coefficient of Variation) CV =(标准差/均值)100,统计量-反映位置,样本均值(Sample average或 Sample mean)表示数据中心位置 样本均值 是波动但可求的 总体均值是固定的值但往往未知,用样本信息推断总体信息,统计量-反映变差(波动),样本方差/变异(Sample variance) 样本方差S2可求但是波动 总体方差为 是固定的数,往往未知 通常用样本方差s2去推断总体方差2,关于方差的理解:,统计量-反映变差(波动),
11、样本标准差s(Sample standard deviation)-与数据同量纲,统计量-反映变差(波动),R (range) 极差是指一个变量数列中最大标志值与最小标志值之差。又称为全距。当实验成本较大时,可采用极差代替标准差进行讨论。 RXmaxXmin,统计量-反映变差(波动),变异系数 (Coefficient of Variation) CV =(标准差/均值)100 变异系数无量纲,可用于在不同量纲的数据间比较波动大小,或用于在虽然同量纲但数量级不同的数据间比较波动大小。,问题:两个变量有关直线关系?2.2 两个变量间的(线性)相关性,考察产品的多个特性指标时,两个强相关的特性指标
12、只需考察其中一个,另一个可以利用其关系式推断。,实际问题、分析方法的零假设H0和显著性概率Pr,统计问题的解决过程: 步骤1:提出实际问题,将此问题转化成对应零假设H0(往往从负面角度给出零假设) 步骤2统计方法构造的相应的统计量,由数据代入统计量计算出统计量值,此值与显著性概率Pr一一对应。 步骤3 由Pr对零假设H0下如下结论: (1) Pr0.05 , 接受H0 ; (2) 0.01Pr0.05 ,拒绝H0 ; (3) Pr0.01,高度拒绝H0;,步骤1:两个定量变量x、y(直线)相关吗? H0:两个定量变量(直线)不相关(或称为)弱相关 步骤2由两组数据计算出两个变量的相关系数R,此
13、值与显著性概率Pr一一对应。 步骤3 由Pr对零假设H0下如下结论: (1) Pr0.05 , x与y弱相关 ; (2) 0.01Pr0,称x与y正相关;否则称x与y负相关 请看利用”相关性程序”求变量间相关系数的演示,练习题,1.设有数据 16, 15 ,21, 18, 14 则数据均值与极差分别为_。 2.统计量均值、 方差 、中位数 、 标准差中与数据量纲不一致的是_。 3.统计量均值、 方差 、中位数 、 标准差中反映数据变异(波动)的是_。 4.对于两个变量x,y其数据经相关性分析软件输出分析结论为相关系数rxy=0.862,显著性概率Pr=0.032,这两个变量的相关性分析结论为_
14、。,以下问题:产品质量指标的重要参数(譬如指标的均值、波动大小、具有某性质的比例)如果未知,怎么推断出这些参数? 实验室如何确定指标中心值?如何分析有无系统偏差?如何讨论分析结论的稳定性或均匀性?-参数估计与假设检验第三章 参数估计、假设检验与软件操作(康恩贝要求列入内容),第一节 参数估计与假设检验问题的提出 例.第一类问题:我国成年男性平均身高超过多少? 此类问题中不含数字 第二类问题:我国成年男性平均身高超过1.7米吗? 此问题中含数字 把这样问题中的”均值”称为未知参数 因为中国人口众多,这个未知参数无法精确求出,只能用抽样的方法进行推测,例.考察某灯炮厂某一型号全部灯管的质量。 第一
15、类问题:灯管的平均寿命超过多少呀? 此类问题中不含数字。 第二类问题:灯管的平均寿命10000小时吗? 此类问题中含数字。 因为灯管的寿命要灯管坏了才知道,所以不可能通过点坏所有灯管来求得平均寿命。只能用抽样的方法进行推测,在统计技术中通常把刻划总体X的某些数字特征称为参数(譬如总体均值、总体标准差、总体中具有某性质的比例).而在实际问题中,总体的这些参数往往是未知的,因此要通过样本X1,X2,Xn构造统计量(相应为样本均值、样本标准差、样本比例)来估计或分析未知参数. 前面例中的第一类问题(问题中不含数字)称为参数估计问题,把第二类问题称为假设检验问题(问题中含数字). 在软件中往往将参数估
16、计的讨论包括在假设检验中。,假设检验的用途很广,在测量分析、控制图、抽样检验、正交试验、回归分析等一些统计方法中均明确或隐含地引用了假设检验. 在质量管理体系中应用假设检验的场合如下: 产品实现的策划(设计或确认新产品的参数) 新产品设计和开发(设计或确认新产品的参数) 采购(对原材料或半成品的质量进行检测) 生产和服务提供(对产品质量评测) 监视和测量 产品的改进(可以对产品改进前后作对比确认改进效果) 感官品评(很多品评方法都是假设检验),此外假设检验还直接用于: 检验总体的均值或标准差是否达到给定值,如目标值或标准; 当比较零件的不同批次(或新老工艺特征值差异)时,检验两个总体的均值是否
17、相同; 检验总体的缺陷率不超过给定值; 检验两个或多个总体的差异(对比合格品和不合格品、对比工艺改革前后的产品参数、对比操作员、对比不同产品、,或者检验实验室有无人员方法设备等的系统偏差); 检验样本数据是否从某个总体中随机抽取的; 检验总体的分布是否正态; 检验对样本的某一观察结果是否为异常值,即离群值,有效性可疑的极值.,参数估计与假设检验合称统计推断,是利用抽样样本对总体未知参数的信息推断,总体X(随机变量),X的二个重要参数 1.均值 2.方差2(反映波动) 3.总体中具有某特征的比例p (porpulation) 特点:1) 确定的数 2) 往往未知. 处理方法:抽样X1,X2,Xn
18、,利用参数估计和假设检验的方法进行统计推断. 1.样本均值 2.样本方差s2 3 .样本比例 特点:1) 可求 2) 波动(也是随机变量) 由问题的提法区分参数估计与假设检验: 问题提法中不带具体数字的为参数估计,带具体数字的为假设检验。 自动灌装机的灌装量的均值是多少?(双侧区间估计) 钢筋的强度至少是多少?(下方有界的单侧区间估计) 自动灌装机的灌装量的均值是0.5公斤吗?(双侧的假设检验问题) 两种测试方法有系统偏差吗?(1-2=0?双侧的假设检验问题) 新工艺的指标值明显优于老工艺吗(1-2d)?(二个总体均值差的单侧假设检验问题),第二节 参数估计问题和软件操作,2.1 由以下不同提
19、法和回答看参数估计分类 例. 对某校男生的身高h进行调查随机抽取84名男生进行测量(数据名p304),回答以下问题: 1.该校男生平均身高为多少? (h=? ) 2.该校男生平均身高不超过多少 ( h ?) 3.该校男生平均身高超过多少?( h ?) 对应答案 1.该校男生平均身高为169.78cm(用样本均值取值推断总体均值-点估计回答形式) 1.置信度95%的置信区间为168.64 170.92(用双侧区间估计形式回答) 2.置信度95%的上方有界的单侧置信区间(- 170.74 3.置信度95%的下方有界单侧置信区间168.83 +),2.2 参数区间估计理论,例:设某校男生的平均身高未
20、知,现随机抽取84个男生的身高来推断, 数据为1.72, 1.69, 1.69, 17.1, 1.66, 1.71, , 1.69 由数据可计算出数据样本容量n=84,样本均值 x=169.78,样本标准差s=5.27 现讨论问题:该校男生平均身高超过多少?即 ?(不含数字,是参数估计),参数估计:求未知参数的置信区间,给定置信水平1-=1-0.05=0.95,利用t-分布得如下区间,如何理解置信度?置信度即把握或可信度为95%的含意是指(假如总体均值已知从而可知判断对错)从总体中进行100次抽样分别求置信区间,则大概会推测对95次上下对或有5次上下推测错误。请看软件演示,参数估计按问题有下面
21、三种提法 =?(求双侧置信区间); ?(求置信上限) 参数估计按参数类别可有未知参数为均值和比例二种 参数估计按总体可分为单总体和双总体 在统计软件中通常将参数估计合并在假设检验中。 同一个样本X1,x2,xn求双侧置信区间时,当置信水平愈高则置信区间愈窄。,第三节 假设检验问题的各类案例与软件操作,3.1统计分析下结论方法 提出问题:结论A成立吗?(譬如问题为均值3吗?) 在统计技术中提出两个互相对立的假设,零假设H0与备择假设H1。 具体实施时往往将问题的对立面设成H0(上例中设成H0:3与H1: 3供选择) 假设检验 H0:结论3成立 H1:结论3成立 根据相应统计量计算出H0成立的概率
22、Pr, 当Pr0.05时,接受H0(即拒绝H1); 当0.01Pr0.05时,拒绝H0(即接收H1); 当Pr0.01时,高度拒绝H0 (即高度接收H1);,3.2 假设检验的问题与讨论步骤,关于总体未知参数(均值、方差、比例等)的含有数字的问题称为(参数的)假设检验问题 此类问题分三步讨论 1. 提出两个互相对立的假设(通常将欲探讨的问题设成备择假设H1) 零假设H0与备择假设H1 (前例身高数据,问题:168?则设H0:168,H1:168) 2.根据问题的类型确定不同的假设检验类型 (前例t-统计量 ) 3. 由软件给出Pr值下统计结论(本例统计量值t=3.099对应Pr=0.0013,
23、所以高度拒绝H0,认为身高1.68,3.3 假设检验问题的分类,可依据如下分类标准: 标准1.未知参数是均值?是比例p?还是标准差(或方差2)? 标准2.问题的提法:=?(双侧检验)、?(单侧检验) 标准3.单个总体还是双总体,如果是双总体则要区分是独立双总体还是成对双总体 以下通过几个例子说明实例的类型并结合软件操作,独立双总体与配对双总体的概念,说明独立总体X、Y与配对总体(X Y)区别的例: 1.中、美两国17周岁少年的身高比较 -独立双总体X、Y 数据为左表(m与n可以不等) 2.中国少年在16周岁与17周岁时身高的比较(右图数据) -配对双总体(X Y)=二维数组(x,y)x,y分别
24、为同一少年在16岁、17岁的身高 配对总体的例还有小猪催肥、 高血压病人服药前后血压控制等,讨论两组数据(独立双总体或配对双总体)的均值有无差异的方法,其操作步骤为 1.讨论问题1:1=2吗? 若12(不妨设12)则继续 2.讨论问题2:1-2d吗?(H0: 12)调整d的取值,使prob恰好d 见下例,纽迪希亚甜度模拟测评方案分析(含糖样品评分)问题1化疗前后评分有差异吗? 问题2若有差异,差多少?,结论”在=0.048意义下两组均值差异超过0.84是显著的”的理解,所谓”显著”即相对,关于比例的讨论,数据文件p420中美16岁女孩身高超过158cm(定义超过时wf=1否则为0.问 1).中
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 实验室 统计 技术 实践 分析
限制150内