01-药品数据分析.ppt
《01-药品数据分析.ppt》由会员分享,可在线阅读,更多相关《01-药品数据分析.ppt(131页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、基于GMP的药品数据分析苏勤 2010.112010.111道可道,非常道。-老 子2新版GMP实施箭在弦上,药企有备才能无患。3实施GMP的目的:要把人为差错降低在最低程度,防止一切药品污染,建立高质量的保证体系。GMP各项管理标准的实施是以数据支持为基础。4 自然界,从最小的贝壳到最大的漩涡星系,无不和宇宙中大部分美丽的东西都呈现出数学特性。古代最伟大的哲学家之一亚里斯多德曾说过:数学格外地展现了秩序、对称和极限,而这些也是美的极致形式。数字美丽的天性,也赋予了我们在制药生产中的管理艺术。5 善待数据 珍惜管理的无形资源 掌握现状,工序调节,工序管理,检查和评价,分析和改进。62005年1
2、2月FDA CGMP对中国培训中提到,不可接受或错误的数据和记录.不诚实数据的特征:不真实,编造,虚假,无系统。被认为是审查程序的材料之一的递呈书中重要数据缺失。应该让上报的数据却未被上报。不准确(例:第一次数据未达标,重测的数据达标准,但未经实验室调查,将此数据上报用于申请中。)7算:特征数比:统计值找:相关因素看:动态变化8 数据数据的处理的处理 -数值的修约四舍六入五考虑,五后非零前进一,五后为零看奇偶,五前奇数则进一,五前偶数应舍去,不论舍去多少位,必须一次修约完。9 数据的处理 -筛选方法 法 一一 .按美国EJ鲍尔推荐的方法进行处理。步骤如下:1.计算这群检测值的平均值 2.计算极
3、差R 3.计算可疑值Xi与平均值之差的绝对值,再用极差R除,得出ti,与规定附表的临界值比较,若ti比表上的t值大,则应弃去此可疑值。10注:用公式注:用公式t=|X-|/Rt=|X-|/R计算t t,如计算值超过表上的值时,则所调查的值是无效的。此概率约为0.950.95。例例1 1某分析者对一样品检测,得(1 1 1 1)93.393.393.393.3,(2 2 2 2)93.393.393.393.3,(,(,(,(3 3 3 3)93.493.493.493.4,(,(,(,(4 4 4 4)93.493.493.493.4,(,(,(,(5 5 5 5)93.393.393.393
4、.3,(,(,(,(6 6 6 6)94.094.094.094.0。问:第六个结果有效吗?n3456789t1.531.050.860.760.690.640.60n10111213141520t0.580.560.540.520.510.500.46附表如下:抛弃无效测量的临界值临界值11 解:1.计算方法六个结果的平均值93.45 2.计算极差R94.093.30.7 3.计算可疑值与平均值之差的绝 对值再用极差除:ti|X|R (94.0-93.45)0.70.79 4.与临界值t=0.76(n6)比较 ti0.79 t=0.76 94.0是一个离群数据,应弃去.12法二:G-检验法(
5、格鲁布斯法)检验步骤:1.算出包括可疑值在内的平均值;2.计算可疑值与平均值之差;3.算出包括可疑值在内的标准偏差;4.用标准偏差除可疑值与平均值之差,得G值;5.查G的临界值表,若计算的G值大于查到的值,就可把可疑值舍弃.13 数据的处理 -数据特征值 位置特征量:子样平均值 子样中位数 差异特征量:极差 R=XmaxmaxXmin 标准差 变异系数 (相对标准差(相对标准差RSDRSD)14 均值的置信区间估计 (有限次实验结果处理)在实常工作中,常常对某些参数进行估算.但是,由于某种因素的影响,而难以给出精确的估计,这样就使估计值带一定的偏差,这些都用区间来估计真实数.通常在一定的精度要
6、求下,对一个总体的某个参数估计出一个取值范围,又称置信区间,区间的上限和下限叫置信界限.15 质量管理的控制限在质量控制中出现的报警限和行动报警限,如:对工艺用水与洁净区的环境在控制中根据正常工序情况,制定出可行的指标,即报警限2S,超出此界限意味着发出了报警。行动限:3S超出此界限时,质量管理上要立即采取行动。16 方法1-过程能力指数(Cp值)过程能力(B)含义:在一定时间内工序处于稳定状态下的实际加工能力。测定:B=6S 1.是工序的一种可以量度的特性;2.反映与公差无关;3.在正态分布情况下,6范围内的概率 为99.73%。17过程能力指数过程能力指数过程能力指数过程能力指数C CP
7、P 用来表示过程能力满足规范的程度,以便分析、判断过程用来表示过程能力满足规范的程度,以便分析、判断过程能力状态能力状态.2过程能力过程能力过程能力过程能力:指指过程能够生产出合格品的能力。是以过程能够生产出合格品的能力。是以过程能力指数能力指数C CP P值的大小来评价或判断的。企业为保证产品质量稳定,对值的大小来评价或判断的。企业为保证产品质量稳定,对其生产工序进行考察,以过程能力指数来评价。其生产工序进行考察,以过程能力指数来评价。1181920过程能力判断准则 工序能力状态工序能力状态工序能力指数工序能力指数严重不足严重不足C CP P(C(CPKPK、C CPUPU、C CPLPL)
8、0.670.67不足不足0.67C0.67CP P(C(CPKPK、C CPUPU、C CPLPL)1 1正常正常1C1CP P(C(CPKPK、C CPUPU、C CPLPL)1.331.33理想理想1.33C1.33CP P(C(CPKPK、C CPUPU、C CPLPL)1.67)1.67过剩过剩C CP P(C(CPKPK、C CPUPU、C CPLPL)1.671.67备注:收集观测值个数备注:收集观测值个数n30 n30 21过程能力指数对应的不合格品率 C CP P不合格品率不合格品率C CP P不合格品率不合格品率1.671.676/10006/1000万万1.11.11/10
9、001/10001.51.57/1007/100万万1 13/10003/10001.331.336/106/10万万0.670.674.55/1004.55/1001.21.23/13/1万万0.330.3331.75/10031.75/10022 方法 2-正交试验设计 正交设计是用于安排多因素试验的一种科学方法.在多因素的情况下,选择最佳条件的比较方便方法.它适用于多因素的工艺参数的优化,我们将其应用于研究工作、生产试验的设计,极大地提高了试验的可靠性和效益。常用正交表L4(23),L8(27),L16(215),L9(34),L8(41 24)23 原理:利用数理统计的观点,运用正交性
10、原理,从大量的试验点中,挑选适量的具有代表性典型性的试验点,用正交表来合理安排试验的一种方法.用途:正交试验就是利用正交表的特点进行研究试验,找出最佳工艺条件为生产奠定基础.24正交试验设计步骤:1.1.明确试验目的,确定考核指标,2.根据试验目的,挑选出试验的因素,3.选定每个因素变化的水平 4.选择最合适的L表 5.根据因素和水平设计出试验方案表 6.进行试验并记录好数据 7.设计计算表并计算、分析 8.找到最佳搭配25常用正交表:26 27 28 方法 3-假设检验 基本思想 根据是小概率原理,所谓小概率原理:即“在一次试验中,概率很小的可件认为是实际上不可能发生的事件,而概率接近于1的
11、事件认为是实际上必然发生的事件。”我们可以根据所获样本,运用统计分析方法,对总体X的某种假设H0 0作出接受或拒绝的判断。29 基本步骤1.建立假设 H0:2.选择检验统计量,给出拒绝的形式3.给出显著性水平4.由样本值计算出统计量的值5.根据统计量的不同分布查相应的分布表6.作出判断 当则拒绝H0则接受H0 基本类型 1.检验母体平均数 2.检验二个母体平均数相等 3.检验母体方差 4.检验二个母体方差相等 30 假设检验(显著性检定)目的 1.检定产品质量与标准比较,有否差异 2.检定产品质量间的差异 3.评估质量控制中各因素间的差异 4.评估生产过程中各工序间的差异 差异的表示:均值 标
12、准差31 最常用的假设检验应用(一)确定总体的均值与质量标准值的差异性 1.U检验已知,使用u统计量 2.t检验未知,用s估计,使用t统计量 断判各查u,t检验临界值u,t 1.当u u时,则HO成立 2.当tt时,则HO成立 32最常用的假设检验应用(二)确定两个样本间的均值差异性 t检验方差未知,但相等 H0 ;1=2 计算 查t检验临界值H,当t t时,则HO成立。33最常用的假设检验(三)(三)确定2个样本间的标准差的差异性 F检验未知:计算 按F(n1 -1,n2 -1,)查F检验临界值H,当F F时,则HO成立。34 最常用的假设检验(四)(四)确定多个样本间的标准差的差异性 哈特
13、利检验 假设 HO:m3的正态总体,独立取容量为K1=K2=Ki Ki3,计算 自由度df=K-1 查哈特利检验临界值H,当H H时,则HO成立。35 假设检验在制药生产企业管理中的应用1.产品质量与标准值的比较2.实验室间数据的比对3.新老工艺比较4.分析工作的重复比较5.检验工专业水平比较6.设备或仪器使用性能比较7.检验用标准品挨批号的对照8.验证中的数据处理9.各种控制的区间予报36 方法4 -线性回归分析 研究变量间的定量关系式时称为回归分析.直线回归:通过试验可以测定一个变数对另一个变数的影响,在数学上可写成Yf(X),如果二者的关系是直线关系,则此式就呈YabX,这时叫直线回归.
14、37 回归分析的主要内容:从一组数据出发确定这些变量之间的定量关系式对这些定量关系式进行统计检验从影响着某一个量的许多变量中,判断哪些量的影响是显著的,哪些是不显著的利用所求得的关系式对生产过程进行予报和控制.判断两个变量有无相关关系的方法:简易法相关系数法 38 回归分析在制药企业中的应用 1.找出影响产品质量的主要因素 2.药品质量的趋势分析 3.对某个质量特性进行分析 4.寻找工艺控制条件 5.确立标准比色液的 工作曲线 6.确定药品的有效期39 回归分析法找出影响产品质量的主因每种产品都有几个质量特性值,它们间是互相影响并互相制约的、找出影响产品质量的主因,就可以抓住主要矛盾,在生产过
15、程中加以控制,使产品质量保持稳定。运用电子计算机为工具,以多元线性回归法、求出因变量Y与自变量Xi(i=1、2n)的方程Y=b0+b1x1+b2x2+bnxn,用方差分析检验回归方程,当FF时,方程效果显著,求出F1、F2Fn比较,按F值大小,即可找出影响Y的因素顺序。40帕累托分析:关键的少数;次要的多数方法5-排列图 通常占总频数 80%以 上的 项目是主要问题,占总频数 10%以上的项目是次要 问 题,余下的占总 频 数 10%左右的项目是更次要的一般问题。41排列图 的作图步骤1.收集数据.2.选题.3.设计数据记录表.4.填表并计算,按数量从大到小顺序填入表中,其他项的数据由许多数据
16、很小的项目合并在一起,将其列在最后.5.画两根纵轴和一根横轴,左纵轴标上频数的刻度,最大刻度主总频数;右纵轴,标上频率的刻度,最大5.画两根纵轴和一根横轴,左纵轴标上频数的刻度,最大刻度主总频数;右纵轴,标上频率的刻度,最大刻度为100%.左右刻度高度相等.6.在横轴上按频数大小画上矩形,其高代表各项目频数的大小.7.在每个直方柱右侧上方,标上累计值,描点,用实线连接,成巴雷特曲线.8.在图上记全有关事项.42排列图 在制药生产企业中的应用1.寻找产品存在的质量问题2.寻找影响产品质量问题的主因3.进行用户信息分析4.进行产品市场分析5.进行产品成本分析6.不合格品分析7.生产现场存在问题分析
17、8.各类事故43 方法6 6-控制图 控制图是对过程质量特性值的数据进行测定、记录、评估,从而监察过程是否处于控制状态的一种用统计方法设计的图.作用:对生产过程进行监控 发现异常,及时告警控制图的种类:分析用控制图 控制用控制图 其结构:中心线 CL 上控制线 UCL 3 下控制线 LCL 344 控制图 的原理质量由人机料法环五个方面,它又可分成偶然因素与异常因素两类。偶因是始终存在的,偶波是不可避免的,但对质量波动影响微小,异波对质量波动的影响大,采取措施不难消除,在生产过程中造成异波的异因是需要监控的对象,一旦发生,应尽快 采取措施加以消除,当生产过程中只存在偶波时,产品质量将形成典型分
18、布,根据典型分布是否偏离就能判断异波即异因是否发生,而典型分布的偏离可由控制图检出.控制图的实质是区分偶因与异因,控制界限是区分偶波与异波的科学界限。45 控制图的异常判定准则 点出界 界内点排列不随机 一点落在一点落在A A区外区外 连续9点落在中心线同一侧 连续6点递增或递减 连续连续1414点中相邻点上下交替点中相邻点上下交替 连续连续3 3点中有点中有2 2点落在中心线同一侧的点落在中心线同一侧的B B区以区以外外 连续连续5 5点中有点中有4 4点落在中心线同一侧的点落在中心线同一侧的C C区以区以外外 连续连续1818点在中心线两侧点在中心线两侧,但无一在但无一在C C区中区中.4
19、6数据分析在企业内控标准 -制订中的应用 C CPP值值值值数据特数据特征值征值可运用的数学模型控制图数据的数据的筛选筛选47 用控制图的思路 制订企业内控标准 不论原辅料还是中间体及产品的质量的企业内控标准,从所使用的原辅料质量特性的检测数据、中间体质量特性的检测数据、生产的产品质量特性的检测数据,取连续20个数,弃去异常点,作控制图,计算平均值,标准差S与控制线UCL、CL、LCL的值,即可确定此标准质量特性值的范围为 3S。48控制图呈现生产的状态时间或组号3倍标准偏差3倍标准偏差质量特性值UCLCLLCLTUTL49成品内控标准制订依据 1.1.法 定 标 准 2.2.用 户 需 求
20、3.3.同行业 先进 水平 4.4.生产 过程 能力50满足产品质量要求适合生产需求成本低货源足原辅料原材料进货标准制订原则51 制订生产过程的中间体标准 在成熟的工艺条件下,收集近20个特性观测值,统计其平均值、极差与标准偏差与产品法定标准规定对特性值比较,以极差及标准偏差来考虑工艺波动范围,综合比较来确定其质量特性值。例例2 2制定抗生素BL溶配岗位中间体(乙醇溶液中抗生素B的效价)控制标准。收集某月正常生产的连续20批数据并进行数据筛选如下:52序号序号检测值检测值序号序号检测值检测值1166352111623992166944121694273159847131612114166623
21、14164746516709815168666616596316160712716032017166487816112318170923916165219172254101667652017260453 对序号3,18,19,20的数筛选结果舍去X19与X20(略)计算:平均值 =164848 标准偏差S=3388 根据控制图原理计算 CL=164848 UCL=+3S=175011 LCL=-3S=154684 因此,此工艺点的内控标准初步定为154684175011,考虑到测定方法的误差,故将乙醇溶液中抗生素B的效价的内控标准定为155000175000。54 制订成品的企业内控标准 例例
22、3 3 USP-29规定抗生素P中抗生素G含量(HPLC法)为51.0%-59.6%,现制定此产品的质量特性值的企业内控标准。收集某年正常生产的连续12个月的数据(平均值)并进行筛选如下:序号序号检测值检测值序号序号检测值检测值155.855.8756.256.2255.955.9856.256.2356.156.1956.356.3456.456.41056.956.9556.156.11155.255.2655.455.41255.655.655 时,是有56 计算 Cpk=2.4 1.67,工序能力过高。在保证产品质量的前提下,为减少生产成本,将生产过程中的工序能力适当放宽,将计算出的控
23、制范围进行调整为54.058.0%,作为此产品抗生素G含量的企业内控标准。57数据分析数据分析在确认与验证中的应用在确认与验证中的应用数字的数字的数字的特性值特性值特性值区间估计区间估计区间估计假设假设假设检验检验检验 可运用的数学模型散点图58 FDA分析方法验证指南 要求:根据实际使用各种确 认药典分析方法的适用性。(21CFR211.194(a)(2)(a)(2)指出:需要对分析方法验证资料进行统计分析(如:线性回归分析,相对标准偏差)以说明方法的正确性。在开始分析方法验证之前,应当就要确定用于验证资料分析用的统计方法。59过程性能指数过程性能指数用於用於工艺用水验证例例4 4纯化水验证
24、中微生物总数数据表项目项目最大值最大值最小值最小值cpk1(CFU/ml)8.200.002.371.7514.822(CFU/ml)7.400.002.641.7814.993(CFU/ml)7.400.002.381.5616.564(CFU/ml)9.000.002.451.7914.485(CFU/ml)9.200.302.752.1711.886(CFU/ml)7.800.402.341.7315.007(CFU/ml)9.000.202.641.7914.418(CFU/ml)11.500.002.572.0112.839(CFU/ml)9.600.302.752.2711.336
25、0新版GMP草案230条要求,符合下列情况之的,应对检验方法进行验证:(1)采用新的检验方法;(2)检验方法需变更的;(3)采用中华人民共和国药典及其它法定标准 未收载信息的检验方法;(4)法规规定的其它需要验证的检验方法。对不需要进行验证的检验方法,企业应对检验方法进行确认,以确保检验数据准确、可靠。61假设检验的联用 在两个总体均服从正态分布前提下,先用夏皮罗威尔克方法检验正态性,再用F检验,看两个正态总体方差是否齐性,在方差无显著性差异时,最后用T检验对两个总体均值进行比较,此法联用可广泛用于工艺改变前后产品质量的变化,验证二个检验方法对同一产品检验的特性值是否有差异。62假设检验确认二
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 01 药品 数据 分析
限制150内