非劣效设计临床试验指导原则.docx
非劣效设计临床试验指导原则(征求意见稿)国家药品监督管理局药品审评中心2019 年9月目 录一、概述1二、应用条件1(一)阳性对照药疗效的既往证据2(二)恒定假设2(三)良好的试验质量3三、设计要点3(一)统计假设3(二)阳性对照药4(三)分析人群4四、非劣效界值的确定方法与统计推断4(一)固定界值法5(二)综合法7五、其它考虑7(一)相对于疗效损失的潜在获益7(二)非劣效与优效检验的转换8(三)三臂非劣效设计8(四)与监管机构的沟通9附录1:中英文词汇对照10附录2:主要公式11(一)固定界值法11(二)综合法11附录3:应用示例12(一)固定界值法12(二)综合法133非劣效设计临床试验指导原则一、概述当确证某个药物疗效时,优效试验(试验药与安慰剂、试验药的较低剂量或阳性药相比较的优效性)一般是理想选择。当优效试验不适用时,如使用安慰剂对照不符合伦理要求,可考虑采用非劣效试验。非劣效试验是为了确证试验药临床疗效,即使低于阳性对照药,但其差异也是在临床可接受范围之内。本指导原则旨在阐述非劣效试验的应用条件、设计要点、非劣效界值、统计推断以及其它监管考虑等方面内容,以指导临床试验各相关方能够正确地认识、实施和评价非劣效试验。本指导原则主要适用于支持药物和生物制品注册上市的确证性临床试验,也可供探索性临床试验参考使用。二、应用条件非劣效试验通常以阳性药作为对照,或辅之以安慰剂对照(如三臂非劣效试验)。非劣效试验应确保具有足够的检定敏感性,即具有区分阳性对照药疗效为有效、无效或低效的能力。关于检定敏感性的详细阐述可参考ICH E10临床试验中对照组的选择和相关问题。要确保非劣效试验具有检定敏感性,应着重考虑以下三个方面:(一)阳性对照药疗效的既往证据通常阳性对照药相对于安慰剂的疗效差异来源于已知的具有良好设计和实施的临床试验结果。根据这些既往试验结果,在充分考虑不同试验结果变异程度的基础上,可以估计出较为可靠的阳性对照药相对于安慰剂的疗效差异,该疗效差异是非劣效试验中用于确定非劣效界值的关键参数。对于一些适应症,如某些症状性治疗、精神类适应症等,在既往试验中难以获得阳性对照药相对于安慰剂的稳健疗效差异(例如,即使试验设计良好,有时也难以获得阳性对照药疗效优于安慰剂的稳定性结论),若使用该阳性对照药进行非劣效试验,则很难确证试验药的疗效。因此,对于这类适应症,谨慎使用非劣效试验,或者在伦理许可的前提下采用包含安慰剂的三臂非劣效试验。(二)恒定假设对阳性对照药相对于安慰剂的疗效差异估计的证据多源于既往临床试验,应尽可能确保本次非劣效试验中阳性对照药的疗效与既往临床试验保持一致,即满足恒定假设。恒定假设会受到很多因素的影响,诸如当时的受试人群、合并治疗方法、疗效指标的定义与判定、阳性对照药的剂量、耐药性以及统计分析方法等。如果随着年代迁移,所治疗疾病的定义、诊断标准及其治疗方法等已经发生变化,则会影响恒定假设的成立,进而导致非劣效试验的检定敏感性不足,难以解释试验结果。因此,当恒定假设难以验证时,谨慎使用非劣效试验。(三)良好的试验质量临床试验质量是非劣效试验具有足够的检定敏感性的基础。各种试验质量缺陷,包括违背方案入组、依从性差、合用影响疗效评价的药物、测量偏倚、分组错误、受试者脱落率高等,都有可能导致试验药与阳性对照药的疗效差异估计出现偏倚。这些试验质量缺陷在优效试验中通常不利于优效结论成立,但在非劣效试验中却可能有利于非劣效结论成立。因此,在非劣效试验的设计和实施阶段提高试验质量尤为重要。三、设计要点设计临床试验时,要考虑试验目标、评价指标、统计假设、对照、样本量、分析人群等要点。对于其它指导原则(如ICH发布的相关指导原则和我国发布的药物临床试验的生物统计学指导原则)涉及到的临床试验设计通用内容,本指导原则不再赘述。本指导原则着重阐述非劣效试验特有的设计要点,包括统计假设(其中非劣效界值在第四章中阐述)、阳性对照药和分析人群。(一)统计假设对于不同度量和指标类型,非劣效试验的原假设(H0)和备择假设(H1)的表述有所不同,见表1。其中,为非劣效界值,绝对度量指标包括均值差和率差等,相对度量指标包括率比、风险比、比值比等,高优指标是其值越大表明疗效越好的指标,低优指标是其值越小表明疗效越好的指标。表1 非劣效试验的原假设(H0)和备择假设(H1)*指标类型高优指标低优指标绝对度量H0:T - C -(>0)H1:T - C >-(>0)H0:T - C (>0)H1:T - C <(>0)相对度量H0:T / C 1(>1)H1:T / C >1(>1)H0:T / C (>1)H1:T / C <(>1)*T代表试验组效应,C代表阳性对照组效应。(二)阳性对照药非劣效试验所选择的阳性对照药必须具有疗效优于安慰剂的明确和充分的证据,包括阳性对照药优于安慰剂的可靠的疗效差异估计。应选择当前标准疗法或者最佳疗法的药物作为阳性对照药。如果所选的阳性对照药的疗效证据不充分,那么将其用于评价其它新药疗效会存在巨大风险。(三)分析人群非劣效试验通常应基于意向性治疗原则进行统计分析。基于意向性治疗原则的分析在非劣效试验中不一定保守,因此,对基于该原则的数据集进行分析得出的结论通常应与基于符合方案集分析得出的结论相互支持。当两者结论不一致时,需要进一步深入分析并合理解释导致不一致的原因。四、非劣效界值的确定方法与统计推断非劣效界值是指试验药与阳性对照药相比在临床上可接受的最大疗效损失。非劣效界值不应大于阳性对照药相对于安慰剂的临床获益,以确保非劣效试验具有足够的检定敏感性。非劣效界值的确定通常应根据统计分析和临床判断综合考虑,并在试验方案中详细说明非劣效界值的确定过程。确定非劣效界值的方法主要包括固定界值法和综合法,一般情况下固定界值法更易描述试验药物的疗效。(一)固定界值法阳性对照药与安慰剂的疗效差异用M1表示,其估计通常依赖于既往阳性对照药与安慰剂的优效试验的疗效差异的meta分析,通过分析得到疗效差异的单侧97.5%(或双侧95%)置信区间。M1的确定方法详见图1和图2。如果对既往证据的变异性和恒定假设存在顾虑,可采用“折扣”策略确定M1,即将M1通过一定幅度的“折扣”(如减半)转换为更加保守的M1。非劣效界值M2(统计假设中用符号D表示)被定义为临床上可接受的M1的最大损失。设f(0<f<1)为至少保留M1的比例,则最大可损失比例为1f。M2的确定公式详见附录2,M1和M2的相对关系参见图1和图2。确定f则依赖于临床判断。当阳性对照药与安慰剂的疗效差异很大时,或当终点指标为不可逆的发病率或死亡率时,对f的选择应该慎重考虑。高优指标0M1为既往阳性对照药与安慰剂的优效试验中CP的95% CI下限M1M2试验药与阳性对照药的非劣效试验中TC的95% CITC的95% CI非劣效界值低优指标M1为既往阳性对照药与安慰剂的优效试验中CP的95% CI上限的绝对值0M1试验药与阳性对照药的非劣效试验中TC的95% CI非劣效界值M2注:T指试验药,C指阳性对照药,P指安慰剂,CI指置信区间图1 绝对度量指标的非劣效界值确定过程图示高优指标1M1为既往阳性对照药与安慰剂的优效试验中C / P的95% CI下限1/M11/M2试验药与阳性对照药的非劣效试验中T / C的95% CI非劣效界值低优指标试验药与阳性对照药的非劣效试验中T / C的95% CI1M1为既往阳性对照药与安慰剂的优效试验中C / P的95% CI上限的倒数M1M2非劣效界值注:T指试验药,C指阳性对照药,P指安慰剂,CI指置信区间图2 相对度量指标的非劣效界值确定过程图示若检验水准()设为单侧0.025(或双侧0.05),对于高优疗效评价指标,若为绝对度量值,试验药相对于阳性对照药的疗效差异的单侧97.5%(或双侧95%)置信区间的下限如果大于负的非劣效界值,若为相对度量值,下限大于非劣效界值的倒数,则可推断试验的非劣效结论成立;对于低优疗效评价指标,无论是绝对度量值还是相对度量值,如果试验药相对于阳性对照药的疗效差异的单侧97.5%(或双侧95%)置信区间的上限小于非劣效界值,则可推断试验的非劣效结论成立。(二)综合法综合法不要求指定特定的界值(M1和M2),而是将既往阳性对照药与安慰剂的优效试验和当前试验药与阳性对照药的非劣效试验的数据进行合并或综合,构建一个检验统计量Z来表达试验药是否保留了阳性对照药疗效的一部分。检验统计量Z的计算公式详见附录2。当=0.05时,Z2=1.96。对于高优疗效评价指标,若Z大于Z2,对于低优疗效评价指标,若Z小于-Z2,则可推断试验药非劣效于阳性对照药。只要恒定假设成立,使用综合法相对于使用固定界值法可以提高研究效率(减少样本量或样本量不变而获得更大的检验效能);综合法在开展非劣效试验之前不需要预先确定M1,因此也无需基于M1确定M2,但需要预先确定f。五、其它考虑(一)相对于疗效损失的潜在获益非劣效试验允许试验药损失一定疗效,但相应地也要考虑对疗效损失进行必要补偿,即要求试验药能够提供其它方面的潜在获益。与阳性对照药相比,其它方面的潜在获益包括,疗程更短、使用更方便、不良反应更少、依从性更好等。只有试验药能够提供一项或多项其它方面的潜在获益,使用非劣效试验才是有意义的。(二)非劣效与优效检验的转换在非劣效试验方案中可以预先定义非劣效与优效检验的转换,即先进行非劣效检验,如果非劣效结论成立,可进一步进行优效检验,如果优效结论成立,则研究结论为优效;如果优效结论不成立,则研究结论为非劣效。当非劣效结论不成立时,不再进行优效检验,研究结论不支持非劣效。上述过程无需多重性调整。需特别注意,非劣效与优效检验的转换必须事先在临床试验方案中明确定义。如果非劣效试验方案中未事先定义优效检验,尽管在非劣效结论成立后通过事后分析还得出了优效结论,通常也只认可非劣效结论,而不认可优效结论。如果在采用阳性对照药的优效试验方案中未事先定义非劣效检验,当优效结论不成立转而采用事后的非劣效检验,即使得出非劣效结论,也是不被认可的。(三)三臂非劣效设计为了考察试验药是否非劣效于阳性对照药,还可以考虑包含试验组、阳性对照组和安慰剂组的三臂非劣效设计,前提条件是符合伦理。三臂非劣效设计在检验试验药非劣效于阳性对照药的同时,还可以考察阳性对照药是否优效于安慰剂,从而在临床试验内部建立确切的检定敏感性。因此,在伦理许可的情况下,三臂非劣效设计是确证试验药非劣效于阳性对照药的较理想的试验设计。(四)与监管机构的沟通当申请人计划采用非劣效试验时,鼓励与监管机构及时沟通。沟通的问题包括但不限于阳性对照药的选择、非劣效界值的确定、非劣效与优效检验的转换、替代设计的考虑等问题。进行沟通前,申请人应该向监管机构预先提供试验方案、统计分析计划等相关资料。例如,在沟通非劣效界值时,申请人应预先提供确定非劣效界值的详细过程,包括所用到的文献及meta分析结果等。附录1:中英文词汇对照中文英文检定敏感性assay sensitivity非劣效界值non-inferiority margin恒定假设constancy assumption固定界值法fixed margin method综合法synthesis method人用药品注册技术要求国际协调会议the International Conference on Harmonisation of Technical Requirements for Registration of Pharmaceuticals for Human Use, ICH意向性治疗intention-to-treat, ITT符合方案集per protocol set, PPS附录2:主要公式(一)固定界值法若M1为绝对度量,则M2=1-fM1若M1为相对度量,则M2=e1-flnM1(二)综合法对于绝对度量的疗效评价,Z=T-Cn+f(Ch-P)SET-Cn2+f2SECh-P2对于相对度量的疗效评价,Z=lnT/Cn+fln(Ch/P)SElnT/Cn2+f2SEln(Ch/P)2式中,Ch和P分别为既往优效试验中阳性对照药和安慰剂的效应;T和Cn分别是当前非劣效试验中试验药和阳性对照药的效应;f为根据预先确定的Ch相对于P的疗效差异的所保留的比例;SE为标准误,既往优效试验的SE需要根据阳性对照药相对于安慰剂的疗效差异的meta分析进行估计。附录3:应用示例(一)固定界值法以一项用于评估新型抗凝血剂希美加群与阳性对照药华法林的非劣效试验为例。华法林是一种高效的口服活性抗凝剂,已被批准用于治疗具有血栓栓塞并发症风险的非瓣膜性心房颤动患者。1989年至1993年发表了6项华法林用于治疗非瓣膜性心房颤动患者的安慰剂对照试验,主要试验结果汇总于附表1,为评估希美加群与华法林的非劣效试验确定非劣效界值提供基础。附表1 华法林用于治疗非瓣膜性心房颤动的安慰剂对照试验试验概要事件/人年华法林与安慰剂的风险比(95% CI)华法林安慰剂AFASAK开放,1.2年随访9/413 =2.18%21/398 = 5.28%0.41(0.19, 0.89)BAATAF开放,2.2年随访3/487 = 0.62%13/435 = 2.99%0.21(0.06, 0.72)EAFT开放,2.3年随访21/507 = 4.14%54/405 = 13.3%0.31(0.19, 0.51)CAFA双盲,1.3年随访7/237 = 2.95%11/241 = 4.56%0.65(0.26, 1.64)SPAF I开放,1.3年随访8/260 = 3.08%20/244 = 8.20%0.38(0.17, 0.84)SPINAF双盲,1.7年随访9/489 = 1.84%24/483 = 4.97%0.37(0.17, 0.79)将上述六6项试验将结果进行meta分析进行合并,华法林相对于安慰剂的风险比(HR)点估计值为0.361,95%置信区间(CI)为(0.248,0.527)。由于该主要评价指标为低优指标,因此,M1为95% CI上限的倒数,即1/0.527=1.90。本项非劣效试验的主要目的是证明希美加群保留了华法林相当大一部分疗效,因此f至少为50%,则代表在对数风险尺度上最大可接受的非劣效水平为(1-50%)lnM1,根据公式进行指数变换计算出M2为1.38。在希美加群与华法林的非劣效试验中,考虑到试验的主要评价指标为低优指标,希美加群相对于华法林的HR为1.39,95% CI为(0.91,2.12),其上限大于M2。因此,根据该试验结果尚不能认为希美加群降低风险的作用非劣效于华法林。(二)综合法继续以上述试验为例。综合法比较了当前非劣效试验中希美加群相对于既往华法林与安慰剂的优效试验中安慰剂的疗效,这是一种不基于在当前试验中设置安慰剂组的间接比较。综合法将既往华法林与安慰剂的优效试验的数据与当前希美加群与华法林的非劣效试验的数据合并进行假设检验,证明在非劣效试验中保留了一定比例的华法林相对于安慰剂的疗效。综合法有别于固定界值法的关键点在于不需要在开展当前非劣效试验之前预先确定华法林相对于安慰剂的疗效(M1)。虽然在当前非劣效试验中并不对华法林与安慰剂进行比较,但其前提假设是,当前非劣效试验中华法林与安慰剂之间的疗效差异(如果有的话)与既往华法林与安慰剂的优效试验所观察到的疗效差异相同。在此基础上,综合法在统计上检验原假设,即希美加群与华法林相比,其劣效性低于华法林与安慰剂相比风险降低的一半(即预设50%)。这是固定界值法不能直接解决的问题,因为在固定界值法中,安慰剂仅存在于既往试验中,而不存在于当前非劣效试验中。在对数(log)风险尺度上进行检验,其原假设H0为:ln希美加群与华法林的HR-0.5ln华法林与安慰剂的HR在非劣效试验中,希美加群与华法林的HR为1.39,95% CI为(0.91,2.12)。从便于解释的角度,以固定界值法中meta分析结果为参考,华法林与安慰剂的HR为0.361,95% CI为(0.248,0.527)。基于此,希美加群相对于华法林的HR点估计值在对数尺度上为0.329,即ln1.39,标准误为0.216,而华法林相对于安慰剂的HR点估计值在相应的对数尺度上为1.02,即ln0.361,标准误为0.154。根据综合法的统计检验公式有:Z=0.329+0.5-1.020.2162+0.50.1542=-0.789其Z大于1.96,据此推断该试验结果尚不能认为希美加群非劣于华法林。15