统计相关知识2.pptx
11.构成指标构成指标 通过频率分布描述数据的分布特征通过频率分布描述数据的分布特征,表示各表示各 构成部分占总数的比重。构成部分占总数的比重。第1页/共88页22.频率指标频率指标 表示某事件发生的频率大小。表示某事件发生的频率大小。k 是比例基数,通常为是比例基数,通常为100%,也可取,也可取1000,万,万/万,万,10万万/10万。万。第2页/共88页3例1 某年研究者对某个城市的40岁以上的1468名中老年人进行了老年性白内障检查,计算各年龄组的患者年龄构成和检出率。表1 老年性白内障的年龄分布及检出率 年龄组 受检人数 白内障例数 构成比%检出率%(1)(2)(3)(4)(5)40 560 68 15.18 12.14 50 441 129 28.78 29.25 60 296 135 30.13 45.61 70 149 97 21.65 65.10 =80 22 19 4.24 86.36 合计 1468 448 100.00 30.53第3页/共88页4 表3 常用的疾病统计指标指标 分子 分母发病率 时期内新发生的 年平均人口数 1年 某病病例数患病率*时点现患某病人数 该时点调查人数某病死亡率 年内某病死亡人数 年平均人口数 1年某病病死率 年内某病死亡人数 同年患该病人数治愈率 治愈人数 接受治疗人数生存率 活满特定时期的 起初存活的人数 人数*类似的指标有:检出率、感染率、带菌率、转阴率第4页/共88页5发病率与患病率的关系:发病率与患病率的关系:患病率等于发病率乘以疾病的平均持续时间患病率等于发病率乘以疾病的平均持续时间 患病率患病率 发病率发病率 平均病程平均病程例例3.某社区带状疱疹的年发病率某社区带状疱疹的年发病率=2%(2000/10万人口万人口)若该病的持续时间是若该病的持续时间是1个月个月,则则 患病率患病率=年发病率年发病率 持续期持续期(以年计算以年计算)=2%1/12=0.17%,一种新的治疗方法将持续期缩短一半为一种新的治疗方法将持续期缩短一半为2周周,问问 1.发病率和患病率各有何变化发病率和患病率各有何变化?2.发病率和患病率可作为什么效果的评价指标发病率和患病率可作为什么效果的评价指标?第5页/共88页61.发病率没有变化,患病率=年发病率 持续期(以年计算)=2%1/24=0.085%.2.预防效果,治疗效果第6页/共88页7第7页/共88页8第8页/共88页9逾9成都市人存在健康问题 10个年轻人中2个是脂肪肝 慈铭健康体检连锁机构发布的常见疾病预防课题调查显示,9成以上的都市人存在不同程度的健康问题。调查以65万余名北京、上海的慈铭体检客户数据为主体样本。分析发现,93.1%的受检者存在各种身心健康问题,仅有6.9%的受检者未见异常,健康人群占总人数比例较去年下降了1.5%。其中,上海、金华居民健康人群总人数的比例为8.3%和9.2%,分别比北京市高1.4%和2.3%。数据显示,6大疾患在都市人群中发病率较高。其中脂肪肝占25.1%,血脂增高占22%,高血压占12.2%,谷丙转氨酶增高占9.9%。28岁以下人群脂肪肝患病上升趋势最明显,患病率达到20%,比去年上升了9%。这也就是说,10个年轻人中就有2个患有脂肪肝。第9页/共88页10三、疗效评价指标(一)有效率(治愈率、生存率)例4.某项RCT研究用两种药物治疗慢性咽炎,比较 其疗效.表4 两种药物治疗慢性咽炎的疗效 疗效 药物 例数 有效 无效 有效率(%)兰芩口服液 45 41 4 91.1 银黄口服液 35 24 11 68.6 合计 80 65 15 81.3 2=6.565 P=0.01 有统计学意义,临床意义的治疗效果如何评价?第10页/共88页11(二)治疗与预后结局的关联例5.一项关于钙拮抗剂治疗高血压是否可能增加 肿瘤危险的队列研究(模拟数据)表5 钙拮抗剂治疗高血压的结局 肿瘤 治疗 发生 不发生 合计 钙拮抗剂 20a 980 b a+b 非钙拮抗剂 2c 988 d c+d 合计 a+c b+d a+b+c+d 相对危险度RR及95%可信区间第11页/共88页12例6.关于治疗与预后结局关联的病例对照研究 表6 某项治疗的病例对照研究 某种治疗 接受过 未接受 合计%病例组 a b a+b p1 对照组 c d c+d p0 合计 a+c b+d a+b+c+d 比值比(odds ratio)OR值的含义同RR,是指暴露组的疾病危险性为 非暴露组的多少倍.第12页/共88页13RR 或 OR 值大小,反映疾病与暴露的关联程度:RR=1,无关RR 1,暴露引起疗后副作用的危险增加.RR 1,暴露引起疗后副作用的危险减小.对于队列研究,当发生率很低的时候,OR RR例5 RR10,OR10.08第13页/共88页14(三)临床治疗效果的有效测量1.CER(control event rate)对照组中某事件的发生率2.EER(experimental event rate)试验组中某事件的发生率3.RRR(relative risk reduction)相对危险度减少率=(CER-EER)/CER4.ARR(absolute risk increase)绝对危险度减少率=CER-EER第14页/共88页15(三三)临床治疗效果的有效测量临床治疗效果的有效测量5.NNT(number needed to treat)在试验期内防止一例危险结局所需要治疗的人数在试验期内防止一例危险结局所需要治疗的人数 某病并发症某病并发症 相对风险相对风险 绝对风险绝对风险 为预防为预防1例并发症例并发症 分组分组 发生率发生率%降低降低%降低降低%需要治疗的人数需要治疗的人数 RRR=(CER-EER)ARR=(CER-EER)NNT=1/ARR /CER例例1 常规药常规药CER 9.6 (9.6-2.8)/9.6=71 9.6-2.8=6.8 1/6.8%=14.7 新药新药EER 2.8例例2 常规药常规药CER 96.0 (96-28)/96=71 96-28=68 1/68%=1.47 新药新药EER 28.0例例3 常规药常规药CER 0.96 (0.96-0.28)/0.96=71 0.96-0.28=0.68 1/0.68%=147 新药新药EER 0.28 NNT 越小越好越小越好,例例2 用新药用新药68%的人避免了并发症的人避免了并发症,如要有如要有1人不人不得并发症得并发症,只需治疗只需治疗2个患者个患者.第15页/共88页16例4.两种药物治疗慢性咽炎的疗效 疗效 药物 例数 有效 无效 有效率(%)兰芩口服液 45 41 4 91.1 银黄口服液 35 24 11 68.6 合计 80 65 15 81.3 2=6.565 P=0.01 有统计学意义,临床意义的治疗效果如何评价?第16页/共88页176.NNT6.NNT的可信区间 NNTNNT的95%95%可信区间等于ARRARR的95%95%置信区间的倒数.例4.兰芩口服液 P P1 1=8.9%,=8.9%,银黄口服液 P P2 2=31.4%=31.4%ARR=P ARR=P2 2-P-P1 1=31.4%-8.9%=22.5%=31.4%-8.9%=22.5%s sARR ARR=8.9%,NNT=1/ARR=1/22.5%=4.4=8.9%,NNT=1/ARR=1/22.5%=4.4 ARR ARR的95%95%可信区间:ARR:ARR 1.96s1.96sARRARR =22.5%=22.5%1.961.96 8.9%=(5.1%,39.9%)8.9%=(5.1%,39.9%)NNT NNT的95%95%可信区间:下限值=1/ARR=1/ARR上限 =1/39.3%=2.5=1/39.3%=2.5 上限值=1/ARR=1/ARR下限 =1/5.1%=19.6=1/5.1%=19.6第17页/共88页187.NNT7.NNT用于估计治疗的成本(成本效益)防止一例危险结局的治疗成本=NNT 治疗的人均年花费.例1 14.7 1200元=17640元 例2 1.47 1200元=1764元 例3 147 1200元=176400元 第18页/共88页19例题例题:在在6065岁妇女进行某新药的岁妇女进行某新药的RCT研究研究(5年年)疾病状况疾病状况 治疗治疗 例数例数 乳腺癌乳腺癌 非乳腺癌非乳腺癌 安慰剂安慰剂 1000 40 960 药物药物 1000 10 9901.安慰剂组安慰剂组,病人的乳腺癌发病率是多少病人的乳腺癌发病率是多少(5年期间年期间)?A.4%B.1.6 C.24 D.67.5 E.0.42.药物组药物组,病人的乳腺癌发病率是多少病人的乳腺癌发病率是多少(5年期间年期间)?A.30 B.25%C.1%D.4 E.0.53.乳腺癌的可归因于药物的相对危险度降低了多少乳腺癌的可归因于药物的相对危险度降低了多少?A.25%B.50%C.75%D.100%E.150%第19页/共88页203.乳腺癌的可归因于药物的绝对危险度降低了多少?A.1%B.2%C.3%D.4%4.为预防一位乳腺癌病人,需要治疗多少人(NNT)?A.2%B.3%C.4%D.33.3 E.无法计算5.假设药物成本是每月100元,5年中预防一位乳腺癌 病人的成本是多少?A.0.12万 B.0.6万 C.2万 D.20万 E.33万第20页/共88页21四、可信区间第21页/共88页22例7 某医院对40名II型糖尿病病人进行RCT研究,比较两种药物对空腹血糖的降糖效果是否不同?两组空腹血糖下降值的均数、标准差 分组 例数 x s t p 试验组 20 2.065 3.06 0.642 0.525 对照组 20 2.625 2.42P 值的局限性:如果p80%)重度(AHI 51,最低SpO2 79%)两组,比较两个样本组的BMI的平均水平。统计假设:H0:两组患者的BMI总体均数相同 H1:两组患者的BMI总体均数不相同 检验水准 =0.05 (双侧)95%CI 分组 例数 x s t p 均数差 下限 上限 轻度组 45 27.48 3.78 2.474 0.015 -1.70 -3.05 -0.34重度组 75 29.18 3.55第24页/共88页25 (1)(2)(3)(4)(5)有实际意义的值 H0 有统计学意义有统计学意义 无统计学意义无统计学意义 有有 可能可能 无无 样本样本 可接受可接受 实际实际 有实际有实际 实际实际 过小过小 无效假设无效假设 意义意义 意义意义 意义意义 示意图示意图 置信区间可以提供的信息置信区间可以提供的信息第25页/共88页26例9 在一心力衰竭的治疗试验中,被随机分配到血管紧张素转化酶抑制剂组的病人有33%死亡;随机分到肼苯哒嗪和硝酸盐组的病人有38%死亡。两组差值的点估计为5%,其95%可信区间是从-1.2%12%.这是一个“阴性”结果,可信区间含盖了零假设,而95%可信区间的上限为12%,很有临床意义,通过增加 样本做进一步的观察或开展多中心试验。第26页/共88页27小结:在解释“阴性”试验结果时,需要知道样本更大的 试验是否有可能出现有显著意义的结果。回答这个问题,要看结果的95%可信区间的上限。首先自问:这样水平的差异从临床上看很重要吗?如果不重要,可以放弃进一步试验。反之,如果上限表示了有重要意义的组间差别,有价值进行更大的样本的临床试验。第27页/共88页28再看一下例7 的95%可信区间 两组空腹血糖下降值的均数、标准差 分组 例数 x s t p 试验组 20 2.065 3.06 0.642 0.52 对照组 20 2.625 2.42两均数差值的点估计为:-0.56 95%可信区间为:-2.32 1.21第28页/共88页29 临床意义与统计学意义评价判断类别 临床意义 统计学意义 评价判断 I +样本量足够时,真实 II +-计算II类错误,应扩大样本再试 III -样本量足够时,否定其应用价值 IV -+无论样本大小均无应用价值*专业知识,置信区间第29页/共88页30五、数据类型及统计方法的选择第30页/共88页31数据类型计量资料 Quantitative:“how much?”连续的变量:年龄,体重,身高,血压 实际数值:家庭的子女数,住院天数分类资料 Categorical:“what type?”等级变量:肿瘤分期(I,II,III);好 中 差名义变量:男/女;健康/生病;ABO血型第31页/共88页32数据类型数据类型的转换计量数据可转换成分类数据:normal(value)vs.abnormal;“young,middle-aged,old”将连续变量转换成等级或分类变量减少了资料的信息量,从而造成统计学检验的敏感度或把握度下降第32页/共88页33计量资料的统计方法正态分布正态分布非正态分布非正态分布配对资料(配对资料(2组组)配对配对t检验检验符号检验符号检验符号等级检验符号等级检验成组比较成组比较 (2组)组)成组比较成组比较t检验检验Wilcoxon Mann&Whitney中位数检验中位数检验配伍组比较配伍组比较随机区组方差分随机区组方差分析析非参数配伍组比较非参数配伍组比较M检验检验多组比较多组比较完全随机设计方完全随机设计方差分析差分析非参数多组比较非参数多组比较H检验检验第33页/共88页34计数资料的统计方法双向无序:卡方 检验或fisher精确概率法单向有序:Ridit分析或秩和检验双向有序:等级相关 一致性分析(kappa)第34页/共88页35Make predictions:回归分析应变量:一般定量变量 线性分析等级或名义变量Logistic 回归时间变量 Cox回归第35页/共88页36某降压药治疗前后舒张压(mmHg)(部分)试验组对照组用药前用药后用药前用药后102909810010090103949285110100989011010811811411011010095949610286104941168492100第36页/共88页37数据库格式随机号分组 治疗前血压治疗后血压性别年龄1A10290M562B98100F453A10090F654B10394F435A9285M626A9890M587B110100F468B110108M59第37页/共88页38表1:Group StatisticsGroupNMeanStd.Deviation治疗前舒张压治疗前舒张压试验组试验组32103.5008.4853对照组对照组32102.6256.9456治疗后舒张压治疗后舒张压试验组试验组3291.71889.2081对照组对照组3295.06255.8582表1:Group Statistics第38页/共88页39tdfSig.(2-tailed)治疗前舒张压治疗前舒张压0.451620.653治疗后舒张压治疗后舒张压-1.733620.088表2 Independent Samples Test 第39页/共88页40表表3 两组治疗前后舒张压比较两组治疗前后舒张压比较tdfSig.(2-tailed)试验组试验组7.762310.000对照组对照组6.012310.000第40页/共88页41表1:Group StatisticsGroupNMeanStd.Deviation治疗前舒张压治疗前舒张压试验组试验组32103.5008.4853对照组对照组32102.6256.9456治疗后舒张压治疗后舒张压试验组试验组3291.71889.2081对照组对照组3295.06255.8582治疗前后差值治疗前后差值试验组试验组3211.78138.5863对照组对照组327.56257.1163表1:Group Statistics第41页/共88页42tdfSig.(2-tailed)治疗前舒张压治疗前舒张压0.451620.653治疗后舒张压治疗后舒张压-1.733620.088治疗前后差值治疗前后差值2.140620.036表2 Independent Samples Test 第42页/共88页43Type I Sum of SquaresdfMean SquareFSig.Corrected Model1,354.1193451.3739.7210.000Intercept5,986.89115,986.89128.930.000GROUP284.7661284.7666.1330.016BBP1,015.15711,015.1521.8630.000GROUP*BBP54.197154.1971.1670.284Error2,785.9906046.433Total10,127.0064Corrected Total4,140.10963第43页/共88页44Type III Sum of SquaresdfMean SquareFSig.Corrected Model1,299.922 649.96113.960.000Intercept679.1571 679.15714.580.000GROUP225.7151 225.7154.8480.031BBP1,015.1511,015.121.800.000Error2,840.186146.560Total10,127.064Corrected Total4,140.10963第44页/共88页45某药对支气管哮喘的疗效痊愈 显效有效无效例数试验组 15253525100对照组 10404010100合计25657535200第45页/共88页46例:研究初产妇和经产妇电针引产的成功率 研究因素:产妇状况,观察指标:成功率例数例数成功成功例数例数成功成功率率 2P初产初产60442870.91.900 0.05经产经产16712876.6第46页/共88页47电针引产成功率的比较 例数例数成功例成功例数数成功率成功率 2P初产初产60442870.91.900 0.10经产经产16712876.6胎膜已破胎膜已破39831879.924.002 0.001胎膜未破胎膜未破37323863.877155672.1第47页/共88页48初产妇与经产妇二组中胎膜已破者与未破者的分布 例数例数胎膜胎膜比比ORuP已破已破未破未破初产妇初产妇6043312731.211.81 3.34 0.001经产妇经产妇167671000.67第48页/共88页49胎膜情况相同,初产妇与经产妇引产成功率的比较 胎膜胎膜产妇产妇例数例数成功例成功例数数成功率()成功率()c2P已破已破初产初产33125877.93.979 0.30经产经产1006868.0第49页/共88页50假设检验 优效性假设检验 当对照采用的是安慰剂对照、空白对照时,临床试验的目的主要是确定实验组的疗效是否比对照组好,或者当采用标准对照,研究者想了解试验药物疗效是否优于对照药物,这时两组疗效差异的显著性检验需用优效性检验(传统的假设检验)。第50页/共88页51 建立检验假设 以T代表试验组的疗效,以S代表标准对照组的疗效。:TS,即实验组与对照组疗效相同。:TS,即实验组与对照组疗效不同。2.计算统计量 (1)计量资料用两样本均数t检验:第51页/共88页52t=(2)计数资料可用2检验或二项分布u检验:u=3.确定P值,做出结论 第52页/共88页53非劣效性假设检验 如果临床试验时对照组采用的是肯定有效的传统药物进行治疗(称标准对照或阳性对照),试验的目的是考察新的治疗方法的疗效是否不比“标准”治疗方法差,以便确定是否能用新的治疗方法替代传统的治疗方法,则两组的疗效比较要用非劣效性假设检验(non-inferiority test)。1、确定非劣效性界值 (非劣效性界值,用表示),当新药与标准药物疗效的差值在此范围内时,我们认为新药疗效不比标准药物差,否则,认为新药疗效不如标准药物。值根据专业知识由临床专家来确定,一般把专业上或公认有临床实际意义的差值作为值。第53页/共88页54第54页/共88页55第55页/共88页56 2.建立检验假设:以T代表试验组的疗效,以S代表标准对照组的疗效。H0:T-S-,即试验组疗效不如标准对照组。H1:T-S-,即试验组的疗效不比标准对照组差 3.计算检验统计量 (1)两样本均数的非劣效性检验用单侧t检验:t 当tt(,n1+n2-2)时,P,认为试验组疗效不比对照组差。第56页/共88页57 (2)两样本率的非劣效性检验用单侧u检验:u 当u值大于检验界值时,P,可认为试验组疗效非劣于对照组。4.可信区间方法:第57页/共88页58 如CL,则认为试验药物疗效非劣于标准药物。(三)等效性假设检验 如果对照组采用的是标准对照,试验的目的是考察新的治疗方法的疗效是否与“标准”治疗方法相等,则两组疗效的比较要用等效性假设检验。1.确定等效性界值:新的治疗方法与标准治疗方法的疗效相比,最低不能低于多少以及最高不能超过多少才可认为是“等效”,称为等效性界值,2.建立检验假设:T代表试验组的疗效,S代表标准对照组的疗效。第58页/共88页59 :T-S :T-S 这可以用两个传统的单侧检验来代替:0(1):T-S 1(1):T-S 0(2):T-S-1(2):T-S 检验水准为。称为双向单侧检验(two one-sided test)。当两个单侧检验均拒绝时,即/和/同时成立,可认为试验药物与标准药物等效。第59页/共88页60.计算检验统计量 (1)均数的等效性检验用双向单侧t检验:t1=,t2=当t1,t2同时大于检验界值时,可认为两均数等效。第60页/共88页61(2)率的等效性检验用双向单侧u检验:u1=u2=当u1,u2同时大于检验界值时,可认为两个率等效。第61页/共88页62 4.可信区间方法:计算T-S的100(1-)%双侧可信区间,上、下限分别记为u和L;如果区间(CL,CU)完全包含在区间(-,)中,即:-CLCU,则认为两疗法等效。.第62页/共88页63等效性检验等效范围主要通过专业确定率为对照组的20%计量资料为对照组的标准差的1/2-1/5,或对照组均数的1/10第63页/共88页64健胃舒颗粒分煎与合煎疗效比较临床治愈未治愈 合计数临床治愈率%健胃舒颗粒分煎36145072健胃舒颗粒合煎35155070合计712910071第64页/共88页65按一般的两 样本率检验结果:u=0.22038 p0.05 0.22038 p0.05 两率差别无统计学意义。等效性检验结果:u=1.322279 p0.05 1.322279 p0.05 尚不能认为分煎与合煎是等效的。第65页/共88页66统计分析集第66页/共88页67纳入病例标准排除病例标准脱落病例标准剔除病例标准第67页/共88页68第68页/共88页69第69页/共88页70第70页/共88页71第71页/共88页72第72页/共88页73第73页/共88页74第74页/共88页75第75页/共88页76病人退出试验和改变治疗方案 从道德方面考虑,病人有权在任何时候退出试验,但研究者应当尽量设法减少中途退出的病人。为了病人的利益,有时必须改变病人的治疗方案,如对癌症病人用化疗时毒性反应过大等,但必须有充分的根据。第76页/共88页77脱落(中止、失访)病人是否应包括在数据分析之中?通常主张应当包括所有随机化了的病人,即包括退出治疗的病人。因为这样会提供对治疗效果更可靠的判断,而且符合将来临床应用的实际。这被称为“意向性治疗分析(intention to treat,ITT)”的原则,也称“实际法(Pragmatic approach)”。第77页/共88页78分析局限于按照方案治疗的病人分析局限于按照方案治疗的病人。可能会破坏随机化,歪曲了处理的比较,这种 病例被称为“符合方案分析集(per protocol set,PP)”。这种方法也称为“说明法(Explanatory approach)”。第78页/共88页79意向性治疗分析原则(ITT)应当将所有随机化了的病人作为所分到的处理组的病人进行随访、评价和分析,而不管其是否依从治疗方案。第79页/共88页80意向性治疗分析原则的理由由于两组药物的疗效的差异,不良反应的不同,可能造成病人退出试验的人数比例不同,从而使原来的随机分组的作用被破坏,影响疗效的正确比较。(例如,一组病人疗效较差,因疗效较差的退出较多,疗效尚可的留下,不能代表其真正的疗效)。第80页/共88页81意向性治疗分析原则的困难有些不合理:发现病人严重违反入组标准仍要进行分析。A组病人吃了B组的药仍要作为A组进行分析。ICH GCP 提出了全分析集(Full Analysis Set)第81页/共88页82全分析集(FAS)尽可能按意向性治疗原则,对所有随机化了的病例以合理方法尽可能少的剔除。这就是尽可能完整和尽可能按意向性治疗原则包括所有随机化了的病例。对退出病人脱漏的主要指标通过末次观察前推法(last observation carried forward method,LOCF)递补。第82页/共88页83符合方案分析集(PPS)全分析集中更加符合方案的一部分病例:1.完成了预先确定的治疗最小量;2.主要变量可以测定;3.没有重大的对方案的违反。第83页/共88页84安全集(SAS)曾经应用其所在组药物至少一次者。示例:试验组38例,13例发生不良反应,有3例失访5例未能坚持定期随诊。对照组20例,2例发生不良反应不良反应率:试验组:13/30=43.3%,21/38=55.26%对照组:2/20=10%作者:“患者失访及被淘汰的8例中,主要原因 之一是点药后疼痛感明显”。第84页/共88页85第85页/共88页86第86页/共88页87统计分析集:全分析集(FAS)符合方案分析集(PPS)安全集(SAS)第87页/共88页88感谢您的观看!第88页/共88页