《实体瘤疗效评价标准版中文.pdf》由会员分享,可在线阅读,更多相关《实体瘤疗效评价标准版中文.pdf(26页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、实体瘤疗效评价标准实体瘤疗效评价标准 RECISTRECIST(1.11.1 版)版)1 1 背景背景1.1 RECIST 标准的历史评价肿瘤负荷的改变是癌症治疗的临床评价的一个重要特性。肿瘤缩小(客观反映)和疾病进展的时间都是癌症临床实验中的重要端点。为了筛查新的抗肿瘤药物,肿瘤缩小作为 II 期实验端点被数年研究的证据所支持。这些研究提醒对于多种实体肿瘤来说,促使部分病人肿瘤缩小的药物以后都有也许(尽管不完美)被证实可提高病人的总体生存期或在随机期实验中有进入事件评价的其他机会。目前在期筛查实验中评价治疗效果的指标中,客观反映比任何其他生物标记更可靠。并且,在和期药物实验中,进展期疾病中的
2、临床实验正越来越运用疾病进展的时间(无进展生存)作为得出有治疗效果结论的端点,而这些也是建立在肿瘤大小的基础上。然而这些肿瘤端点、客观反映和疾病进展时间,只有建立在以肿瘤负荷解剖学基础上的广泛接受和容易使用的标准准则上才有价值。1981 年世界卫生组织(WHO)初次出版了肿瘤反映标准,重要用于肿瘤反映是重要终点的实验中。WHO 标准通过测量病变二维大小并进行合计介绍了肿瘤负荷总体评价的概念,通过评价治疗期间基线的改变而判断治疗的反映。然而,在该标准出版后的十几年中,使用该标准的协作组和制药公司通常对其进行修改以适应新的技术或在原始文献中提出了不清楚的地方,这就导致了实验结果解释的混乱。事实上,
3、各种反映标准的应用导致同一种治疗方法的治疗效果大相径庭。对这些问题的反映是国际工作组于 19 世纪中期形成,并对反映标准进行了标准化和简化。新的标准,也称为 RECIST(实体肿瘤的反映评价标准)于 2023年出版。最初的 TECIST 关键特性涉及病变最小大小的拟定、对随访病变数目的建议(最多10 个;每个器官最大5 个)、一维而不是二维的使用、肿瘤负荷的总体评价。这些标准后来被学术团队、协作组和制药工业广泛采用,而该标准的最初端点就是客观反映或疾病进展。此外,当局接受 RECIST 作为这些评价的合适的标准。1.2 为什么要更新 RECIST?自从 2023 年出版 RECIST 后,许多
4、研究者在前瞻性研究中证实将以二维测量为基础的标准(甚至是三维测量)替换为一维测量的有效性。但也有例外(如间皮瘤),一维测量标准似乎在实体肿瘤期实验中更好。然而大量问题开始出现需要回答和阐明。如在不影响病人总体预定反映(或实验结束)情况下是否要超过 10 人才干评估?在随机期实验中,特别当病人没有可测量的病变,而疾病进展,无反映作为重要的端点时,如何应用 RECIST?是否或如何运用新的影像学技术如 FDG-PET 和 MRI?如何评价淋巴结?是否需要确认治疗反映?RECIST 在靶向非细胞毒性药物实验中的最大合用范围。RECIST 标准的修改涉及所有这些问题的更新。1.3 RECIST1.1
5、版形成过程RECIST 工作组,是由来自于学术研究机构、政府和制药公司的初期药物开发的有经验的临床医生、影像学专家和记录学家组成,他们为 RECIST 更新定期举行会议,拟定对种种变化是否需要做出调整和复习新出现的证据。修订过程中一个最重要的方面是建立一个回顾性的数据库,该数据库的资料来自于工业和学术协作组实验中获得的实体肿瘤相关数据。这个数据库在JanBogaerts 和 Patrick Therasse 领导下,在 EORTC 资料中心完毕的。该数据库有6500 病人,病变器官18000 个,被用来调查各种问题(如需要病变的数量、治疗反映确认的需要性,淋巴结测量规则)对治疗反映和无疾病进展
6、生存期的影响。这项工作的结果是由 RECIST 工作组做出评价后在修改的指南中发生了较大变动,并且在这个专期中做出了具体报道。Larry Schwartz andRobert Ford(该指南的共同作者)也提供了来自于推理的关键的数据库,这些数据库形成了这项修改。这个修改指南的出版被认为是及时的,由于它将各种变化进行了简化、完美化,使临床实验的肿瘤负荷的评价标准化。关键的变动鉴于附录。由于基本的评价方法仍然是解剖,而不是功能上的,因此我们将这个版本命名为 RECIST1.1 而不是 2.0.1.4 体积或功能评价怎么样?这就提出了一个问题即是否可以将肿瘤负荷的解剖的一维评价转变为体积评价或功能
7、评价(如动态对比增强 MRI 或 CT 或FDG-PET 评价肿瘤代谢)。正如大家看到的,工作组特别是那些从事影像学研究者,相信目前还没有完全的标准化和这些推荐的替代评价方法还不能广泛应用。正如指南后面描述的,唯一的例外是 FDG-PET 作为拟定疾病进展的辅助工具。根据此专期的介绍,我们相信这些有希望的新的方法(如 RECIST 描述中的增长或替代解剖评价)需要适当的和严格的临床评价。Sargent 等的文章表白那些将需要拟定这些形式的“端点”的资料类型,如何拟定这些标准/形式的地点和时间以提高其可靠性,以至于在期筛查实验中通过与 RECIST 标准比较,拟定那些为有活性的新的药物,而哪些不
8、是。RECIST 工作组盼望明年出现这样的资料,允许在下一版的 RECIST 标准中做出适当的变动。2.该指南的目的该指南描述了一个实体瘤测量和成人、小儿癌症的临床实验中肿瘤大小变化客观评估的规定的标准做法。预计这些标准将有效用于所有以客观响应为重要的研究终点的实验,以及承担稳定疾病评估、肿瘤进展或进展时间分析的实验,由于所有治疗效果的衡量都是基于研究中解剖学肿瘤负荷及其变化的评估。本文中对于达成相应标准-表白试剂或治疗方案有积极作用的终点-的患者的比例没有任何假设:这些定义依赖于实验中癌症的类型以及正在研究中的特殊试剂。协议必须涉及适当的记录学章节,介绍如何以实验样本大小和决策标准为基础来界
9、定疗效参数。除了为肿瘤反映评估提供定义和标准外,这一指南也为以肿瘤反映为终点的实验推荐了标准的研究结果报告。尽管这些指南可用于恶性脑肿瘤的研究,在这一领域关于响应的评估已有单独的标准出版13。由于淋巴瘤反映评估的国际准则也已单独出版14,这一指南不用于恶性淋巴瘤的研究。最后,许多肿瘤学家在他们平常的临床实践中依靠多次成像研究来跟踪病人的恶性疾病,并在客观和症状双重标准的基础上决定进一步的治疗方案。只有在治疗的肿瘤学专家判断合理时,这些 RECIST 指南才会在决策中起到重要作用。3.术前肿瘤检测3.1 定义术前,肿瘤病灶/淋巴结将如下分为可测量与不可测量两类3.1.1 可测量肿瘤肿瘤性病变:至
10、少有一个不小于(仪器检测)低限的尺寸(测量仪器上最长的直径将被记录下来)必须准确测量:10 毫米用 CT 扫描(CT 扫描层厚度不大于 5 毫米;见成像指南附录 II)。临床检查 10 毫米用卡尺测量(不能用卡尺准确测量的病变,应记录为不可测量的)。20 毫米用胸部 X 光检查。恶性淋巴结:当用 CT 扫描(CT 扫描层厚度建议不大于 5 毫米)来评估时,淋巴结短轴必须达成 15mm 才可将其认为是病理扩大和可测量的。术前和后续工作中,只测量并跟踪短轴长度(见特别问题 15 中施瓦茨等)。还可从“目的与非目的病灶术前文献”下的注解获取淋巴结测量方面的资料。3.1.2 不可测量的(肿瘤)其他所有
11、病变,涉及小病灶(最长直径小于 10 毫米或病理淋巴结短轴为10毫米到小于15毫米的)以及真正的不可测病变。视为真正不可测的病变涉及:理学检查拟定的脑膜疾病、腹水、胸膜或心包积液、炎症乳腺疾病、淋巴管参与的皮肤或肺部、腹部肿块/腹部器官巨大症,这些都是用重现成像技术无法测量的。3.1.3 病变可测量性的特例需要特别注意骨病变、囊性病变和之前进行了局部治疗的病变:骨病变 在测量骨病变方面,骨骼扫描、PET 扫瞄或平片被视为不充足的成像技术。但是,这些技术可以用来确认骨病变的存在或消失。假如软组织部分符合上述可测量性定义的话,带有可辨认软组织的溶解骨病变或溶解-急性混合病变可以通过CT或MRI等交
12、叉成像技术进行评估时,它们可被视为可测性病变。急性骨病变是不可测量的。囊性病变:符合 X 线定义的简朴囊肿标准的病变不应视为恶性病变(既非可测量的,也非不可测量的),由于根据其定义,它们是简朴的囊肿。被认为囊性转移的“囊性病变”可视为可测量病变,只要是符合上述可测量的定义。但是,假如同一患者体内存在非囊性病变,这些就会被选定为目的病灶。已经受到局部治疗的病变:位于先前照射区或受到其他局部治疗的部位的肿瘤病灶,通常不被视为可测量的,除非已证明病变仍在继续。研究议定书应具体说明在何种条件下这种病变将被视为可测量的。3.2.测量方法规范3.2.1.病灶的测量临床评估用测径器(卡尺)测量,所有测量用米
13、制为单位记录。所有基线评估必须尽也许在接近治疗开始前进行,不能早于四周。3.2.2.测量方法在评价同一个病灶时,基线和随诊应使用同样的技术和方法。除只能用临床检查评估不合用影像检测外,病灶必须采用影像检测评价,不要单纯采用临床检查。临床检查病灶:只有在 10mm 以下的表浅病灶(如皮下小结)考虑使用测径器来进行临床检测。皮肤表浅病灶建议使用彩色照片记录,照片附上测量病灶大小的比例尺。如前所述,当病灶既可用临床检测也可用影像学检查时,由于影像学更客观并可用于治疗后研究终点的回顾,应当进行影像学检查。胸部 X 片:胸片和胸部 CT 测量病灶,由于 CT 在发现新病灶等方面比较 X 片更敏感,优先选
14、用 CT 扫描,特别在重要的治疗终点时。当然,肺实质中边界清楚的病灶也可使用胸片检测。详见附录二。CT,MRI:CT 是目前用来评估病灶疗效最有效和反复性最佳的检测方法。指南定义可测量病灶用CT 扫描基于层厚不超过5mm。如附录二所示,当CT 层厚超过 5mm,可测量病灶最小应是层厚的两倍。MRI 在某也情况下也可使用(如全身扫描)。更多关于使用 CT 和 MRI 检测实体瘤评估疗效的意见见附录 II。超声检查:超声检查不合用于评估病灶大小,不应用于测量方法。超声检查在两次相邻的观测间不能完全再现,并且结果依赖于检查者,从一次检测到下一次,不能保证相同的技术和测量结果(详见附录二)。假如在研究
15、过程中通过超声发现新的病灶,建议用 CT 或 MRI 验证。假如顾虑 CT 的射线照射,可用 MRI 代替来检测待检病灶。内镜、腹腔镜:不建议用这些技术评估实体瘤。但是,他们在用活检证实完全的病理学缓解或拟定完全缓解或手术切除后的再发时是有益的。肿瘤标志:肿瘤标记物不能单独用于评估实体瘤疗效。然而,肿瘤标记物开始高于正常上限时,假如用来判断病人完全缓解,标记物必须标准化。由于肿瘤标志具有疾病特异性,测量技术说明应当标注于对于某一特殊疾病基线检测的记录。关于 CA-125变化(在卵巢癌复发)和PSA 变化(在前列腺癌复发)的特别指南已经出版,见 16、17、18。此外,妇科肿瘤国际组(Inter
16、group)制订了 CA125 用于实体瘤评估的标准,一方面实验性用于卵巢癌19。细胞学、组织学:必要时这些技术可用于个别病例来区分部分缓解和完全缓解,(比如在鉴定残存病灶的肿瘤类型时,实例如生殖细胞肿瘤已知残存良性瘤病灶是可以保存的需要区分良、恶性病灶)。当已知治疗中渗出液也许发生严重不良后果(如某些紫杉醇类化疗药或血管生成克制剂),即使可测量肿瘤符合有效或稳定的标准,在治疗过程中出现的以及恶化的任何渗出液都需要考虑用细胞学证实其肿瘤性质,以区分可评价肿瘤的疗效是有效、稳定(无效)还是进展。4 肿瘤缓解评估4.1 所有肿瘤和可测量病灶的评估为评价客观缓解或未来也许的进展,有必要对所有肿瘤病灶
17、肿瘤的总负荷进行基线评估,为后面的测量结果作参照。在以客观缓解作为重要治疗终点的临床方案中,只有在基线时具有可测量病灶的患者才干入选。可测量病灶定义为存在至少一处可测量的病灶。而对于那些以疾病进展(疾病进展时间或固定日期进展限度)为重要治疗终点的实验,方案入选标准中必须明确是仅限于有可测量病灶的患者,还是没有可测量病灶也可以入选。4.2 靶病灶和非靶病灶的基线记录基线评估时有超过一个以上可测量病灶时,应记录并测量所有病灶,总数不超过 5 个(每个器官不超过 2 个),作为靶病灶代表所有累及器官(也就是说只有一个或两个累计器官的患者最多选择两个或四个靶病灶作为基线测量病灶)。靶病灶必须基于尺寸进
18、行选择(最长直径),能代表所有累及器官,且测量必须具有良好的反复性。有时候当最大的病灶不能反复测量时可重新选择一个可反复测量的最大病灶。淋巴结因其为正常组织且即使没有肿瘤转移仍可为影像察觉而需要特别关注。定义为可测量结节甚至是靶病灶的病理性淋巴结必须符合以下标准:CT 测量短直径15 mm。基线只需要检测短直径。放射学家通常借助结节的短直径来判断该结节是否已有肿瘤转移。结节尺寸一般用影像检测的两维数据来表达(CT用轴平面,MRI 则从轴面、矢状面或冠状面中选择一个平面)。取最小值即为短直径。例如,一个 20 mm 30 mm的腹部结节短直径为 20 mm,可视为恶性的、可测量的结节。在这个例子
19、中,20 mm即是结节的测量值。直径10 mm 但15 mm的结节不应当视为靶病灶。而10 mm 的结节则不属于病理结节范畴,不必予以记录和进一步观测。所有靶病灶的直径通过计算所求之和(涉及非结节病灶的最长直径和结节病灶的短直径)将作为基线直径总和上报。如具有淋巴结直径,如上面提到的,只将短直径计算在内。基线直径总和将作为疾病基线水平的参考数值。其余所有的病灶涉及病理淋巴结可视为非靶病灶,无需进行测量,但应在基线评估时进行记录。如记录为“存在”,“缺失”或很少数情况下“明确进展”。广泛存在的靶病灶可与靶器官记录在一起(如大量扩增骨盆淋巴结或大规模肝转移)。4.3.疗效评估标准本节为目的病灶定义
20、用来拟定实体瘤疗效的标准。4.3.1.目的病灶的疗效评价治愈所有目的病灶消失,任何病理性淋巴结(无论是否为目的病灶)的短轴值必须10 mm缓减以临界半径的总和为参照,所有目的病灶半径的总和至少减小 30%恶化以所研究(目的病灶半径)的总和最小值为参照(涉及最小值等于临界值的情况),所有目的病灶半径的总和至少增长20%,此外,半径总和增长的绝对值还必须大于 5mm(注:出现新的病灶也可认为是恶化)稳定以所研究(目的病灶半径)的总和最小值为参照,既达不到缓减标准、也达不到恶化标准者。4.3.2.目的病灶疗效评价的注意事项淋巴结若目的病灶为淋巴结时需经常测量并记录其实际的短轴值(作为基准检测时必须测
21、量同一条长径),尽管所研究的淋巴结消退至 10mm 以下。这意味着当目的病灶为淋巴结时,目的病灶半径的和不会是 0,即使达成了治愈的标准,由于短轴值10mm的淋巴结被定义为正常淋巴结。病例报告表或其它资料收集方法也许在设计时需单独记录结节性目的病灶以判断是否治愈,由于每个结节都必须达成短轴值10mm。而在判断缓减、稳定和恶化时,结节的实际短轴值将涉及在目的病灶(半径)的总和中。太小而不能测量的目的病灶研究中以临界值记录的所有病灶(结节性的和非结节性的)都必须在随后的评估中记录它们的实际测量值,尽管很小很小(如 2mm)。但是,有时候病灶或淋巴结以临界值记录时由于在CT 扫描时信号太弱,放射科医
22、生也许不太乐意给出一个精确的测量值,而是报告为“太小而不能测量”。出现这种情况时在病例报告表中记下一个测量值是很重要的。假如放射科医生认为病灶也许会消失,测量值可记为 0mm。假如病灶的确存在而信号又太弱,可记录为默认值 5mm(这条规则不太适合淋巴结,由于正常淋巴结的大小有一个明确的值且经常被脂肪组织包裹,如腹膜后腔的淋巴结;但是,若淋巴结的确存在但信号又太弱而不好测量时,同样可记录为默认值 5mm)。默认值 5mm 来源于 CT 扫描断层的厚度(若此厚度有改变,默认值 5mm 还是不宜改变)。这种(太小而不能测量)病灶的测量值也许缺少反复性,给出一个默认值可防止测量错误时评估为假治愈或假恶
23、化。再次强调的是,假如放射科医生能给出一个实际测量值,哪怕是小于 5mm,也应当记录下来。治疗中发生崩裂或融合的病灶按照附录 II 的注释,当非结节性病灶“碎裂”时,所有碎片的最长半径必须加在一起用来计算病灶(半径)的总和。同样,当病灶融合时,它们之间的长径可被保存,这样有助于获得合并前各病灶的最大半径值。假如病灶完全融合而不再彼此分离,这种情况下半径最长者的测量值就是融合病灶的半径值。4.3.3.非目的病灶的评估本节为非目的病灶组定义用来拟定肿瘤疗效的标准。当某些非目的病灶事实上可测量时,在实验程序的特殊时间点可不需测量而只需定性。治愈所有非目的病灶消失且肿瘤标记物的水平正常化。所有淋巴结在
24、大小上必需是非病理性的(即短轴值小于 10mm)非治愈/非恶化有一个或多个非目的病灶连续存在,和/或 肿瘤标志物维持在正常水平以上。恶化存在非目的病灶的明确恶化,请见下面的评论。(注:出现一个或多个新病灶也被认为是恶化)4.3.4.判断非目的疾病恶化时的注意事项非目的疾病恶化的概念补充如下:当病人尚有可测量的疾病时此时,要根据非目的疾病来判断是否达成“明确恶化”的标准,还需非目的疾病实质性恶化的总水平(即使目的疾病被判断为稳定或缓减)。这样,总的肿瘤负荷增长到需中断治疗(请见附录 II 中的实例和下面的进一步讨论)。一个或多个非目的病灶在体积上稍微增长一般局限性以达成“明确恶化”,当目的疾病评
25、估为稳定或缓减时单独根据非目的疾病的变化就鉴定为总体恶化的情况是极其罕见的。当病人只有不可测量疾病时这样的情况发生于某些 III 期临床实验中所研究的疾病不适合测量,前面也已经提到了这一概念,但是在这一情况下没有可测量疾病的评估值可分解以解释不可测量疾病的负荷增长。由于当非目的疾病的恶化很难定量(根据定义:假设所有的病灶确的确实都是不可测量的)时,要鉴定病人为明确恶化需考虑不可测量疾病的变化导致疾病总负荷的增长量是否在强度方面与可测量疾病鉴定为恶化所需的增长量具有可比性,比如(不可测量病灶)体积增长73%导致肿瘤负荷的增长量相称于可测量病灶半径增长 20%所导致的肿瘤负荷增长量。同样的例子还涉
26、及胸腔积液从“少量”到“大量”,淋巴管病从局限到播散,或者在实验记录中被描述为“需调整治疗方案”。某些例子的解释请见附录II 的图-5 和图-6。若“明确恶化”很明显时,病人可评估为总体恶化。不要盼望不可测量疾病有合用的客观评估标准,由于正是这一疾病的本质使其不也许,所以增长量必须是实质性的。4.3.5.新病灶新的恶性病灶的出现意味着病情的恶化,所以讨论一下新病灶的检测是非常重要的。由于没有专门的标准来鉴定 X 光片上的新病灶,所以新病灶的指征必须非常明确,比如不能怀疑为扫描技术的差异、显像模式的变化或倾向于是非肿瘤的(如某些“新的”骨损害灶也许仅仅是先前就存在的病灶在愈合或突现)。这一点在当
27、病人的临界性病灶表现为缓减或治愈时特别重要。例如:肝脏病灶的坏死也许被 CT 扫描报告为“新的囊性病灶”,事实上不是。在基准扫描中未检出病灶的解剖学位置若在随访研究中检出了病灶可以认为是新的病灶并意味着病情恶化。这样的例子可见于有临界性内脏疾病的病人需在研究中做脑部 CT 或 MRI 以发现转移灶的情况。此病人的脑部转移灶可认为是恶化的证据,不管他/她以前有没有在基准测试中做脑部成像。假如新病灶很难鉴定,例如太小,但它的确代表了新的疾病,则需要在后面的治疗和随访评估中分类。假如跟最初的扫描数据比较,反复扫描证实是一个明确的新病灶,那么应当鉴定为恶化。当 FDG-PET 评估疗效需额外的研究时,
28、判断恶化将FDG-PET扫描结合互补 CT 扫描有时候是很有道理的(特别是“新”疾病也许性比较大时)。基于 FDG-PET 成像来鉴定为新病灶可根据下面的算法:a.基准测试中FDG-PET阴性,随访研究中FDG-PET阳性由于有新病灶可鉴定为恶化。b.基准测试中没有做 FDG-PET,但随访研究中 FDG-PET 阳性。若随访研究中 FDG-PET 阳性的病灶可以被 CT 证实,可鉴定为恶化。若随访研究中 FDG-PET 阳性的病灶不可以被 CT 证实,那么需要在随访研究的下一次 CT 扫描来决定是否是真正的恶化(如此,FDG-PET 扫描发现异常的时间就是鉴定为恶化的时间)若随访研究中 FD
29、G-PET 阳性的病灶是 CT 发现的已经存在的病灶且根据解剖学成像没有恶化,那么就不是恶化。4.4 最佳总疗效的评价最佳总疗效是指考虑了各种因素后确认的从研究治疗开始到治疗结束的最佳疗效的记录。有时候一种疗效也许直到治疗结束才得以证实,因此实验设计时应当明确:治疗后的评估是否作为决定最佳总疗效的因素。实验设计必须规定被引入的新的治疗在进行治疗之前将如何对最佳疗效指标起作用。患者的最佳疗效评价将依赖于靶和非靶病灶的发现,也将考虑新的病灶的出现。并且,由于研究自身和实验设计的需要,也许也需要拟定的度量值(参照 4.6 节)。特别是,在非随机实验中,疗效是最重要的终点,PR 或 CR 的拟定被认为
30、是“最佳总疗效”。这将在下面进一步描述。4.4.1.时间点疗效假定在每个实验特定期间点,一种效应评价开始。下页的表1提供了在基线水平有可测量病灶的患者每个时间点总疗效计算情况的综述Table 1.时间点疗效:目的/非目的病灶的患者目的病灶 非目的病灶 新病灶 总疗效CR=完全缓解,PR=部分缓解,SD稳定病灶,PD=进展,NE=不能评价当患者只有非测量性病灶时,用表 2Table 2.时间点效应:只有非目的病灶的患者4.4.2.消失病灶的评估和非测量性指标假如在所有某一特定期间点,没有影像资料和其他测量指标,那么该患者在该时间点是不可评估的。假如在一次评估中只做了一套病灶的测量,那么通常情况下
31、该时间点也被认为是不可测量的,除非有令人信服的证据证明个人消失的病灶不会改变所指定期间点效应。这将最有也许在进展病灶情况下发生。例如,假如一个患者的基线数是 50 毫米,有三个可测量病灶,随后只有两个病灶可供评估,但病灶达成了 80 毫米,我们认为病人处在进展状态,而不考虑其是否有一个病灶消失。4.4.3.最佳总疗效:所有时间点最佳总疗效由患者已知的所有数据资料来决定。在最佳疗效中确认完全或部分缓解的具体时间并不需要的情况:在各个阶段中的最佳总疗效定义为所有时间点是最佳的疗效(例如,病人第一次评估为稳定病灶,第二次评估为部分缓解,最后评估为进展,则最佳总疗效评价为部分缓解)。当认为稳定病灶是最
32、佳疗效时,它也必须符合从基线记录规定的最低时间。假如病灶稳定不到规定的最短时间,则不能满足记录处时,其他的最佳时间点反映,病人的最佳疗效取决于随后的评估。例如;病人第一次评估为稳定病灶,第二次为进展,而稳定病灶时间达不到最低规定,则其最佳疗效为进展。同一病人第一次评估稳定病灶后假如不能随访,则被认为不可评估。在最佳疗效中确认需要完全或部分缓解的具体时间的情况:当满足在随后的时间点(一般 4 周后)所指明的各个标准规定期,可认为完全或部分缓解。在这种情况下,最佳疗效的解释见表 3。Table 3.假如在第一时间点为完全缓解,然后在随后的时间点出现疾病,即使疾病相对基准标准出现部分缓解,在这个时间
33、点评估为进展(由于疾病在完全缓解后再发)。最佳疗效取决于稳定病灶的最低期限是否满足。然而,有时评估为“完全缓解”,在随后的扫描提醒小的病灶也许仍然存在事实上病人在第一时间点为部分缓解而非完毕缓解。这种情况下,本来的“完全缓解”应当改为“部分缓解”,最佳疗效也应当是部分缓解。4.4.4.疗效评估特别说明当淋巴结病变已被列入目的病灶,以及淋巴结减少到正常的大小(10 毫米),它们在扫描记录仍可有一个测量数据。既使淋巴结已正常这些测量结果仍应当记录,为了不夸大效果应当是以淋巴结变化的大小为依据。正如早先说明的同样,这意味着完全缓解的患者也许在病例报告表中(CRF)没有一个完整的“零点”。在需要拟定疗
34、效的实验中,反复的“不可评估”时间点评估也许使最佳疗效的拟定复杂化。该实验的分析计划必须说明丢失的数据/评估信息将如何被用来决定是有效还是进展。例如,在大多数实验中考虑患者不同时间点疗效,将 PR-NE-PR 作为一个有效的疗效评价是合理的。整体健康状况恶化没有该时间点疾病进展客观证据而需要中断治疗的患者应报告为“症状性恶化”即使中断治疗后,也应积极证实其客观进展。症状性恶化不是客观疗效的描述,只是一个停止治疗的因素。这样的患者的客观疗效情况应由表 1、2、3 中显示的靶病灶和非靶病灶的评估来决定。限定“初期进展,初期死亡和不可估计”的条件具研究特殊性,应当在实验计划初期明确作出规定(取决于治
35、疗连续时间,治疗周期)在某些情况下,鉴别残留病灶和正常组织也许很困难。当需要依靠这些结果来评价完全缓解时,建议在下完全缓解的结论前先检查残留病灶(通过细针穿刺活检)。常规影像学认为异常的残留病灶,FDG-PET 诊断为纤维化或疤痕,其也许通过这种和活检类似的方式来提高评估效应到CR。在这种情况下用FDG-PET 应当在实验设计中提前描述,同时也应当受疾病特异性相关医学文献报道的适应症的支持。然而,必须了解由于FDG-PET和活检分辨能力和敏感性的限制也许导致 CR 的假阳性。由于进展的模糊发现(例如非常小而不拟定的新病灶;已有病灶中的囊性和坏死改变等),治疗可连续到下一个评估日程。假如在下一个
36、评估时间表中,确认为进展,进展的日期应当是比进展被怀疑的更早的日期。4.5 肿瘤评价的频次治疗期间肿瘤再评价的次数应依据研究计划及肿瘤的类型和治疗时程而定。但在二期临床实验中,疗效尚为未知数,因此每一个治疗周期约 68 周的随访是合理的。特定情况可调整评价周期的长短。计划应当具体规定哪些器官一开始即需要进行评价(通常是那些有转移倾向的肿瘤)以及多长时间进行反复评估。通常在每次评估时对于所有标的和非标的病变均需要进行评价。在一些情况下非标的器官可减少评估次数。例如,骨扫描仅在需要确认标的病变完全缓解或怀疑有骨转移时才需要反复进行。治疗结束后,肿瘤是否需要再评估取决于研究目的是否要看缓解率或者肿瘤
37、进展/死亡事件发生。若研究目的是事件发生的期间(如进展期、无病生存期、无进展生存期),那么需要根据研究计划进行例行的再评估。特别是在随机对照实验中,应依据疗程来进行反复评估(如每治疗 68 周或治疗后每 34 个月),且不可因治疗延误、药物假期或任何可打破治疗平衡的事件而延期。特别是在随机对照实验中,应依据疗程来进行反复评估(如每治疗 68 周或治疗后每 34 个月),且不可因治疗延误、药物假期或任何可打破治疗平衡的事件而延期。4.6.有效期的界定4.6.1.确认办法在以疗效为重要终值的非随机化实验中,确认为缓减或痊愈需要鉴别疗效不是测量错误所致,此外,还规定能对某些本来就规定确认的实验历史数
38、据进行合理的解释(关于此专题请见Bogaerts 等的文章)。然而,在所有其它情况中,比如 II 期或III 期的随机化实验、以稳定或恶化为起始终值的实验中,由于不需给实验结果的解释赋值,故疗效的确认可不必规定。但是取消对疗效确认的规定也许会使防止偏倚的中心思想显得更加重要,特别在非盲实验中。例如稳定的测量必须符合稳定的起码评估标准一旦实验介入时刚好是按照实验程序中规定的最短间隔期(一般不短于6-8 周)4.6.2.总的疗效期总的疗效期是指从初次符合痊愈或缓减的评估标准日期(初次记录)到复发或恶化客观上确认的第一天(参照实验中记录的恶化最小测量值)总的痊愈期是指到从达成痊愈评估标准的日期到客观
39、上确认复发的第一天。4.6.3.稳定期稳定期是指从治疗开始的日期(在随机化实验中就是随机日期)起到符合恶化评估标准的第一天,参照实验中(病灶半径)和的最小值(若最小值就是临界值,参照缓减的计算)稳定期的临床相关性不同实验和不同疾病中变化很大。在特殊的实验中,部分病人达成的若是稳定期的最小值并且还是一个重要的终值,实验程序应当特别指明 2 种鉴定稳定的测量方法的最小时间间隔。注:有效期、稳定期及与恶化无关的存活期会受到基准评估后随访频率的影响。指定标准的随访频率超过了本指南的范围。拟定随访频率时要考虑许多参数,如疾病类型、分期、治疗周期和标准操作等。但是,假如实验间进行比较时必须考虑到终值测量精
40、度的这些限制。4.7.无恶化存活/率4.7.1.II 期实验本指南重要把重点放在运用客观的疗效终值到临床 II 期实验中。在某些情况下,“缓解率”也许不是评估新药的潜在抗癌活性的最佳方法。比如在界定“无恶化存活”或“无恶化率”的时间点时,也许要考虑其它的替代方法来提供合适的观测新药生物学活性的指标。但是,在一个非受控实验中有一点是清楚的这些测量方法必须符合评估标准,由于一个明显有希望的观测指标也许与生物学因素(如病例的选择)有关,同时要与干预的影响无关。这样,使用这些终值的 II 期筛选实验可以设立抱负的随机对照组。也有例外,若存在某些肿瘤的行为模式一致时(通常都很不一致)采用非随机化实验是无
41、可厚非的(见vanGlabbeke 等的举例20)。但是,这样的例子中,缺少疗效时谨慎地声明“无恶化存活”或“恶化无关比率”评价基础是很重要的。4.7.2.III 期实验在进展期肿瘤中进行的 III 期实验越来越多的用来评估感爱好的最重要结局无恶化存活或恶化时间。假如程序规定所有的病人都为可测量疾病,那么恶化的评估是相称简朴的。但是,限制进入这部分病人要依评估标准而定:(1)假如研究的疾病有一部分重要的病人需排除,也许导致实验的结果不能普遍通用;(2)甚至延长病例收集的时间。所以,越来越多的实验允许接纳可测量疾病的病人和只有不可测量疾病的病人。此时,必须谨慎而明确的描述无可测量病灶的病人鉴定为
42、恶化的依据。此外,这样的情况中,假如记录到的这些有可测量疾病病人的目的病灶最大数目可适当从 5 个放宽到 3 个(根据 Bogaerts10和 Moskowitz11的数据),则实验程序必须指明。此外,假如也许,有效的肿瘤标志来衡量恶化(卵巢癌中已提出)也许有助于更充足的鉴定恶化。为核算“明确恶化”对影像学研究或原始成像报告集中盲评在重要药物开发或药物批准决定需要根据此实验结果时也许是需要的。最后,如前面提到的那样,由于恶化的日期易受评估偏倚的影响,各实验组中的调查计时应当相同。Dancey 等的文章有专题21提供了随机化实验如何评估恶化的具体讨论。4.8.缓减和恶化的独立评论以客观反映(完全
43、缓减和部分缓减)为初始终值的实验,特别是关键药物开发决策所依据的反映指标的数目最小时,推荐将所有声称的反映给独立于此研究之外的专家进行评论。假如是随机化实验的研究,抱负的评审者应当不知道治疗的分组情况,最佳能同时给出病人资料及放射影像的评论。对(病情)恶化的独立评论引出了一些更复杂的话题:例如,在使用基于集中评审的恶化时间代替基于调查员的恶化时间的问题上,由于当前者先于后者时会潜在的引入一些有益资料的删改,这样会出现一些记录学问题。Ford 等的文章22有专题对这些因素和一些其它的从独立评论中得来的经验教训进行了综述。4.9.最佳疗效结果报告4.9.1.期临床实验若以疗效为重要终点,则进入临床
44、实验的所有患者必须有可测量病灶,在进行结果报告时,所有受试患者均须包含在内,即使存在重要治疗协议的偏差或者疗效不可评价。患者分为以下各组:1.完全缓解2.部分缓解3.疾病稳定4.疾病进展5.疗效不可评价:特定因素(例如:因肿瘤而初期死亡;因毒性初期死亡;肿瘤评估资料不能反复或不完全;其他(特定)正常情况下,期临床实验中,所有符合标准的患者都应涉及在有效率分析的人群中(在一些协议中,应当涉及所有接受治疗的患者)。一般首选 95%双边可信区间以限定有效率的评估。实验结论应基于所有符合标准或所有接受治疗患者的有效率,而不是基于选定可评价的亚组的有效率。4.9.2.期临床实验期临床实验中,有效率评价可
45、用来作为抗肿瘤治疗相关活性的评估,经常是一个次要终点。有效率上观测到的差异也许并不能预测所研究人群临床相关治疗的获益。假如客观有效率被选择作为一个期临床实验的重要终点时(仅仅是肿瘤客观有效率与临床相关治疗获益在所研究人群有明确关系的情况下),期临床实验中的标准可同样合用,同时所有入组患者须有至少一个可测量病灶。在许多实验中,以有效率为次要终点,并且不是所有的入组患者都有可测量病灶,这种情况下,总体最佳有效率的报告方式必须在设计协议中提前说明。事实上,有效率也许以一个“意向治疗”分析(所有随机患者均涉及在内)来报告,或者仅以具有基线可测量病灶的亚组人群分析来报告。设计协议应明确界定疗效结果如何报告,涉及所有计划的亚组。RECIST 初始版本使期临床实验的设计者在设计协议时,也许采用一个对RECIST 指南的不严格的判读(例如,减少测量病灶的数目)为标准,而这在修订后的指南中将不再可行。指南修订的原则是,明确指南的标准应当合用于所有的临床实验,而这些实验是以解剖学上对肿瘤有效或进展的评估为终点的。
限制150内