马上注册,阅读更多内容,享用更多功能!
您需要 登录 才可以下载或查看,没有账号?立即注册
×
编译:广东省肺癌研究所 陈旻星
导言
分期分类是癌症患者管理的基石。它是关于肿瘤在解剖学范围的命名法,有助于一致的和精确的进行肿瘤范围的描述,汇报结果,比较不同治疗的结果并判断临床试验结果对患者的适用程度。除开其他患者因素、肿瘤和环境因素以及选择的治疗方法,肿瘤负担对预后有很大影响。因此,分期分类是开展和报告研究、选择治疗、评估预后和指导全球癌症控制活动的重要工具。
世界各地使用的单一、一致的分期系统由美国癌症联合委员会 (AJCC) 和国际癌症控制联盟 (UICC)制定。这些独立的组织协同工作以定义一个单一的系统。分期系统必须是相对的静态;不断变化会造成混乱和无法沟通。然而,医学必须不断进化;其他评估工具得到改善,新的治疗方法被开发,新的特征被发现。因此,在一个较长的间隔后,分期必须定期改进——进行有限且合理的更改,以便我们适应不断变化的临床视图,同时保持沟通和促进跨时间比较的能力。目前的第8版分期于2017年1月1在全球生效。下一次更新(第9版)计划于 2024年推出。
肿瘤分期涉及3个组成部分:T表示原发性肿瘤范围,N 区域淋巴结受累程度和M表示远处转移程度。每个组成部分分为几个类别(例如,T1、T2、T3、T4),有时可能会进一步细分(例如,T1a、T1b、T1c)。这些类别由特定的解剖特征作为描述符。最后,为了方便临床使用,通过合并T、N、M来合成分期组。
从1996开始,肺癌的AJCC/UICC分期系统通过IASLC的分期与预后因素委员会(SPFC)进行的非平行科学分析。IASLC创立了大约100,000患者的全球数据库,这个数据库是第7版和第8版分期的基础。这个系统扩大到其他胸部肿瘤,例如间皮瘤,胸腺瘤,食管癌。本文章描述了SPFC进行第九版胸部肿瘤分期提议所使用的原则和基本流程。主要的关注点在肺癌,其他胸部肿瘤的方法也是类似的。
基本原则
主要目标
SPFC的目标是细化第9版胸部恶性肿瘤的分期分类。分期本质是整合单个案例(由一系列肿瘤组成)形成队列。分期分类必须可以一致应用并结合临床。
临床相关性意味着分期分类必须可用于管理病人,然而,阶段分类、治疗和结果的关系不应被误解为分期系统决定治疗或预后。分期分类只是一个因素,只是我们用来交流的一种术语。分期分类适用于肿瘤。肿瘤解剖范围可能因不同患者而有所差异,他们具有许多附加特征(例如,年龄、合并症、偏好和价值观,治疗适用性等)。分期不描述患者特征,仅适用于肿瘤本身。
虽然解剖肿瘤范围具有许多临床意义(例如,治疗方法、预后),许多其他肿瘤特征也具有临床意义,可用其他分类方法描述,例如组织学分类、基因组特征(例如可靶向驱动基因突变、分子分析)和肿瘤恶性程度(例如,PET 亲和力、观察到的生长动力学)。这种额外的肿瘤特征可能具有或多或少的临床意义。视具体情况而定,例如,非小细胞肺癌 (NSCLC) 组织类型对 I 期肺癌影响不大,但对 II-IV 期肺癌选择化疗方案很重要。此类因素(以及患者和环境相关的因素)不属于分期分类的讨论范围。分期分类只指出肿瘤的解剖范围。
范围
虽然阶段分类系统是一个全球通用标准,但不同地区的经济和医疗资源存在差异。尽管这无疑会影响结果,但这对阶段组之间差异的影响很少被提及。然而,资源有限的地区的肺癌病人数据是有限的。因此,虽然SPFC 致力于开发一种在全球范围内有用的分类,结论在低或中等收入国家的效度可能存在问题。
分期分类与临床相关性、结果和治疗交织在一起。然而,分期不能作为治疗指南。治疗必须不断推进,而阶段分类必须保持一致而仅有适当的定期更新。治疗取决于患者以及肿瘤特征。阶段分类只是一个用于交流的术语。我们不用分期分类来决定治疗——治疗选择是基于相关临床试验的结果以及它们对特定病人的适用程度。此外,无论给予何种治疗,阶段分类都必须适用。
阶段分类系统不是预后预测系统。它只反映肿瘤负荷对预后的影响,观察到的结果适用于全球接受于各种治疗的平均患者。SPFC有另外预后预测系统的开发。稳健的预后评估系统必须反映尽可能多的预后因素(肿瘤相关、患者相关、环境相关和治疗相关),必须提供当代估计并且保持灵活以便新因素被发现时可以被加入系统。这是一项复杂的工作,因为许多因素的对预后的影响因临床环境、肿瘤分期和治疗方法而异。
指导原则
与之前的修订版(第 7 版和第 8 版)一样,SPFC定义了一般指导原则(表1)用于细化阶段分类系统。
定义分期分类的标准必须反映肿瘤固有的解剖特性并在各种各样的患者、环境、治疗中表现一致,并且必须随着时间的推移保持稳定。考虑临床相关性也很重要——例如,与现在用于治疗方案选择的标准相似(尽管治疗范式不断发展并部分依赖于除肿瘤范围外的其他因素)。实际问题的考虑也很重要。区分一个与病人管理无关且发病率低的亚组只会徒增复杂性。
预后是开发阶段分类系统的主要工具。疾病的解剖范围对大多数肿瘤的预后有重大影响,无论地区、环境和治疗。然而,我们需要整合方法,因为预后也取决于患者特征(例如年龄、合并症、社会经济地位、价值观)、环境因素(例如地区、医疗保健系统、访问、风险因素)、时间段(例如,1990 年代、2000 年代、2010 年代)、其他肿瘤特征(例如级别、代谢活动、基因组特征)、治疗方法和评估预后的时间点(例如诊断时、[成功] 完成治疗时、1年后)。这些附加特征主要影响实际预后,对分期分类组之间的区分度的影响较小。因此,在分期分类系统的精炼过程中,预后将被用作评估多亚组间的差别分析的一致性------而不仅仅只是预后的单一分析。
混杂因素的存在会使区分队列的过程存在潜在的假阳性(或阴性)风险。预后的使用要求 1) 它是应用于一个可近似于当代患者总体的大型队列,2) 主要的潜在混杂因素可以通过多变量调整解释或在子集分析中对这些因素进行一致区分3) 验证分析证明其普适性。一个稳健的分析需要足够的样本量。
过程
制定阶段分类系统修订的过程可分为多个阶段(表2)。首先评估现有系统的缺点,然后提出解决这些问题的方法,例如,通过在 IASLC-CRAB 数据库中收集案例,然后可能通过与其他组织合作进行外部验证作为补充。潜在的系统修订是基于已证明的效度和普遍性以及实用性考虑,例如内部或外部数据量、可能的分析和验证范围以及临床相关性。(请注意,对于大多数非胸部肿瘤部位和早期版本的肺癌分期分类,该系统主要基于经验性考虑,几乎没有确认能力。)
数据库
SPFC 阶段分类工作是一项艰巨的任务,由世界各地许多机构的无数个人的贡献组成,他们进行了大量努力。世界将感谢这些无私的人。
目前正在建立IASLC-CRAB 数据库;一份单独的出版物将详细说明数据库的细节。数据库的大小将与第 7版和第8 版版肺癌分期分类所使用的相似(最终版分别为81,495和77,156)。数据库有广泛的代表性,至少25个国家参与其中。数据库由来自50个站点的预先输入的数据组成电子数据捕获 (EDC) 系统,由来自不同国家和地区的“批量”数据集补充。“批量”数据集的数据必须映射到 IASLC-CRAB 数据库中。数据来自约25个不同国家,这些国家来自非洲、亚洲、澳大利亚、欧洲、中东、北美和南美。IASLC-CRAB数据库既有优点也有缺点。某些地区的数据比例过高(亚洲/澳大利亚约占病例的 70%,仅日本约占 40%),而其他地区则数据不足(非洲<1%)。许多数据的完整度是有问题的。但是,来自资源较少国家和晚期病例的数据在当前数据库中的比例大于以前的版本,反映了我们在这些领域的努力。数据的偏差程度和数据的缺失对特定类别和成分的分析的影响会随着分析成熟而变得更加明显。
因为这是一个自主的数据库,SPFC 没有能力控制数据规模、区域分布和数据元素的完整性。SPFC 强烈鼓励使用EDC系统,因为这样数据更完整,但只有少量数据能进入EDC系统登记。
分析数据方法
终点
表3:建立分期系统的潜在终点
终点
| 优点
| 缺点
| 总生存率
| 清晰,易获取
| 混杂因素多(病人,肿瘤,环境,治疗相关的)
| 自然病史(未治疗)
| 无治疗干扰
| 抽象,临床相关性低,受竞争性死因影响
| 复发
| 反映非致死性癌症结局,消除竞争性死因的影响
| 数据较少,包括治疗相关因素,受随访密度和调查密度影响,可能会混淆复发和第二原发肿瘤(尤其是多发毛玻璃/附壁生长肿瘤)
| 无病生存率
| 数据多
| 混合了复发和死亡率(包括了竞争性死因,治疗相关因素,受随访情况影响)
| 疾病特异性生存率
| 消除竞争性死因的影响
| 数据较少,受治疗相关因素影响,依赖于死因的可信度
|
可以考虑使用多个终点来评估癌症解剖范围的影响,但没有一个是理想的(表3)。所有终点都存在混杂因素、局限性和实用性的限制,其影响各不相同。例如,肿瘤范围可能是侵袭性肿瘤(例如 SCLC)或广泛疾病(远处转移)的预后决定因素,尤其是在治疗效果有限的情况下。另一方面,在健康的患者中,发达国家中的I 期 NSCLC 患者中,OS 主要反映了竞争性死因和治疗效果;肿瘤范围的作用较小。在这种情况下,复发可能是一个更好的终点。此外,患者的表现方式会影响肿瘤侵袭性的范围。筛查(或频繁影像学检查导致的偶然诊断)显着增加惰性肿瘤的比例,因此影响预后和治疗效果。相反,在欠发达地区,患者患有侵袭性癌症的比例更高。
以往的分期分类,OS 是唯一的结果——一个合乎逻辑的选择,因为彼时治疗有效性、获得护理的容易度、早期发现和数据可用性受到限制。第9版分期分类总体上仍将OS视为主要终点。然而,复发是被认为更能代表肿瘤范围对早期和惰性肿瘤的影响。
所有终点都反映的是疾病范围以及其他因素对癌症的影响。这一事实确实对评估癌症解剖范围造成影响。总体生存率可以被视为适合全球当代人口数据库的指标,因为它代表了真实世界下肿瘤的范围以及治疗和其他混杂因素的总体。在这种情况下,潜在分期分类的信度就可达到,如果在多个验证参数都证明了普遍性:历史(随时间的一致区分度)、地理(跨区域)、方法学(例如,CT 与 PET、c 期与 p 期)、肿瘤谱(例如,不同的组织型、吸烟状况、通过症状发现与通过筛查发现)和随访间隔(例如,在 1、2、3、5 年)。
全球人口数据库不可用,但大型数据库可能足够近似。基于人口的数据库的缺乏的影响可以被缓解,只要数据库包含足够的案例,包含全肿瘤谱并且主要谱系都进行了亚组分析。SPFC 正在评估未被充分说明的潜在缺陷,以及解决这些问题的潜在策略——例如,要包含在 IASLC-CRAB 数据库中的数据或用于外部验证的数据。因此,通过证明数据库的代表性和通过子集分析验证普遍性,SPFC相信IASLC-CRAB数据库可以进行稳健的分析。
混杂因素
解剖疾病程度在决定预后方面具有重要作用,但其他肿瘤、患者和环境相关因素也起作用。确定观察到的结果在多大程度上是由于疾病范围引起而不是其他因素引起在这个时候基本上是不可能的。然而,没有必要详细解决这个问题,前提是解剖学疾病范围以一致的方式发挥作用。SPFC 专注于如何确信情况确实如此(即肿瘤的解剖范围对区分度的影响是一致的)。
SPFC 已经确定了第1层子组,在这些子组中,任何提出的基于解剖范围的分期或分期组对排序和区分度表现出一致的影响。这些包括 T、N 和 M 亚组、病理和临床分期、疾病程度因子。这些亚组分析中的任何不一致或排序错乱或缺乏区分度将被拒绝成为阶段分类参数。(除非一个因素发生得太少以至于不能在特定亚组分析中的有效评估)。
治疗值得特别考虑。出于所有实际目的,其他预后因素不能针对队列或个体患者进行更改(例如,等级、遗传特征、年龄、PS、社会经济地位、环境)。然而,治疗可以很容易地改变,并反映可用证据、资源和普遍态度。因此,亚组分析通常由各种治疗方法来证明一致的排序和区分。(仅涉及治疗方式 - 而不是肺叶切除术与肺段切除术、放射治疗剂量等细节)
用于确保通用性的第二层评估是在各大洲地区以及主要肺癌组织类型中进行分期分类以及分期组的评估。如果分期参数显示这些亚组分析之间存在一致区分度(第1和第2层,主要治疗方法),我们可以确信,参数是一致、相关和适用于临床环境的。
数据分析
改进肺癌的分期分类不大型数据库的统计分析解决,原因有很多。观察到的结果会反映除解剖范围外的其他混杂因素;需要临床判断来评估这些影响。在一个大数据库,即使无意义的临床结果的微小差异也可能存在统计学意义。使用大型数据集进行细分的做法是十分诱惑,但这会限制临床相关性和增加虚假结果的风险(由混杂因素驱动)。最后,由重复的统计得出的分组建议可能不具有临床相关性(即与临床护理无关)。因此,由SPFC来评估临床相关性,以及可能影响观察结果的因素,然后才添加统计评估来补充解释和信心。
具体而言,SPFC的流程从评估潜在的描述符、类别和分组开始。这将与子集分析一起探索以评估一致性和顺序。特定的终点、潜在的混杂因素和特定的子集被用于判断肿瘤解剖程度对观察结果的影响程度。看似可用于区分肿瘤解剖范围亚组的因素将进一步进行数据分析。关键是多个分析均证明特定分期和分期组队列之间存在一致的预后差异。虽然我们要求统计学差异,即使统计学功效不足,通过一定的顺序和趋势,某一些结论也可以被接受,因为某些亚组分析可能由于队列规模、事件数量和验证性分析的数量过少而导致统计学功效不足。
生存期从临床分期的诊断日期或病理分期的手术日期开始测量,并使用Kaplan-Meier方法进行分析。排除相关数据缺失的案例。使用Cox似然比-比例风险回归模型比较生存估计。分期分类的区分度主要通过使用R方和一致性指数(C-统计量)来评估。基于不同方法的优缺点和数据特征,这些措施被认为是最好的。其他分析方法,包括递归分割,监管下的机器人学习技术,例如逐步模型选择,惩罚Cox回归(例如,Lasso、Elastic Net)和随机森林,在适当时可以使用。
限制
一般来说,因为考虑到临床相关性和虚假的可能性(与混杂因素相关的差异而非肿瘤范围),SPFC将OS差异<5%作为分期和分期组之间的差异存疑的基础。此外,区分出来的边缘子组的效果可能会被系统的笨拙复杂性所抵消。5%的门槛是一个建议性的标准;考虑到亚组分析的数量,这不是一个硬性标准。
在<50个案例中出现的因素通常也被认为是可疑的。统计分析是基于事件的数量(例如,死亡);<50 的情况下,通常事件太少,无法进行稳健的子集分析以保持一致性。最后,SPFC 认为在 1000 个案例中记录<1 的描述符可能会被遗漏。这种罕见的描述具有可疑的临床相关性,它们对预后的影响是难以评估,它们可能使分期分类过于复杂。
验证和普遍性
第1层(T、N 和 M 类别,病理和临床分期组;常见治疗模式)和内部验证的第2层(主要肺癌组织型和大陆地区)已经被提及。此外,内部历史验证(区分度的持续性)将会完成。这将涉及对第9版数据库加速期的一致性评估(发生频率足够高的因素)或第8版数据库的评估。但是,对于发生率低或新发现的因素,可能无法进行历史验证。
SPFC 打算将国家分为高收入或中等收入组,对主要类别和阶段组进行内部验证。我们也希望通过涉及吸烟状况和症状检测与筛查检测的子集分析的进行谱系普适性的验证,但这可能是不可行的。如果可行,将通过一系列分期分类评估手段进行普适性的内部评估。
我们通过独立数据库对主要类别进行外部验证。在以前的版本中,这涉及 SEER 或 NCDB 分析。具有足够详细信息的独立数据库,可以进行稳健的验证,需要特定的验证人口是外部验证的关键考虑因素。
我们预计,对于某些潜在的描述符,将无法进行可靠的内部验证。在这种情况下,SPFC 寻求进行外部验证。包含特定因素信息的数据集就足够了,即使它缺乏关于其他因素或存在可能的混杂因素。外部分析的详细信息将取决于所讨论的因素以及可用于分析的内容。
讨论
阶段分类与临床相关性、结果和治疗交织在一起,过程是循环的:我们使用预后来帮助定义分期分类,分期分类影响治疗方法,反过来治疗对预后有重要作用。然而,这被简单化了,因为还有其他因素会影响预后和治疗。SPFC 的重点是是识别疾病解剖范围的特征——同时认识到这种解剖学分类将用于现实世界的环境中,与无数的其他因素混杂一起。
阶段分类为我们提供了很好的帮助,促进了对治疗方法和结果的沟通。它显然有弱点。根本上,分类定义了由个案组成的队列;然而,任何分类本质上在某种程度上是随机的。我们需要一个全球标准,但它难以最优满足各地区的需求。晚期肿瘤的代表性不足,可能是因为解剖肿瘤范围在这种情况下重要性下降。虽然加强对有限的解剖学散播(“寡转移”肿瘤)的关注,似乎非解剖学特征的分类此时更有用(例如,PS、组织型、生物标志物概况)。
分子肿瘤分析不是 TNM 分期分类的一部分。SPFC认识到当癌症播散,解剖学范围的影响减弱,而其他因素变得更加相关;分子分析作为治疗的预测因素具有特殊价值。这强调了针对肿瘤的各种特征的和各种病人的不同分类方案的临床价值(例如,组织型、分子谱、体能状态、慢性阻塞性肺病、肺部疾病分类、解剖疾病程度等)。各种分类的相对价值对不同肿瘤或患者会有所不同,具体取决于手头的情况和潜在的治疗。期望一个分类方案涵盖所有情况的所有相关方面是不现实的;专注于那些与情况相关的分类更为实际。
我们需要一个适合提供个性化的预测的预后模型。这与分期分类有根本不同,尽管有明显的重叠。开发这样的系统比单纯的分期分类复杂得多,将单独讨论。
结论
本文描述的是一个总体战略计划,旨在提供一种稳健的方法细化阶段分类,尽可能解决弱点。我们认识到想法并不总是与现实相匹配。然而,它是一个为目标提供计划的框架。这论文旨在阐明战略的细节,以保持一致性和透明度。我们欢迎批评和改进这一进程的声音, SPFC相信这将推动我们前进。无论如何,SPFC努力细化阶胸部恶性肿瘤的分期分类,这比最初的提议有所进步,因为最初的提议主要是经验性的。
|
|