专栏名称: 生信菜鸟团
生信菜鸟团荣誉归来,让所有想分析生物信息学数据的小伙伴找到归属,你值得拥有!
目录
相关文章推荐
BioArt  ·  Cell Stem ... ·  2 天前  
生信宝典  ·  iMeta期刊 第4卷第3期 在线正式发布 ·  2 天前  
51好读  ›  专栏  ›  生信菜鸟团

如何用基本临床数据预测癌症免疫检查点抑制剂疗法的疗效 | Nat.Med

生信菜鸟团  · 公众号  · 生物  · 2025-04-10 13:44

正文

请到「今天看啥」查看全文


Para_01
  1. 在保留的测试数据中,用于预测总生存期的机器学习模型 SCORPIO 在免疫检查点抑制剂 (ICI) 治疗后 6、12、18、24 和 30 个月预测总生存期,其跨癌症类型的中位 AUC(t) 为 0.763。
  2. SCORPIO 在预测总生存期方面优于 SCORPIO-CB 和肿瘤突变负荷 (TMB),这通过 AUC(t) 值得以体现。
  3. 它还以跨癌症类型的 AUC 为 0.714 预测了临床获益,超过了 SCORPIO-CB(跨癌症类型 AUC 为 0.701)和 TMB(跨癌症类型 AUC 为 0.546)。
  4. SCORPIO 在所有癌症类型中始终优于 SCORPIO-CB 和 TMB。

Fig. 2: Performance of SCORPIO across all real-world cohorts, phase 3 clinical trials and different tumor types.

图片

- 图片说明

◉ 点图总结了 SCORPIO 在预测 6、12、18、24 和 30 个月整体生存率以及在三个真实世界队列和来自 10 项三期临床试验的 12 个实验组中预测临床获益的表现。 ◉ RWD 表示真实世界数据;RCT 表示随机临床试验。 ◉ 由于 MSHS 队列中缺乏临床获益数据,计算 AUC 不可行。 ◉ 由于所有患者在此时间点均已死亡,计算 AUC(t) 不可行。 ◉ 由于所有患者在此时间点仍然存活,计算 AUC(t) 不可行。

Para_02
  1. 为了确定针对特定癌症类型的模型是否比 SCORPIO(一种泛癌模型)提供更好的预测价值,我们开发了基于每种癌症类型数据训练的模型。
  2. 首先,我们对每种癌症类型分别进行了特征选择分析和模型训练。
  3. 在训练集中包含的17种癌症类型中,我们识别出10种具有与总生存期显著相关的特征(补充表2)。
  4. 然后,我们训练了这10个模型,并将其性能与测试集中的SCORPIO进行比较。
  5. 在预测总生存期和临床获益方面,SCORPIO的表现优于大多数特定癌症类型的模型(补充图8)。
  6. 这表明,在大规模泛癌数据上训练的SCORPIO成功地学习了跨癌症类型的相关关系。
Para_03
  1. 接下来,我们将 SCORPIO 的性能与 Vanguri 等人提出的九种机器学习模型进行了比较,这些模型利用单模态、双模态或多模态数据(放射学、病理学、肿瘤遗传学和 PD-L1 评分)预测非小细胞肺癌 (NSCLC) 患者对免疫检查点抑制剂 (ICI) 治疗的疗效。
  2. SCORPIO 在预测总生存期方面优于这些模型(补充图 9a),并且在预测临床获益方面表现出相当的性能,尽管它是在更简单、更易获取的泛癌数据上训练的(补充图 9b)。
Para_04
  1. 在保留的测试数据中,三个风险组(低风险、中等风险和高风险)显示出显著不同的总体生存率。
  2. 在不同肿瘤类型中,与高风险组相比,死亡的风险比(HRs)为:低风险组 0.25(95% 置信区间 (CI),0.18–0.34),中等风险组 0.48(95% CI,0.37–0.63)。
  3. 此外,在不同肿瘤类型中,每个风险组的临床获益率显著不同——低风险组为 55.96%,中等风险组为 28.64%,高风险组为 12.12%(P = 3.22 × 10−11)。
Para_05
  1. 随后,我们在独立的真实世界 MSK-II 队列中测试了 SCORPIO。
  2. 在这个队列中,SCORPIO 在免疫检查点抑制剂(ICI)治疗后 6、12、18、24 和 30 个月预测了总体生存率,全癌种的中位 AUC(t) 为 0.759(图 2)。
  3. 它还以全癌种 AUC 为 0.641 预测了 ICI 的临床获益。
  4. 与保留测试数据的结果一致,SCORPIO 在 AUC(t) 和 AUC 方面均优于基于肿瘤突变负荷(TMB)的方法(补充图 11 和 12)。
  5. 三个风险组的总体生存率存在显著差异(图 3a 和 补充图 13a)。
  6. 在不同肿瘤类型中,低风险组和中等风险组相对于高风险组的死亡风险比(HR)分别为 0.16(95% 置信区间,0.14–0.19)和 0.38(95% 置信区间,0.34–0.43)。
  7. 此外,在不同肿瘤类型中,各风险组的临床获益率显著不同——低风险组为 65.09%,中等风险组为 52.20%,高风险组为 32.89%(P = 2.35 × 10−11;图 3b 和 补充图 13b)。
  8. 在两个内部测试数据集中,风险组与临床结果之间的关联独立于 ICI 治疗的线数、性别、年龄、东部肿瘤协作组体能状态(ECOG-PS)、微卫星不稳定性(MSI)状态和 TMB(补充图 14 和 15)。

Fig. 3: Performance of SCORPIO on the MSK-II cohort (internal test set).


- 图片说明

◉ Kaplan-Meier 图展示了根据 SCORPIO 分层的三个风险组的总体生存情况。标记表示删失数据。黑色垂直和水平虚线代表每个风险组的中位生存时间。双侧 P 值通过对数秩检验计算得出。未进行多重检验校正。 ◉ 条形图显示了根据 SCORPIO 分层的三个风险组的临床获益率。双侧 P 值通过 Fisher 精确检验计算得出。未进行多重检验校正。

Para_06
  1. 为了确定 SCORPIO 是否专门针对免疫检查点抑制剂(ICI)疗效具有预后价值,还是对无论接受何种治疗的癌症患者都具有一般性预后价值,我们分析了一组来自 MSKCC 的未接受 ICI 治疗的患者数据。
  2. 在某些但并非所有癌症类型中,SCORPIO 能够预测非 ICI 患者的总生存期(补充图 16)。
  3. 然而,与 ICI 治疗情境不同的是,对于特定癌症如膀胱癌、肝胆癌、食道癌和卵巢癌,其预后准确性有所下降(图 3a 和补充图 10a、13a 和 16)。
  4. 这些结果表明,在 ICI 治疗的情境下,SCORPIO 对总生存期的预测更为有效。

Model interpretability

模型可解释性

Para_01
  1. 为了了解每个特征如何对 SCORPIO 的风险评分预测做出贡献,我们使用 SHapley Additive exPlanations (SHAP) 方法分析了其训练集中 33 个特征的相对影响。
  2. SHAP 定量分析了每个特征对免疫检查点抑制剂(ICI)疗效中患者间变异的贡献(图 4a)。
  3. 贡献最大的前五个特征是氯离子 (CL)、白蛋白 (ALB)、血红蛋白 (HGB)、ECOG 性能状态 (ECOG-PS) 和嗜酸性粒细胞在白细胞中的比例 (EOS%)。

Fig. 4: Model interpretability.

图片

- 图片说明

◉ 全局模型解释使用了 SCORPIO 特征的聚合 SHAP 值的点图。具有负聚合 SHAP 值(黄色)的特征值越高,风险评分值越低;而具有正聚合 SHAP 值(紫色)的特征值越高,则风险评分值越高。特征按绝对聚合 SHAP 值排序。WBC:白细胞;RBC:红细胞;AGAP:阴离子间隙;PROT:总蛋白;LYM%:白细胞中的淋巴细胞比例;NEUT%:白细胞中的中性粒细胞比例;Smoking:吸烟史;NEUT:中性粒细胞计数;CREAT:肌酐;LYM:淋巴细胞计数;HCT:血细胞比容;GLU:葡萄糖;MONO:单核细胞计数;ALT:丙氨酸氨基转移酶;Age:ICI 治疗时的年龄;AST:天冬氨酸氨基转移酶;MCHC:平均红细胞血红蛋白浓度;Stage:ICI 治疗时的肿瘤分期;MLR:单核细胞与淋巴细胞比值;RDW:红细胞分布宽度;ALK:碱性磷酸酶;BASO%:白细胞中的嗜碱性粒细胞比例;eGFR:估算的肾小球滤过率;PLT:血小板;BILI:总胆红素;BLR:嗜碱性粒细胞与淋巴细胞比值。 ◉ b 至 e:局部模型解释,(b 和 c) 分别展示了对 ipilimumab/nivolumab 和 atezolizumab 产生完全缓解 (CR) 的两个代表性病例,以及 (d 和 e) 分别展示了对 atezolizumab 和 pembrolizumab 产生疾病进展 (PD) 的两个代表性病例。每个病例在左侧面板用条形图表示,显示聚合 SHAP 值,以指示每个特征对预测风险评分的影响大小和方向。右侧面板显示治疗前后的影像学图像。对应患者的特征值在条形图中提供。每位患者的最佳总体肿瘤反应和生存情况也一并展示。密度图显示了训练集中风险评分的分布,黑色虚线表示每位患者预测的风险评分。MSS:微卫星稳定。b 和 c 中的黄色箭头分别指代免疫治疗前扫描(‘Pre-ICI’)中的肝脏和肺部转移。对应的免疫治疗后扫描(‘Post-ICI’)显示完全缓解,未见可见病灶。 ◉ d 中的黄色线条表示治疗前后扫描中恶性胸腔积液的双向直径,反映尽管治疗仍为疾病进展。e 中的黄色虚线勾勒出在 ICI 治疗期间新出现的恶性胸腔积液,表明疾病进展。 ◉ f 和 g:热图显示了 14 种免疫细胞类型与排名前五的特征之间的关联,以及来自 SCORPIO 的预测风险评分,其中 (f) 是 NSCLC 患者,(g) 是头颈部 (H&N) 癌症患者。NK:自然杀伤细胞。双侧 P 值通过 Spearman 等级相关检验计算得出。* 调整后的错误发现率 (FDR) P < 0.05。** FDR 调整后的 P < 0.01。每个单元格中的数字表示 Spearman 的 ρ 值。

Para_02
  1. 图4b-e显示了保留测试集中具有不同风险评分和临床反应的代表性患者。
  2. 每个特征的贡献根据其自身值和其他特征的值,在方向和大小上有所不同,这展示了模型在预测每位患者ICI疗效时的复杂性。
Para_03
  1. 接下来,我们研究了排名前五的特征和预测的风险评分如何反映肿瘤微环境(TME)的特性。
  2. 我们收集了另一组包含264名非小细胞肺癌(NSCLC)患者的队列,这些患者有可用的整体RNA测序(RNA-seq)、血液检测值(在肿瘤活检当日或不超过30天前进行)以及临床数据。
  3. 使用经过验证的最准确的NSCLC免疫细胞分解方法之一的Danaher特征签名,我们对14种免疫细胞类型进行了分解。
  4. 然后,我们分析了这些免疫细胞丰度与排名前五的特征水平以及预测风险评分之间的相关性(图4f)。
  5. 我们的研究发现显示,较高的白蛋白(ALB)水平与肥大细胞、T细胞、B细胞、CD45细胞和调节性T细胞的丰度增加相关。
  6. 相反,较低的ECOG表现状态(ECOG-PS)与T细胞、B细胞、CD45细胞、耗竭型CD8细胞和细胞毒性细胞的丰度增加有关。
  7. 此外,较低的预测风险评分(表明对免疫治疗有更好的预测反应)与肥大细胞、T细胞、B细胞、CD45细胞、调节性T细胞、自然杀伤CD56低细胞和Th1细胞的更高丰度相对应。
  8. 我们进一步分析了来自MSK-I队列的头颈部(H&N)癌症患者(n = 32)中这14种免疫细胞类型的丰度与排名前五的特征水平及预测风险评分之间的关联(图4g)。
  9. 与NSCLC队列相比,显著的关联较少,这可能是由于样本量较小所致。
  10. 然而,观察到的关系非常相似——各种免疫细胞类型与ALB水平呈正相关,而ECOG-PS和预测风险评分与许多免疫细胞类型呈负相关。
  11. 这些结果表明,SCORPIO中的某些特征反映了TME状态,并且较低的预测风险评分对应于患者的免疫炎症表型。
Para_04
  1. 我们还评估了排名前五的特征是否与肿瘤突变负荷(TMB)相关。
  2. 利用来自多个 MSKCC 队列的患者数据(n = 2,969),我们发现 TMB 通常与排名前五的特征或风险评分无关,除非在少数几种癌症类型中。

Model performance in the external test datasets

模型在外部分析数据集中的表现

Para_01
  1. 在临床试验队列中,SCORPIO 在 IMvigor211 试验(膀胱癌)中对6、12、18、24和30个月总生存期的预测表现最佳,中位 AUC(t) 达到 0.782,并在 IMspire150 试验(黑色素瘤)中对临床获益的预测达到 AUC 为 0.684(图2)。
  2. 在每个临床试验队列中,三个风险组显示出显著不同的总生存率(每项试验 P < 0.0001;图5a)。
  3. 同样,不同风险组之间的临床获益率也存在显著差异(P 值:IMpower133 为 0.043,IMpower131 (ACNP) 为 0.0027,IMpower131 (ACP) 为 0.001,IMpower150 (ABCP) 为 0.0004,IMspire150 和 OAK 为 0.0003,IMpower150 (ACP) 为 0.0001,其余试验小于 0.0001;图5b)。
  4. 重要的是,这些结果与性别、年龄和 PD-L1 表达无关(补充图18)。
  5. 在临床试验中,根据多种性能指标显示,SCORPIO 在预测临床获益和总生存期方面优于 PD-L1 染色(补充图19)。

Fig. 5: Performance of SCORPIO on the 10 global phase 3 clinical trial cohorts (external test sets).


- 图片说明

◉ Kaplan-Meier生存曲线显示了根据SCORPIO分层的三个风险组在10个临床试验队列中的12个实验组的总生存期。 ◉ 标记表示删失数据。 ◉ 黑色垂直和水平虚线代表每个风险组的中位生存时间。 ◉ 使用对数秩检验计算双侧P值,未进行多重检验校正。 ◉ HCC表示肝细胞癌。 ◉ 柱状图显示了根据SCORPIO分层的三个风险组在10个临床试验队列中的12个实验组的临床获益率。 ◉ 使用Fisher精确检验计算双侧P值,未进行多重检验校正。

Para_02
  1. 为了进一步测试模型的泛化能力,我们分析了一个在大型综合性健康系统(MSHS)接受治疗的真实世界患者队列,该队列涵盖了多样化的人群。
  2. 在这个队列中,SCORPIO 在免疫检查点抑制剂(ICI)治疗后 6、12、18、24 和 30 个月预测了总生存期,其跨癌症类型的中位 AUC(t) 为 0.725(图 2),并且三个风险组在接受 ICI 治疗后的总生存期有显著差异(图 6)。
  3. 在不同肿瘤类型中,与高风险组相比,低风险组和中等风险组的死亡风险比(HRs)分别为 0.25(95% 置信区间,0.18–0.34)和 0.41(95% 置信区间,0.33–0.50)。
  4. 重要的是,所有这些结果均独立于 ICI 治疗的治疗线数、性别、年龄和 ECOG-PS(补充图 20)。

Fig. 6: Performance of SCORPIO on the MSHS cohort (external test set).


- 图片说明

◉ Kaplan-Meier曲线图显示了根据SCORPIO分层的三个风险组的整体生存率。 ◉ 标记表示被删失的数据。 ◉ 黑色垂直和水平虚线代表每个风险组的中位生存时间。 ◉ 使用对数秩检验计算双侧P值。 ◉ 未进行多重检验校正。

Model performance comparison across cohorts and tumor types

跨队列和肿瘤类型的模型性能比较

Para_01
  1. 与第三阶段临床试验相比,SCORPIO 在大多数癌症类型的真实世界队列中对总生存期的预测表现更好(图2)。
  2. 例如,在膀胱癌中,真实世界队列中的中位 AUC(t) 为 0.809(涵盖所有时间点和队列),优于 IMvigor211 试验中观察到的 0.782。
  3. 同样,对于肝胆癌,真实世界数据中的中位 AUC(t) 达到 0.746,超过了 IMbrave150 试验中报告的 0.704。
  4. 值得注意的是,SCORPIO 在真实世界队列的肾细胞癌 (RCC) 中表现出最强的性能,中位 AUC(t) 为 0.829,高于 IMmotion151 试验中观察到的 0.668。
Para_02
  1. 该模型在真实世界队列中表现更好,可能是因为训练数据涵盖了更广泛的患者特征、癌症类型和治疗环境。
  2. 这也表明,该模型能够有效捕捉日常临床实践中存在的复杂性和变化性,从而增强了其在预测不同患者群体中免疫检查点抑制剂(ICIs)疗效方面的适用性。
  3. 值得注意的是,在大多数癌症类型和队列中,该模型在预测总生存期方面的表现优于预测临床获益,这可能反映了总生存期作为一个可靠的临床终点的稳健性,因为在肿瘤学中,相比于临床获益,总生存期通常因其清晰和客观的结果而被优先考虑。
Para_03
  1. 此外,我们的分析表明,SCORPIO 在预测临床获益方面的表现因不同癌症类型而异(图2)。
  2. 为了理解不同癌症类型之间的性能差异,我们比较了特定癌症类型模型与 SCORPIO 的 SHAP 值。
  3. 该分析揭示了 SCORPIO 的泛癌建模方法可能忽略的关键特征。
  4. 我们的研究结果表明,在 SCORPIO 模型中,特定特征在不同癌症类型中的重要性存在一些变化(补充图21)。
  5. 例如,尽管 SHAP 分析显示 ALB 和 HGB 在 SCORPIO 中很重要,但在特定癌症类型的模型中,它们的重要性有所降低,尤其是在膀胱癌、卵巢癌、头颈部癌和非小细胞肺癌中。






请到「今天看啥」查看全文