正文
其中16个参与模型训练和验证,其余3个作为外部保留站点。
(2)总共有1468例儿童脑肿瘤患者的数据,
包含患者的
影像和病理
数据,进行了肿瘤分类和分割。
(3)开发了一个3D模型,
使用了
联邦学习(FL)方法
进行模型训练,
用于肿瘤病理预测和分割。
(4)与传统的集中式数据共享(CDS)方法对比并进行性能评估。
1.3 结果
(1)
与集中数据训练相比,FL-PedBrain在分类性能上仅减少了不到1.5%,在分割性能上减少了3%。
(2)FL在三个外部网络之外的站点上提高了20%到30%的分割性能。
1.4 结论
(1)FL-PedBrain平台对于儿童后颅窝脑肿瘤的联合学习具有有效性。
(2)尽管存在数据异质性,FL-PedBrain仍然在所有19个站点上展现了高泛化性能。
2 数据介绍
本研究纳入了1468名后颅窝肿瘤患者,其中包括596例髓母细胞瘤(MB)、210例胶质母细胞瘤(EP)、335例旁脑室胶质瘤(PA)和327例脑干胶质瘤(DIPG)。
3 研究方
法
3.1 模型开发和评估
(1)研究人员开发了一个3D模型,用于肿瘤病理预测(MB、EP、PA、DIPG、正常)和分割掩膜。
(2)使用联邦学习(FL)方法进行模型训练,通过“联邦平均”(Federated Averaging)方法实现。
(3)与传统的集中式数据共享(CDS)方法进行了比较,在CDS方法中,将所有数据集中到一个池中进行训练。
(4)
除了FL方法,还对比了“孤立”模型,该模型仅使用单一站点的数据进行训练,并在16个保留验证集和3个独立外部站点上进行评估。
3.2训练流程
(1)联邦学习中,
各站点仅共享模型参数
而非原始数据。
(2)每轮FL训练开始时,各站点进行本地模型训练,然后将学习到的权重传回中央服务器。
(3)中央服务器对来自各个站点的模型权重进行平均,从而更新全局模型。
探索了数据异质性的来源,包括影像质量差异和站点特定的肿瘤特征变异。
4 结果
4.1
分类性能
(1)FL(联邦学习)和 CDS(集中式学习)的分类性能相当,没有统计学上的显著差异。
(2)Siloed training(孤立训练)性能明显较差,且不同站点的表现差异很大。