正文
生存预测(基于病理图像预测患者预后)
可解释性验证:
通过注意力热图可视化模型关注区域,与病理医生标注对比,验证模型决策合理性。
流程亮点:
数据效率:仅需
25%
标注数据即可达到传统模型
100%
数据的性能,缓解标注难题。
跨癌种适配:预训练覆盖
32
种癌症,模型在肺癌、肾癌等不同任务中表现稳定。
图
1 BEPH
架构概述
BEPH
的
“
预训练
-
微调
”
范式可类比为
“
先学通用语言,再练方言
”
。未来若能整合多模态数据(如基因组、临床指标),可能实现更精准的个性化医疗。此外,模型轻量化(如使用
ViT-Tiny
)可能更适合临床实时部署需求。
三、结果:
BEPH
的
“
成绩单
”——
多维度验证性能突破
Patch
级分类:细节丢失也不慌,跨癌种诊断稳了!
BEPH
在乳腺肿瘤良恶性分类任务(
BreakHis
数据集)中展现了“降维打击”能力:即使将图像下采样至
224
×
224
像素(丢失
70%
细节),患者级和图像级准确率仍分别高达
94.05%
和
93.65%
,比传统
CNN
模型(如
ResNet
、
VGG
)高出
5-10%
。更夸张的是,在肺癌亚型分类(
LC25000
数据集)中,
BEPH
以
99.99%
的准确率横扫
AlexNet
、
EfficientNet
等模型(图
2e
)。
BEPH
的逆天表现得益于
MIM
(掩码图像建模)预训练策略。这种“先蒙眼拼图再考试”的学习方式,让模型即使面对模糊图像也能捕捉关键病理特征。有趣的是,
BEPH
对图像分辨率变化表现出极强的鲁棒性(图
2c-d
),这意味着未来临床部署时,医院无需升级高分辨率扫描设备即可使用——简直是基层医疗机构的福音!
WSI
级分类:弱监督学习也能“卷”出天花板
在肾癌(
RCC
)、乳腺癌(
BRCA
)、肺癌(
NSCLC
)的亚型分类任务中,
BEPH
仅用
25%
训练数据时,
AUC
已达
0.909
;全量数据下,肾癌亚型分类
AUC
飙升至
0.994
,几乎与人类病理专家持平(图
2a-b
)。即便对比最新基础模型
GigaPath
(参数规模
17
倍于
BEPH
),
BEPH
在肺癌、肾癌任务中仅落后
0.7%
,堪称“小模型逆袭”的典范。
图
2
对公开可用的补丁数据集进行性能评估