专栏名称: 生信人
共同学习生物信息学知识,共同探究生物奥秘。
目录
相关文章推荐
BioArt  ·  Current Biology | ... ·  12 小时前  
生信菜鸟团  ·  更新R包版本还有这个不为人知的秘密 ·  3 天前  
51好读  ›  专栏  ›  生信人

AI病理新神器!跨癌种通吃,自监督学习让诊断和生存预测「一网打尽」

生信人  · 公众号  · 生物  · 2025-06-07 07:03

正文

请到「今天看啥」查看全文


生存预测(基于病理图像预测患者预后)

可解释性验证: 通过注意力热图可视化模型关注区域,与病理医生标注对比,验证模型决策合理性。


流程亮点:

数据效率:仅需 25% 标注数据即可达到传统模型 100% 数据的性能,缓解标注难题。

跨癌种适配:预训练覆盖 32 种癌症,模型在肺癌、肾癌等不同任务中表现稳定。

1 BEPH 架构概述

BEPH 预训练 - 微调 范式可类比为 先学通用语言,再练方言 。未来若能整合多模态数据(如基因组、临床指标),可能实现更精准的个性化医疗。此外,模型轻量化(如使用 ViT-Tiny )可能更适合临床实时部署需求。


三、结果: BEPH 成绩单 ”—— 多维度验证性能突破

Patch 级分类:细节丢失也不慌,跨癌种诊断稳了!

BEPH 在乳腺肿瘤良恶性分类任务( BreakHis 数据集)中展现了“降维打击”能力:即使将图像下采样至 224 × 224 像素(丢失 70% 细节),患者级和图像级准确率仍分别高达 94.05% 93.65% ,比传统 CNN 模型(如 ResNet VGG )高出 5-10% 。更夸张的是,在肺癌亚型分类( LC25000 数据集)中, BEPH 99.99% 的准确率横扫 AlexNet EfficientNet 等模型(图 2e )。


BEPH 的逆天表现得益于 MIM (掩码图像建模)预训练策略。这种“先蒙眼拼图再考试”的学习方式,让模型即使面对模糊图像也能捕捉关键病理特征。有趣的是, BEPH 对图像分辨率变化表现出极强的鲁棒性(图 2c-d ),这意味着未来临床部署时,医院无需升级高分辨率扫描设备即可使用——简直是基层医疗机构的福音!


WSI 级分类:弱监督学习也能“卷”出天花板

在肾癌( RCC )、乳腺癌( BRCA )、肺癌( NSCLC )的亚型分类任务中, BEPH 仅用 25% 训练数据时, AUC 已达 0.909 ;全量数据下,肾癌亚型分类 AUC 飙升至 0.994 ,几乎与人类病理专家持平(图 2a-b )。即便对比最新基础模型 GigaPath (参数规模 17 倍于 BEPH ), BEPH 在肺癌、肾癌任务中仅落后 0.7% ,堪称“小模型逆袭”的典范。

2 对公开可用的补丁数据集进行性能评估







请到「今天看啥」查看全文