专栏名称: 生物探索
探索生物科技价值的新媒体
目录
51好读  ›  专栏  ›  生物探索

Nature Methods | 大脑“罗塞塔石碑”问世:Krakencoder破译连接组通用语言,...

生物探索  · 公众号  · 生物  · 2025-06-13 16:35

正文

请到「今天看啥」查看全文


如何去除呼吸、心跳等生理噪声以及头动伪影?不同的处理流程会得到不一样的结果。

这些不同的“风味”组合,导致了大脑连接研究的“巴别塔”困境:不同研究得出的连接组数据仿佛是用不同语言书写的文献,难以直接比较和整合。一个团队发现的某条连接与抑郁症相关,在另一个团队的数据中可能因为处理方法的不同而无法复现。这极大地阻碍了我们寻找可靠的疾病生物标志物,也让个性化精准神经调控的梦想显得遥不可及。

有没有一种可能,所有这些不同“风味”的连接组,其实都只是对同一个潜在、真实的个体大脑网络的“管中窥豹”?如果能找到一种方法,洞悉这些不同视角背后的共同本质,我们就能打破“巴别塔”,建立一个统一的对话平台。这,正是Krakencoder试图解决的核心问题。

Krakencoder:一部连接组的“万能翻译机”与“信息融合器”

Krakencoder的设计理念十分巧妙,它并非试图评判哪种“风味”最优,而是承认每一种“风味”都提供了关于大脑底层系统的独特视角。它的核心思想是:通过深度学习,为所有“风味”的连接组数据构建一个共享的、低维度的“通用语言空间”,即 潜空间 (latent space)

为了实现这一目标,研究人员使用了来自“人类连接组计划”(Human Connectome Project, HCP)的683名健康年轻人的高质量大脑扫描数据进行模型训练。这些数据涵盖了多达15种不同的连接组“风味”——由3种大脑图谱(86、268和439个区域)、3种功能连接计算方法和2种结构连接计算方法组合而成。

Krakencoder的架构主要由一系列成对的 编码器 (Encoder) 解码器 (Decoder) 构成。

编码 (Translation): 对于每一种“风味”的连接组(例如,使用86区域图谱计算的皮尔逊相关功能连接),都有一个专属的编码器。这个编码器像一个专业的翻译官,能将这种特定“风味”的连接组矩阵(一个高维度的复杂数据)压缩并翻译成一个128维的、标准化的潜空间向量。这个向量,就是大脑连接的“通用语言”表达。

解码 (Reconstruction): 同样,对于每一种“风味”,也有一个专属的解码器。它能接收来自潜空间的“通用语言”向量,并将其精准地“反向翻译”,重构出该“风味”下的完整连接组矩阵。

通过训练225条这样的翻译路径(15种风味到自身的“自编码”和15×14/2×2=210种风味之间的“转码”),Krakencoder学会了在任意两种“风味”之间自由转换。更重要的是,研究人员在训练过程中加入了一个至关重要的 对比损失函数 (contrastive loss) 。这个损失函数的目标是:在潜空间中,同一个人的不同“风味”连接组被翻译成的向量要尽可能彼此靠近,而不同人的向量则要尽可能相互远离。

这个设计堪称神来之笔。它确保了Krakencoder在进行翻译的同时,牢牢抓住了每个个体的独特性。它学到的不仅仅是“平均人”的大脑连接模式,更是“张三”和“李四”之间那些微小但关键的差异。正是这些个体差异,构成了我们认知、行为和患病风险多样性的神经基础。

除了翻译,Krakencoder还具备更强大的 融合 (Fusion) 能力。它可以将某一个体所有可用的连接组“风味”(例如,所有的功能连接和结构连接数据)全部编码到潜空间,然后将这些“通用语言”向量进行平均,得到一个融合了多模态、多视角信息的“终极版”潜空间表征。这个融合后的表征,理论上包含了对该个体大脑连接网络最全面、信噪比最高的信息,可以被解码成任何一种“风味”的连接组,或者直接用于预测个体的行为和认知。

精准翻译与深度洞察:Krakencoder的惊人表现

那么,这部“万能翻译机”的性能究竟如何?研究人员在196名从未参与训练的测试者数据上进行了严格的评估,结果令人震撼。

1. 翻译的精准度与个体识别能力

研究人员使用了两个关键指标来评估预测性能:一是 个体识别准确率 (identifiability) ,即预测出的连接组是否能在一群人中被准确地识别出属于谁;二是 去均值相关性 (de-meaned correlation) ,它衡量的是预测结果在多大程度上抓住了个体的独特细节,而非仅仅是大众化的平均模式。

同类翻译(例如,功能连接 → 功能连接): 表现近乎完美。无论是用哪种图谱或计算方法,从一种功能连接“风味”翻译到另一种,其 平均排序百分位 (average rank percentile, avgrank) ——一个衡量个体识别能力的指标,0.5为随机水平,1.0为完美识别——几乎都达到了1.0。同样,结构连接之间的翻译也表现优异,avgrank达到了0.99。这意味着,Krakencoder可以几乎无损地在不同处理方法之间转换,帮你获得在另一种“风味”下的数据,就好像它真的被重新计算过一样。

跨界翻译(结构连接 ↔ 功能连接): 这是神经科学领域长期以来的核心难题,即如何从物理的“道路图”(SC)预测实时的“车流量”(FC)。Krakencoder在此也取得了前所未有的成功。从SC预测FC的avgrank达到了0.82,而从FC预测SC的avgrank更是高达0.85。这远远超过了随机水平,表明Krakencoder深刻理解了结构与功能之间的复杂映射关系。

超越遗传的个体化保留:







请到「今天看啥」查看全文