专栏名称: 生物探索
探索生物科技价值的新媒体
目录
相关文章推荐
BioArt  ·  Nat Chem Biol | ... ·  6 小时前  
生物制品圈  ·  被忽视的 "腹泻杀手":中国轮状病毒暴发 ... ·  3 天前  
生物学霸  ·  共 20 人,一重要学会 2025 ... ·  昨天  
生信人  ·  最新27+生信,原来只做了这些操作! ·  4 天前  
51好读  ›  专栏  ›  生物探索

Nature Methods | 告别“猜谜”式研究:CellNEST为细胞通讯分析带来前所未有的精...

生物探索  · 公众号  · 生物  · 2025-06-09 16:35

正文

请到「今天看啥」查看全文


CellNEST (Cell Neural Networks on Spatial Transcriptomics) 的全新计算工具,它如同一位装备了人工智能(AI)武器的顶尖侦探,能够以前所未有的精度和深度,揭示细胞世界的秘密。

AI侦探CellNEST登场:用“注意力”聆听细胞私语
CellNEST的强大之处在于它巧妙地融合了两种前沿AI技术:空间转录组学(spatial transcriptomics)和深度学习(deep learning)。
首先,它利用了空间转录组学技术,如Visium或MERFISH。这些技术能在保持细胞原始空间位置不变的情况下,获取其基因表达谱。这就好比我们终于拿到了一张高清的“城市地图”,上面不仅标注了每个市民(细胞)的位置,还记录了他们正在“说什么”(基因表达)。
有了这张宝贵的地图和通讯记录,CellNEST的深度学习“大脑”开始工作。它的核心是一个名为 图注意力网络(Graph Attention Network, GAT) 的复杂算法。我们可以这样理解它的工作原理:
构建“关系图谱”: CellNEST首先将整个组织样本转换成一个巨大的图(graph)。在这个图中,每个细胞或分析点(spot)都是一个节点(vertex),而细胞之间的潜在关系(比如空间上是邻居)则构成了边(edge)。这个图谱包含了数千个节点和数百万条边,构成了一个极其复杂的网络。
引入“注意力机制” (Attention Mechanism): GAT最神奇的地方在于它的“注意力”。当我们听一场演讲时,我们会自动地将注意力集中在最重要的关键词句上,而忽略那些无关紧要的背景噪音。GAT也是如此。在分析这个庞大的细胞关系图谱时,它会为每一条代表潜在通讯的“边”分配一个“注意力分数”。这个分数衡量了这条通讯对于理解整个组织区域的通讯模式有多重要。那些构成关键通讯模式、反复出现的信号,会获得很高的注意力分数;而那些随机的、孤立的“噪音”信号,则得分很低。
“对比学习”练就火眼金睛: 那么,在没有任何“标准答案”(ground truth)的情况下,GAT是如何学会分配注意力分数的呢?CellNEST采用了一种名为 深度图信息最大化(Deep Graph Infomax, DGI) 的无监督对比学习(contrastive learning)策略。这就像训练一位艺术品鉴定师。我们不直接告诉他什么是真迹,而是给他看一幅真正的梵高《星空》,再给他看一堆随机涂鸦的“赝品”。通过反复对比,鉴定师的大脑会自己学会总结出真迹的“规律”和“模式”。DGI做的就是类似的事情:它会对比真实的细胞网络图和一个被随机打乱、破坏了结构的“腐败”网络图。通过学习最大化这两者之间的差异,模型就能深刻理解真实细胞通讯网络中蕴含的内在规律,从而为重要的通讯模式打上高分。
通过这一系列复杂的计算,CellNEST最终输出的不再是一张杂乱无章的通讯清单,而是一幅经过AI“侦探”精炼、标注了重点的“犯罪现场地图”。它能告诉我们,在组织中的哪个具体位置,哪些细胞之间,通过哪些特定的“电报”(配体-受体对),正在进行着最关键的对话,甚至这些对话是如何形成“接力赛”的。

牛刀小试:在淋巴结中精准定位“归巢信号”
理论再好,也需要实践来检验。为了验证CellNEST的准确性,研究团队首先选择了一个已经非常了解的生物学场景——人淋巴结中的T细胞归巢(T cell homing)。
我们知道,淋巴结是免疫系统的“指挥中心”,其中的T细胞区是T细胞集结和活化的地方。T细胞之所以能精准地找到这个区域,是因为一种被称为“归巢信号”的化学通讯在起作用。其中最经典的一对信号就是CCL19-CCR7。T细胞区的基质细胞会分泌趋化因子CCL19(配体),而T细胞表面则有它的受体CCR7。就像灯塔指引船只,CCL19-CCR7信号引导着T细胞精准地“停靠”到T细胞区。
研究团队将CellNEST应用于人淋巴结的Visium空间转录组数据上。他们假设,如果CellNEST足够准确,它一定能从数万个可能的配体-受体对中,识别出CCL19-CCR7,并将其定位在T细胞区。结果令人振奋:
精准识别: 在数据库中超过12,605个可能的配体-受体对中,CellNEST成功地将CCL19-CCR7识别为T细胞区内丰度第二高的通讯信号。而排名第一的是CCL21-CXCR4,这是另一个已知的、功能相似的T细胞迁移信号。这证明了CellNEST能够从海量数据中准确地“钓”出关键的大鱼。
“注意力”的威力: 更有趣的是,研究人员发现,虽然CCL19-CCR7信号的“注意力分数”极高(Fisher's exact test, P = 9.16 × 10⁻²²⁴),但它的原始基因共表达分数(coexpression score)其实并不在最高之列。这说明了什么? 传统方法如果只看基因表达量,很可能会错过这个关键信号。 而CellNEST凭借其强大的模式识别能力,洞察到这个信号在T细胞区内形成了稳定而重要的通讯模式,因此给予了它极高的权重。这正是“注意力”机制的威力所在。
空间定位的完胜: 当研究人员根据注意力分数高低来可视化CCL19-CCR7信号时,发现得分最高的信号完美地集中在预先标注好的T细胞区内。随着筛选阈值的提高,信号的定位也越来越精准。相比之下,其他几种主流的细胞通讯分析工具,如COMMOT和NICHES,虽然也能检测到一些信号,但其预测的信号分布与真实的T细胞区位置存在明显偏差。CellNEST在空间定位的精准度上取得了完胜。
这个淋巴结的例子有力地证明了CellNEST不仅能“找对”,还能“找准”,其准确性和可靠性远超现有方法。

不止于点对点:揭开细胞间的“信号接力赛”
CellNEST最令人兴奋的突破,在于它能够识别并重构前面提到的“中继网络”。这是一个从“点对点”通讯到“网络化”通讯的认知飞跃。
在淋巴结的研究中,CellNEST不仅找到了单个的通讯信号,还进一步挖掘了它们之间的“接力”关系。它发现了一个丰度极高的“两跳”(two-hop)中继网络:CCL19-CCR7 → CCL21-CXCR4。
这个模式的生物学意义是:一个细胞(比如树突状细胞)释放CCL19,激活了携带CCR7受体的T细胞;这个被激活的T细胞可能随即被附近的另一个信号CCL21所吸引(CCL21的受体之一是CXCR4),从而完成更复杂的迁移或功能调节。这两个信号共同参与调控T细胞的活动,形成了一个功能单元。






请到「今天看啥」查看全文