专栏名称: 生物探索
探索生物科技价值的新媒体
目录
相关文章推荐
华大集团BGI  ·  火眼精神 | ... ·  12 小时前  
生物探索  ·  ISRG大会长沙见 | ... ·  14 小时前  
生信人  ·  最新27+生信,原来只做了这些操作! ·  2 天前  
生信人  ·  又出新热点啦!10.3/Q1=网络毒理学+分子对接 ·  23 小时前  
BioArt  ·  Sci. Transl. Med ... ·  23 小时前  
51好读  ›  专栏  ›  生物探索

Nature Genetics | 细胞的社交圈藏着什么秘密?

生物探索  · 公众号  · 生物  · 2025-03-19 16:35

正文

请到「今天看啥」查看全文


NicheCompass能同时处理单样本或多样本数据,兼容细胞级(cell-level)和点位级(spot-level)两种观测精度。通过样本的二维空间坐标,系统自动构建二进制邻接矩阵(Binary adjacency matrix)——每个细胞/点位作为节点,物理相邻的细胞间建立连接边。这种拓扑结构完美保留组织的原始空间布局,相当于为每个细胞标注"门牌号"和"邻居名单"。输入数据还包含多组学特征(基因表达量必选,染色质可及性可选)及协变量(如样本批次),为后续去噪分析奠定基础。

b. 图神经网络编码器
系统采用图神经网络(Graph Neural Network, GNN)作为信息处理核心。该网络通过聚合节点自身特征及其邻居信息,生成高维细胞嵌入(Cell embeddings)。创新性地引入协变量嵌入层(如将不同样本编码为独立向量),可有效消除批次效应(Batch effect)。实验数据显示,该模块在肺癌数据集上的批次混淆评分(Batch ASW)达0.97(满分1),比传统方法提升42%。

c. 双轨基因程序学习
NicheCompass开创性地融合了先验知识驱动与数据驱动的混合学习策略:
先验程序(Prior programs):整合372条已知的细胞互作通路(如Wnt信号通路、FGF配受体系统),每个嵌入维度强制对应特定通路活性值
去新程序(De novo programs):通过自监督学习发现空间共现基因簇,如乳腺癌分析中识别到KRT14/KRT5基底细胞特征簇
这种设计既保留生物学可解释性,又能捕捉未知相互作用模式。在模拟测试中,双轨策略使通路识别准确率从纯数据驱动的68%提升至92%。

d. 程序分类与跨组学整合
系统将基因程序分为三类功能性模块:
细胞间通讯程序(如配体-受体对Vtn/Itga5)
转录调控程序(如Foxd1靶基因簇)
混合作用程序(同时包含信号源与响应靶点)
每个程序进一步拆解为邻域组分(Neighborhood component,分泌信号源的基因)和自身组分(Self component,接收信号的受体/下游基因)。在染色质数据整合时,通过位置关联(基因启动子±2kb区域)将开放染色质峰与靶基因动态绑定,实现多组学协同解析。

e. 可解释性解码器
系统包含三重解码机制确保结果可追溯:
图结构解码器:通过嵌入相似性重建原始邻接矩阵,保留空间拓扑(边重建准确率98.7%)
组学特征解码器:邻域特征解码:重建邻居细胞的基因表达(如配体编码基因)
自身特征解码:重构本细胞的受体/靶基因表达
线性掩码机制:每个解码器仅允许访问特定程序相关基因,避免特征混淆
以Shh信号程序为例,系统能清晰追溯中脑区域Ptch1受体表达与邻近细胞Shh配体分泌的空间耦合。

f. 下游应用生态
该框架支持四大核心应用场景:
微环境识别:在胚胎发育数据中区分出15个功能亚区,分辨率比传统方法提升3倍
跨样本整合:成功对齐5个肺癌患者样本,发现保守的SPP1+促纤维化微环境
空间参考图谱:将新患者数据映射到840万细胞的小鼠脑图谱,识别率89%
多组学解析:在染色质-转录组共测序数据中,揭示Calca基因的表观-转录协同调控






请到「今天看啥」查看全文