专栏名称: 生物探索
探索生物科技价值的新媒体
目录
相关文章推荐
生信人  ·  Nature:IFNγ ... ·  昨天  
生物制品圈  ·  对标K药,三生制药赢麻了 ·  4 天前  
BioArt  ·  Cancer ... ·  昨天  
51好读  ›  专栏  ›  生物探索

Nature Methods | “双剑合璧”!SUM-seq重塑单细胞多组学图谱,引领科研新范式

生物探索  · 公众号  · 生物  · 2025-05-29 16:35

正文

请到「今天看啥」查看全文


(Credit: Nature Methods

第一步:样本内索引。 研究人员首先分离并固定细胞核,然后将它们平均分配到多个样本中。在这一阶段,他们引入了独特的样本索引 (sample indices)。对于染色质可及性分析 (ATAC),转座酶 (Tn5) 会被预加载上带有条形码的寡核苷酸 (barcoded oligos),用于标记可及的基因组区域。而对于基因表达分析 (RNA),带有条形码的寡核苷酸 (barcoded oligo-dT primers) 则通过逆转录 (reverse transcription, RT) 来索引mRNA分子。这意味着,在进入微流控系统之前,每个样本的ATAC和RNA分子就已经被打上了样本专属的“身份证”。
第二步:液滴内索引。 接下来,所有经过第一步标记的样本被混合并加载到微流控系统中,例如10x Chromium平台。在这个系统中,细胞核被封装在微小油滴 (droplets) 中,每个油滴内通常包含多个细胞核。在油滴内部,系统会引入第二层条形码 (droplet barcode),对油滴内的所有分子进行再标记。这种双重条形码标记策略 (dual barcoding) 确保了即使同一个油滴中含有多个细胞核,也能将测序读段精确地分配回其原始的单个细胞核。
SUM-seq的计算分析流程也同样高效。它使用自主开发的Snakemake分析管线 (Snakemake pipeline),能够可扩展且可重复地将测序读段分配给相应的样本索引,并通过液滴条形码进行单细胞级别的解复用。最终,生成基因表达矩阵 (gene expression matrix) 和染色质可及性矩阵 (tile matrix),并根据共享的样本索引和液滴条形码组合来匹配两种模态的数据。

那么,SUM-seq的性能究竟如何呢?
在评估和优化数据质量的实验中,研究人员将人类白血病细胞 (K562) 和小鼠成纤维细胞 (NIH-3T3) 以等比例混合,并使用了16个样本索引进行SUM-seq分析。
高通量与高回收率: 实验成功地从10万个双条形码细胞核中恢复了6,215个人类细胞和7,607个小鼠细胞的双模态数据,总回收率高达70%,这意味着与标准工作流程相比,通量提高了约7倍。
极低的碰撞率: 关键的是,人类和小鼠的读段分离良好,唯一分子标识符 (UMI) 碰撞率仅为0.1%,ATAC片段碰撞率为3.8%,这表明SUM-seq能够非常有效地区分不同细胞的来源,保证了数据纯度。
媲美甚至超越现有技术: 在性能指标上,SUM-seq的单细胞RNA (UMIs和每细胞基因数) 和单细胞ATAC (每细胞峰区片段数、转录起始位点 (TSS) 富集分数、片段大小分布) 模态数据质量持续保持高水平。与目前其他超高通量单细胞RNA测序、单细胞ATAC测序和多组学方法相比,SUM-seq在文库复杂性指标(每细胞基因数和峰区片段数)方面表现出色。例如,SUM-seq的平均基因数可达2,058个,平均片段数可达5,164个,远超其他高通量方法。例如,另一款流行的单细胞ATAC测序技术,dsciATAC-seq,其K562细胞的平均片段数仅为198个,基因数仅为355个。尽管10x Multiome的平均基因数可达2,515个,平均片段数可达9,258个,看似略高于SUM-seq,但其每细胞成本高达0.35欧元;而SUM-seq的每细胞成本低于0.05欧元,显著降低了研究成本,使得百万细胞级别的大规模研究成为可能。
固定和冷冻样本兼容: 值得一提的是,研究发现,甘油基冷冻保存 (glycerol-based cryopreservation) 在甘油醛固定 (glyoxal fixation) 后对测序性能指标影响最小,这使得SUM-seq非常适合需要长时间样本收集(如时间序列实验)或大规模细胞图谱项目的异步采样。
这些数据证明,SUM-seq以其卓越的通量、多重分析能力和成本效益,为单细胞多组学研究带来了革命性的突破。

免疫细胞的“变脸”:SUM-seq如何追踪巨噬细胞极化之旅
巨噬细胞 (macrophages) 是先天免疫系统的核心细胞,它们根据微环境信号,能够极化为促炎性的M1状态或抗炎性的M2状态。M1和M2状态在炎症、感染和组织修复中发挥着截然不同的作用。虽然M1和M2极化的关键转录因子已被鉴定,但驱动巨噬细胞极化随时间变化的复杂调控网络仍不完全清楚。SUM-seq的强大功能,使其成为追踪这一复杂生物学过程的理想工具。
研究人员利用SUM-seq分析了人诱导多能干细胞 (human induced pluripotent stem, hiPS) 分化的巨噬细胞,在无刺激的M0状态,以及经脂多糖 (LPS) 和IFN-γ刺激(M1极化)和IL-4刺激(M2极化)后的时间序列中的基因表达和转录因子活性。实验在M0、M1和M2极化的0小时、1小时、6小时、10小时和24小时等五个时间点进行了样本收集,总计18个样本。
高质量数据: 研究人员成功地从一个10x Chromium通道加载了15万个细胞核,获得了51,750个通过质控 (quality control, QC) 过滤的细胞核多组学数据,这些数据在各个样本中分布均匀。平均每个细胞核拥有11,900个独特的ATAC片段,TSS分数达到8,40%的片段位于峰区。在RNA数据中,平均每个细胞核检测到407个UMI和342个基因。尽管在RNA模态中,由于技术原因省略了PEG,导致UMI和基因计数相对较低,但高质量、大数量的细胞核样本依然支撑了有效的下游分析。
清晰的细胞状态分离: UMAP 可视化清晰地揭示了M1和M2极化轨迹上细胞的有效分离,并显示出M1和M2特异性标记基因的表达,印证了实验设置的有效性。
多组学因子分析 (MOFA) 揭示极化关键因子: 为了深入剖析影响巨噬细胞M1/M2极化基因表达和染色质可及性的关键特征,研究人员进行了多组学因子分析 (MOFA)。结果令人振奋:
M1极化: 早期响应因子 (Factor 4) 富集了IFN-γ信号和细胞因子信号通路。持续响应因子 (Factor 1) 则与IFN信号、通用免疫系统过程、IL-1信号和代谢相关。晚期响应因子 (Factor 7) 主要与抗原 (cross-) 呈递和RHO信号相关。






请到「今天看啥」查看全文