正文
通过大规模5′端单细胞RNA测序(5′ scRNA-seq)对
外周血单个核细胞(PBMC)中21种细胞类型和可变剪接基因进行分析
(Credit:
Nature Genetics
)
图a描述了AIDA研究的设计,覆盖474名东亚、东南亚和南亚供体,总计约100万个单细胞样本。这些样本被用来探索不同细胞类型中的可变剪接和剪接数量性状位点(sQTL)。
图b通过图形和热图展示了5′端测序数据的覆盖特性。研究发现,读取1(read 1)更倾向于转录起始位点(TSS),而读取2(read 2)更均匀地分布于基因主体。这种分布特点提升了外显子的覆盖率,为研究可变剪接提供了更高质量的数据。
图c展示了每个基因的覆盖率随读取深度的增加而提升。在所有表达基因中,中位数的外显子覆盖率达到85.3%,表明测序数据具有高覆盖质量。这些结果为剪接分析提供了可靠的基础。
图d展示了LeafCutter剪接事件的验证结果。59.3%的剪接事件在GENCODE中有注释,85.9%在PacBio长读测序中得到了验证。超过93%的检测到的剪接位点在超过1,000个样本中存在,进一步说明了数据的可靠性。
图e对21种PBMC亚型进行了深入分析,细胞类型按照血液生成系统的谱系进行分类。不同细胞类型中剪接分析和sQTL分析的样本量得到了详细列举。
图f显示了在单细胞水平上每种细胞类型中检测到的可变剪接基因数量(NODGs),其中红色菱形表示每个细胞中检测到的基因的平均数量。与OneK1K数据集相比,AIDA数据集检测到的剪接基因数量显著增加。
图g指出,可变剪接基因的数量与表达基因数量正相关,AIDA数据集中这种相关性显著高于OneK1K数据集。
图h和图i展示了在伪整体水平(pseudobulk)分析中检测到的剪接基因数量,随着细胞数量的增加而呈现饱和趋势,达到约11,500个基因。
传统的基因组学技术通常基于整个人体组织的平均表达水平,这种方法虽然提供了宏观视角,但往往掩盖了不同细胞类型间的关键差异。而单细胞RNA测序(scRNA-seq)的出现,犹如一把放大镜,让研究人员能够以单细胞为单位精确解析基因表达和调控过程,从而揭示疾病背后的微观机制。
该研究采用了单细胞5′端RNA测序技术,并结合随机mRNA断裂和修复机制,大幅提升了数据的外显子覆盖率。
研究团队对474名亚洲供体的约100万个外周血单个核细胞(PBMC)进行了测序,覆盖了21种细胞类型,检测到了超过11500个可变剪接基因,是以往技术的4倍以上。特别值得注意的是,这种方法成功突破了传统单细胞技术的局限性,能够更全面地解析基因的可变剪接模式。
例如,研究通过单细胞数据发现了与T细胞分化密切相关的PTPRC基因(编码CD45蛋白)的不同剪接形式。在幼稚T细胞中,主要表达包含外显子4、5和6的CD45RA+形式,而在激活和记忆T细胞中,则以跳过这些外显子的CD45RO形式为主。这种剪接模式的动态变化对免疫应答的调控至关重要,展示了单细胞技术在捕捉细胞分化和功能转变中的独特优势。
更重要的是,单细胞RNA测序还实现了在个体、细胞类型及基因调控层面上的多维数据整合。例如,研究通过剪接数量性状位点(sQTL)分析,揭示了细胞特异性基因剪接与复杂疾病之间的关联。