专栏名称: 生物探索
探索生物科技价值的新媒体
目录
相关文章推荐
生信人  ·  Nature Genetics ... ·  4 天前  
BioArt  ·  Cell Stem ... ·  昨天  
51好读  ›  专栏  ›  生物探索

Cell | 解密DNA的“朋友圈”:新型光交联技术精准捕获DNA直接结合蛋白质

生物探索  · 公众号  · 生物  · 2025-05-27 16:35

正文

请到「今天看啥」查看全文



创新纯化流程:XDNAX的精妙设计
光交联完成后,如何从复杂的细胞组分中高效、纯化地分离出与DNA交联的蛋白质,是这项研究成功的关键。研究团队为此开发了一套名为 “蛋白质交联DNA提取”(protein-crosslinked DNA extraction, XDNAX) 的多步变性纯化方案。
XDNAX流程的巧妙之处在于,它利用了经典的硫氰酸胍-苯酚-氯仿(TRIZOL)提取方法,最初用于核酸纯化。通过对TRIZOL中间相(interphase)的额外处理,研究团队能够有效去除大部分非交联蛋白质、核糖核酸、脂质(lipids)和其他细胞碎片。随后,他们对含蛋白质交联DNA的提取物进行超声破碎(ultrasonication),并通过高温变性(denaturing)和硅胶自旋柱(silica spin columns)的强力洗涤,进一步彻底去除残余的非交联蛋白质。最终,通过核酸酶(nuclease)处理将蛋白质从DNA上释放,并进行胰蛋白酶(trypsin)消化,以便进行液相色谱-质谱(LC-MS)分析。
为了验证XDNAX的纯化效率,研究团队采用了稳定同位素标记细胞培养(SILAC)技术。他们将用重同位素(SILAC heavy)标记并经UVEN照射的MCF7细胞与用轻同位素(SILAC light)标记且未经照射的对照细胞混合,然后进行XDNAX处理。结果令人振奋:在所定量的1803种蛋白质中,有1026种蛋白质的富集倍数超过10倍,甚至有876种蛋白质仅在受照射的SILAC通道中被检测到,这表明背景非交联蛋白质几乎被完全清除。当省略4ST标记并使用未标记细胞进行相同的实验时,这种富集效果则完全消失,这进一步证明了XDNAX的特异性。
GO分析显示,在XDNAX后仅在受照射SILAC通道中发现的蛋白质,其核酸结合(nucleic acid binding)功能、特别是DNA结合(DNA binding)功能,富集度极高,p值分别达到了1E-149和1E-120。这与研究的预期高度一致。此外,研究团队还意外地在XDNAX样本中鉴定出了大量的核苷酸交联肽(nucleotide-crosslinked peptides),这些肽段在未经额外富集的情况下就能被检测到,为表征蛋白质-DNA相互作用界面提供了额外的证据。这项研究共发现了688个核苷酸交联肽,对应着379种不同的蛋白质——这一数字是此前报道的同类研究的20倍,标志着巨大的技术飞跃。其中,一个额外增加321Da质量的修饰( phosphorylation of 4ST minus a water molecule)被确认为4ST交联的直接证据,这一修饰仅在受照射的样本中出现。

揭示基因组的“亲密图谱”:DNA互作蛋白质组的全面画像
这项研究首次绘制了人类乳腺癌细胞(MCF7 cells)中与DNA直接物理接触的蛋白质图谱,为我们理解基因组的复杂调控网络提供了前所未有的深度。

DNA互作蛋白质组的广度与组成
研究团队通过对五次重复实验的分析,共发现了1805种候选DNA互作蛋白质,其中有1191种在至少三次重复实验中稳定存在,形成了一个可靠的DNA互作蛋白质组(DNA interactome)核心列表。这个图谱与已有的深层细胞核蛋白质组(deep nuclear proteome)有很大的重叠,83%的蛋白质在细胞核中被检测到。
通过iBAQ(intensity-based absolute quantification)定量分析,研究发现,在DNA互作蛋白质组中,组蛋白(histones)仍然是丰度最高的蛋白质,对总iBAQ贡献最大,这符合组蛋白作为DNA骨架蛋白(scaffold proteins)的已知功能。此外,研究还发现:
功能多样性: 60%的DNA互作蛋白质具有核酸结合功能,特别是DNA结合和序列特异性DNA结合(sequence-specific DNA binding)功能。除了已知的DNA结合蛋白,研究还发现了层粘连蛋白(lamins)等细胞核骨架蛋白,以及大量参与染色质组织(chromatin organization)和细胞分裂(cell division)的蛋白质。
“未知”的力量: 令人惊讶的是,研究团队还鉴定出了一组278种无法归类到主要GO术语(main GO terms)的蛋白质,其中包括泛素-蛋白酶体系统(ubiquitin-proteasome system)的成员,如PSM3,它们可能参与了细胞周期进程、细胞凋亡(apoptosis)和DNA修复中蛋白质的降解。更引人注目的是,其中一种未被表征的蛋白质C5orf24,其整个序列构成了一个未知功能的单一结构域(domain),并且高度无序。这提示我们,可能存在许多尚未被发现的、通过独特机制与DNA相互作用的蛋白质。

结构特性揭示:无序区域的关键角色
染色质在活细胞中表现出固态性质,为蛋白质和核糖核酸提供了核小体(nucleosome)支架,形成了一个弹性凝胶。研究团队深入探究了DNA互作蛋白质的结构特征,以了解它们是如何直接接触DNA的。
无序区域(Intrinsically Disordered Regions, IDRs)的普遍性: 这是这项研究最重要的发现之一。研究发现,DNA互作蛋白质组中的蛋白质表现出最广泛的内在无序性。与深层核蛋白质组和细胞质蛋白质组相比,DNA互作蛋白质的无序区域平均长度最长。数据显示,DNA互作蛋白质的无序区域平均长233个氨基酸,而甲醛交联染色质(formaldehyde-crosslinked chromatin)中的蛋白质平均长154个氨基酸,核内蛋白质平均仅有121个氨基酸,细胞质蛋白质更是只有49个氨基酸。这意味着,这些高度灵活、没有固定三维结构的无序区域,在蛋白质与DNA的“亲密接触”中扮演着至关重要的角色。
特定氨基酸重复序列的富集: 研究还发现,特定的同聚氨基酸(homopolymeric amino acid)序列(例如含有谷氨酸、脯氨酸、丝氨酸、甘氨酸、赖氨酸和精氨酸的五肽序列)在DNA互作蛋白质中显著富集。数据显示,这些特定的五肽序列在DNA互作蛋白质中占36%的蛋白质,而细胞质蛋白质中仅占13%。这些重复序列通常与蛋白质的内在无序性相关联。
功能结构域(functional domains)的洞察: 研究团队还发现,许多经典的DNA结合结构域(DNA-binding domains)和组蛋白结合结构域(histone-binding domains),如PHD型(PHD-type)和C2H2型锌指(C2H2-type zinc finger)、SAP结构域(SAP domain)以及DEAD/DEAH盒解旋酶(DEAD/DEAH box helicase)等,在DNA互作蛋白质中显著富集。
意外的发现: RNA识别基序(RRM)与DNA的交集: 令人惊讶的是,通常与RNA结合相关的RNA识别基序(RNA recognition motif, RRM)结构域,也在DNA互作蛋白质中显著富集。研究团队能够识别出多个含有RRM结构域的蛋白质(如MATR3、TRA2B、SRSF2、SRSF11和RNPS1)与DNA的交联位点,这暗示了RRM结构域在活细胞中也可能与DNA相互作用。这可能是因为一些蛋白质在相分离区室(phase-separated compartments)内,能够同时接触RNA和DNA,从而产生这种“意外”的直接相互作用。

蛋白质-DNA相互作用模式的汇总
这项研究总结了蛋白质与DNA的四种主要相互作用模式:
球状DNA结合结构域(globular DNA-binding domains): 蛋白质通过特定的、具有稳定三维结构的区域直接与DNA结合。
DNA结合内在无序区域(DNA-binding IDRs): 蛋白质通过其灵活的、无序的区域与DNA直接接触。
环境邻近性(circumstantial proximity): 蛋白质通过与组蛋白(histone-binding proteins)或其他蛋白质(如剪接因子,splicing factors)的相互作用,间接地靠近DNA。
相分离区室(phase-separated compartments)内:






请到「今天看啥」查看全文