专栏名称: 生物探索
探索生物科技价值的新媒体
目录
相关文章推荐
生信人  ·  Nature:IFNγ ... ·  昨天  
生物制品圈  ·  对标K药,三生制药赢麻了 ·  4 天前  
BioArt  ·  Cancer ... ·  昨天  
51好读  ›  专栏  ›  生物探索

Science | 突破性进展:深度学习+物理模拟,精准操控蛋白质“形态切换”,未来药物设计新路径

生物探索  · 公众号  · 生物  · 2025-05-25 15:30

正文

请到「今天看啥」查看全文



乐高积木与侦探推理:巧妙的“三步走”战略
这项研究的核心在于其通用的设计方法,该方法利用深度学习来引导多态设计(multistate design)过程中序列空间(sequence space)和结构空间(structure space)的搜索。整个过程可以概括为巧妙的“三步走”战略,每一步都环环相扣,逻辑严谨:
第一步:创世之初:定义“理想形态”
在这一阶段,研究人员首先要确定他们希望设计的蛋白质能够切换的“目标构象状态”。这就像是为“变形金刚”设定了两种明确的“形态”,一种是绑定活性形态(State 1),另一种是绑定失活形态(State 2)。
我们以一个具体的例子来深入理解:
研究人员选择了一种工程化的钙离子结合蛋白(engineered Ca2+ binding protein)作为他们的起始结合活性态(State 1)。这个蛋白质来源于肌钙蛋白C(troponin C)的N端结构域(N-terminal domain),其天然野生型(wild-type)包含两个EF手型基序(EF hand motifs),都能在低微摩尔(low micromolar)浓度下结合钙离子(Ca2+)。但为了简化研究,他们使用了一个变体,即在EF手型基序I中引入了E41A点突变(point mutation),这使得位点I对钙离子的亲和力(affinity)减弱至毫摩尔(millimolar)范围,而位点II仍然保持中等微摩尔亲和力。更重要的是,这个E41A突变体在结合钙离子时不会发生构象变化,这为他们提供了一个稳定的结合活性态。
接着,他们需要从头生成(de novo generate)另一个全新的、结合失活的“形态”(State 2)。他们利用了一种名为“循环-螺旋-循环单元组合采样算法”(LUCS algorithm)的方法,对蛋白质中包含环III、螺旋C和钙离子结合位点II的连续区域——他们称之为“重塑区域”(reshaped region)——进行构象采样。这个过程就像是用“乐高积木”来拼搭一个全新的结构,但又确保它与原始结构在某些方面不同。他们生成了大约1000种不同的构象,平均钙RMSD(Ca root mean square deviation)达到了7.1埃(Å),这与天然信号蛋白中功能性构象变化的尺度相当。
实验验证,确保“形态”真实可控:
为了快速筛选这些从头设计的State 2序列,研究人员将每个设计与C端c-Myc标签融合,并在酵母表面进行展示。酵母表面展示水平通常与蛋白质的稳定性相关,因此可以作为设计可行性(designability)的初步指标。在初步筛选的11个单态设计(single-state designs)中,有10个设计显示出高表面展示水平,表明它们具有良好的稳定性。
研究人员进一步深入表征了设计#6306,因为它在重塑区域具有与State 1截然不同的构象,涉及到重塑螺旋C的旋转和翻译。最关键的是,钙离子结合环被显著重塑,形成了不利于结合的构象。实验结果确实证实,设计#6306在钙离子浓度高达1毫摩尔(1 mM)时,不结合钙离子,这与他们的预期完全一致。
为了从原子层面验证设计#6306的结构,研究人员通过核磁共振(Nuclear Magnetic Resonance, NMR)技术解析了其结构。结果显示,实验解析的结构(以青色表示)与AlphaFold2(AF2)预测的模型(灰色)之间具有非常出色的一致性,钙RMSD(Ca RMSD)为0.98埃(Å)(不包括环区)。这一数据强有力地证明,他们从头设计出的State 2骨架不仅具有可设计性(designable),而且确实不利于配体(ligand)结合,使其成为双态设计中结合失活态的理想选择。

第二步:寻觅“天选之子”:深度学习下的多态设计
有了两种明确定义的构象状态(State 1和State 2),下一步就是设计能够同时兼容这两种构象,并能在它们之间切换的序列。关键在于,这些序列不仅要高度相似,还要能以不同程度占据两种状态,从而实现构象平衡的调控。
传统的做法可能会将所有重塑区域及其相邻残基位置都设置为可设计(designable),但这会导致搜索空间过于庞大。为了更高效地寻找“天选之子”,研究人员运用深度学习的力量,特别是AlphaFold2(AF2)进行结构预测,来缩小可搜索的序列空间,并将采样重点放在决定状态偏好的关键位置。
他们利用AF2进行计算突变扫描(in silico mutational scan),评估了在设计#6306(预测采纳State 2构象)中引入突变后,其预测结构是否仍然保持State 2构象,同时又增加了与State 1序列的相似性。如果预测结构与State 2构象的钙RMSD(Ca RMSD)小于1.5埃(Å),则认为该突变在State 1的“可耐受序列空间”内。通过这个过程,他们识别出了最少残基集(minimal set of residues),这些残基在确定状态偏好方面至关重要。最终,可设计残基的数量从37个减少到25个。
随后,他们使用蛋白质MPNN(ProteinMPNN),一个基于深度学习的序列设计工具,进行多态设计。令人惊奇的是,他们发现了一系列AF2结构预测结果表明,这些设计要么完全处于State 1,要么完全处于State 2,或者处于两者的混合状态,甚至包括结构中间体(structural intermediates)。这些序列与原始State 1序列(1SMG)相比,有18个突变;与高序列相似度的单态State 2设计相比,有15个突变。
最关键的发现是:这些设计彼此之间只在一个残基位置——第89位——上存在差异!而第89位残基位于重塑区域之外,并且与钙离子结合位点相距超过15埃(Å)。这使得研究人员预测,第89位残基将作为一个变构位点(allosteric site),其氨基酸身份(amino acid identity)的变化可以改变重塑区域中各状态的布居(populations of states),包括远端钙离子结合位点构象。具体来说,第89位较小的氢键供体和受体(hydrogen bond donors and acceptors)倾向于State 2,因为它们与环III的骨架形成氢键,使其更靠近中心螺旋D。相反,体积庞大和/或疏水性氨基酸(bulky and/or hydrophobic amino acids)则将环III推向更符合State 1的构象。AF2对第89位远端重塑区域的置信度指标(pLDDT)也因氨基酸身份的不同而显著变化,进一步支持了这一推测。

第三步:“乾坤挪移”:精细调控构象平衡
一旦确定了能够切换的蛋白质序列,下一步就是寻找方法来精细调控它们的构象平衡,就像是调整“变形金刚”的模式切换旋钮。这可以通过两种方式实现:一是通过配体结合(ligand binding),即在构象变化区域内的活性位点结合效应物;二是通过变构扰动(allosteric perturbations),即作用于与活性位点偶联的远端位点。

变构调节:一子落,满盘皆活!
为了验证第89位残基的氨基酸身份是否真的能决定构象平衡,研究人员选择了五种AF2预测行为各异的设计进行实验,包括S89(预测偏好State 2)、N89(混合状态)和I89(预测偏好State 1)。






请到「今天看啥」查看全文