正文
为了使三维冷冻电镜技术成为一个应用广泛的技术,而不是仅限于对规则的螺旋结构或者晶体阵列样品进行研究,生物物理学家们需要发展新的算法和重建策略。Joachim Frank 等人将大量具有随机朝向的样品放于金属网格上进行电镜拍摄,提出了处理单个大分子复合物(即“单颗粒”)样品的方法。他们的工作引领了单颗粒重建技术的诞生和发展,是今天冷冻电镜领域广泛使用的大分子结构解析方法的基础。2008 年加州大学洛杉矶分校的周正洪教授利用CPV(cytoplasmic polyhedrosis virus)病毒衣壳正二十面体的高度对称性,通过一万两千多张单颗粒图像,成功获得了3.9 Å分辨率的三维结构(图3),这是第一次通过单颗粒冷冻电镜重构技术得到近原子分辨率的结构。有关单颗粒分析算法的内容将在下一节中着重进行介绍。
图3 CPV衣壳整体结构(左图是利用对称性重构得到的衣壳复合体结构;右图为衣壳蛋白结构单元)
自2013 年以来,冷冻电镜取得了革命性的进步,其中最主要的原因之一是电子直接探测器(direct electron-detector device,DDD)的发展。DDD可以直接探测电子信号,而不像电荷耦合器件(charge-coupled device,CCD)需要利用光电效应记录数字信号,从而大大提高了信号的转换效率,提高了信噪比。2013 年10 月加州大学旧金山分校程亦凡教授研究组成功利用新一代DDD相机(Gatan K2 camera)拍摄了近九万张单颗粒图像,解析得到了瞬时受体电位(TRP)通道蛋白(TRPV1)四聚体的3.4 Å分辨率的结构。TRP通道是广泛存在的细胞和环境信号的传感器,但是一直缺乏精细的结构而无法揭示它们对物理和化学刺激信号的响应机制。这项研究打破了不结晶膜蛋白侧链的分辨率屏障,展示了单颗粒冷冻电镜在膜蛋白分析上的巨大潜力。
单颗粒冷冻电镜研究的一个关键问题是发展高效的计算工具来确定每张二维投影图片对应的投影方向角,进而进行三维的重建。为了减少电子对生物样品的辐射损伤,在实验上通常采用低剂量的电子(~20—40 电子/ Å
2
)进行照射,导致单张电镜图像的信噪比非常低。为了获得更高的信噪比,一般需要对几十上百张甚至上千张图片(DDD探测器出现之前需要更多的图片)取平均值来消除噪声的影响。现在已经有多种计算方法可以用来确定每张电镜图片所对应的方向角。Frank和Penczek 发展了一种“投影匹配”的方法。在进行“投影匹配”时,每张电镜图片与初始的参考模型在不同方向上的二维投影基于互相关系数进行一一比对,相关性最高的即认为是该投影方向为电镜图片所对应的实际投影朝向。还有一种方法是由Marin van Heel 提出的基于“公共线”
原则的几何方法。经过傅里叶变换之后,任意两张图片在三维傅里叶空间中都拥有一条公共的经过三维中心的线,基于这个原则可以确定每张图片对应的空间方向角。以上这些不同的分析方法已经被开发成了一系列的软件包,比如Spider,EMAN(EMAN2), Frealign, SPARX 和Xmipp等。
单颗粒冷冻电镜是针对单个粒子进行重构的技术,而我们的研究对象往往是多构象或者具有结构异质性的蛋白。这是一些蛋白质无法获得高分辨结构的重要原因之一。对于结构异质性样品的分析,我们需要先将样品分成几个同质的子集,然后分别进行三维重建。通常的做法是基于几何的方法获得不同的初始模型,然后利用多个参考模型进行投影匹配,进而进行三维重建。一个很重要的研究进展是由Fred Sigworth 提出的最大似然(maximum-likelihood,ML)方法。在ML实现过程中,每一张图片并不对应一个确定的相对方向角,而是会给出该图片在各个方向角上的概率的集合作为似然函数。这种方法可以有效地减少冷冻电镜图像中的噪声的影响,已经被用于处理生物样品中不同构象共存的问题,提高了识别和表征不同功能态的能力,为分析生物大分子的动力学提供了一定的依据。目前Frealign 和Xmipp已经融入了最大似然的原理,而Scheres 开发的软件包RELION因其对异质性样品的处理能力和友好的用户界面引起了全世界的关注,同时也使得单颗粒冷冻电镜图像处理得到了更广泛的应用。
图4 单颗粒冷冻电镜技术原理图
目前一些先进的机器学习方法也被引入到了冷冻电镜的图像处理中来,并取得了突破性的进展。比如我们实验室基于卷积神经网络算法开发的用于自动识别单颗粒的方法(DeepEM),提高了单颗粒识别的精度和效率;将现有的最大似然方法同产生式拓扑映射(GTM)算法结合起来,开发了一套非监督式的图像二维分类算法(ROME2D),实现了二维多分类的突破;在数学上,流形是高维空间中的几何体,如高维曲线或曲面。这一概念为高维空间中的连续介质和复杂几何体的拓扑描述提供了一套完整的数学框架,因此具有描述蛋白质动态结构的潜力。流形学习是机器学习的一个前沿研究方向,本质是通过找到高维空间中的低维流行和相应的嵌入映射,来实现维度约减和数据可视化,从而找到产生数据的内在规律。基于流形学习的三维结构动力学分析最近也取得了一些非常有趣的结果。目前,多构象蛋白的三维分类问题以及生物大分子的动力学分析仍然是充满挑战的研究方向,新兴的算法的发展也将主要围绕这些问题展开。
3 NAIP2—NLRC4 炎症复合体的冷冻电镜结构
先天免疫,又称非特异性免疫,是生物体免疫系统的重要组成部分,包括一系列非特异性抵御外来病原体入侵的细胞及相关机制。其中,炎症反应(发炎)是先天免疫系统移除有害刺激或病原体以及促进损伤组织修复的重要防御措施。炎症复合体(inflammasome,或称炎性小体)是一种存在于胞浆内的蛋白质多聚体复合物,在激活和维持炎症反应的过程中起到了关键的信号转导效应器或接头蛋白(adaptor protein)的作用。它可以招募、活化胱天蛋白酶caspase-1、caspase-5 等蛋白质水解酶, 促进白细胞介素(interleukin,IL)-1β、IL-18 等促炎性细胞因子的成熟,进而诱发细胞焦亡(pyroptosis,不同于细胞凋亡的一种细胞程序性死亡),从而调节免疫应答和炎症反应,抵御病菌侵袭。炎症复合体的失调也与一些自发炎症或自体免疫疾病相关,如2 型糖尿病、动脉粥样硬化等代谢疾病,多发性硬化、阿尔茨海默病等神经系统疾病。研究炎症复合体的结构和生化机理对于认识先天免疫的信号转导过程、免疫调控以及病原诱导活化等免疫响应机理具有十分重要的意义,因此成为了结构生物学和免疫学领域中的一个非常热门的研究课题。