正文
对于剩余的蛋白质,我们计算了它们在肝脏中的平均丰度,并与其他组织中的丰度进行了比较,以评估肝脏的相对丰度比率。
然后我们分析了RNA图谱和蛋白质图谱之间的差异,这使我们能够识别出在RNA图谱中比蛋白质图谱中肝脏丰度比率高5-10,000倍的蛋白质。
其中,有126种蛋白质在健康个体队列的血浆中用至少2个肽定量(图3A)。
这些主要血浆蛋白中的典型蛋白质包括凝血因子、补体蛋白、白蛋白、载脂蛋白和急性期蛋白(表S12)。
功能富集分析显示,这些主要血浆蛋白参与了血浆的主要功能,如补体和凝血级联反应、急性期反应以及胰岛素生长因子(IGF)转运的调节(图3B)。
图片说明
◉ 图3. 一种基于肝脏中RNA和蛋白质水平之间丰度的数据驱动策略来定义主要血浆蛋白(A)该点图显示了在RNA图谱中与蛋白质图谱相比,肝脏丰度比至少高5倍的126种蛋白质。
◉ (B)水平条形图显示了定义的主要血浆蛋白的功能富集分析。
◉ (C和D)(C)散点图和(D)小提琴图显示了所有个体和不同时间点的所有定量组织富集蛋白、常见组织蛋白和主要血浆蛋白的计算方差。
◉ 红色圆点表示主要血浆蛋白。
◉ 浅色圆点表示组织富集蛋白,深蓝色表示定义为常见的蛋白。
Para_01
-
由于主要血浆蛋白是主动分泌到血浆中的,而不是细胞坏死或正常周转的结果,我们推测它们受到比组织富集蛋白更严格的体内平衡控制。
-
为了验证这一点,我们使用了上述健康志愿者的时间分辨血液血浆样本。
-
在这个队列中,从10个人身上每周采集一次样本,共采集5次,并使用DIA-MS进行分析。
-
根据上述定义,我们计算了所有个体和不同时间点的量化组织富集蛋白、共同存在的组织蛋白和主要血浆蛋白的方差。
-
该分析表明,不同个体之间的时间变化高于单个个体内的变化,表明血浆蛋白质组在一段时间内相对稳定。
-
此外,主要血浆蛋白的蛋白质水平方差低于共同存在和组织富集蛋白,表明这一蛋白组受到更严格的体内平衡控制。
-
总体而言,基于数据驱动的主要血浆蛋白定义,可以更好地监测血浆中的组织来源蛋白。
-
此外,这些结果表明,在正常生理条件下,几种在血浆中可检测到的组织富集蛋白的个体间变异高于主要血浆蛋白。
Pathological changes of tissue-specific protein signatures in plasma
血浆中组织特异性蛋白质特征的病理变化
Para_01
-
定义的组织富集蛋白和数据驱动的主要血浆蛋白定义为监测病理条件下血浆蛋白质组动态变化提供了新的可能性。
-
为了验证这一点,我们在急诊科(ED)收集了三个不同概念验证患者队列的血浆样本。
-
这些队列包括胰腺炎患者(n = 14 + 10)、心肌梗死(MI)患者(n = 25 + 25)以及具有不同微生物病因的感染患者(n = 47 + 40),以及各自的对照组(图4A-4C)。
-
这三种情况有不同的潜在病理生理学和已建立的临床生物标志物,如肌钙蛋白T、淀粉酶和C反应蛋白(CRP)(图4A-4C)。
-
使用DIA-MS分析血浆样本,并使用组织图谱光谱库提取蛋白质强度,生成了包含161个DIA-MS蛋白质组图谱的综合数据集。
图片说明
◉ 图4. 血浆中组织或细胞蛋白特征的病理变化(A-C)在急诊科入组的胰腺炎、心肌梗死和感染队列及其相关临床生物标志物(淀粉酶、肌钙蛋白T和C反应蛋白)的概述。所有患者的血浆样本均使用DIA-MS分析,通过光谱库提取蛋白质强度,生成了161个DIA-MS蛋白质组图谱。所有蛋白质的来源是通过全球分布图谱推断出来的。
◉ (D)堆叠条形图显示了胰腺炎血浆队列(对照组与胰腺炎组)中八个胰腺富集蛋白质的标准化蛋白质丰度。
◉ (E)条形图说明了相对于健康对照组,在胰腺炎血浆中显著升高的四种胰腺富集蛋白质的丰度模式。
◉ (F和G)使用所有鉴定出的血浆蛋白质或仅使用由全球分布图谱定义的GLS为4的胰腺富集蛋白质过滤后的胰腺炎队列的均匀流形近似和投影(UMAP)。
◉ (H)条形图显示了在不同组织中鉴定出的五种心脏富集蛋白质的平均丰度水平。
◉ (I)条形图说明了相对于对照血浆,在心肌梗死血浆中显著升高的三种心脏富集蛋白质的丰度模式。
◉ (J和K)(J)条形图显示了一部分嗜中性粒细胞富集蛋白质的平均丰度水平,(K)以及这些蛋白质在细菌感染患者血浆中的平均丰度模式与病毒感染相比。
◉ (L和M)(L)条形图显示了选定的巨噬细胞衍生蛋白质的标准化平均丰度水平,(M)以及它们在血浆中的丰度模式(病毒感染与细菌感染对比)。
◉ (N和O)(N)条形图说明了所有细胞类型中富集蛋白质的标准化平均丰度,(O)以及它们在感染血浆队列中的平均丰度水平(病毒感染相对细菌感染)。
◉ 误差线表示标准误,对于指定的比较进行了Mann-Whitney检验。
p < 0.05;
p < 0.01;
p < 0.001。另见图S4和S5。
Para_01
-
总共在胰腺炎队列的血浆样本中鉴定出35种胰腺富集蛋白。这些蛋白质在不同组织中的标准化丰度模式如图S4所示。
-
其中,有13种蛋白质的GLS为4,因此被所有4个图谱确定地分配到胰腺。
-
两种蛋白质的GLS为3,14种蛋白质的GLS为2。
-
总计有11种蛋白质,包括淀粉酶α 2A(AMY2A)、胰脂肪酶(PNLIP)和羧肽酶B1(CPB1),在胰腺炎患者的血浆中显著高于健康对照组(图4D和4E)。
-
基于所有鉴定出的血浆蛋白质对患者队列进行分层显示,整个血浆蛋白质组无法将胰腺炎患者与其各自的对照组区分开来(图4F)。
-
然而,针对GLS为4的胰腺富集蛋白的数据驱动过滤,显著改善了胰腺炎患者与对照组之间的区分(图4G)。
图片说明
◉ 图 S4. 胰腺炎血浆队列中鉴定的胰腺富集蛋白,与图 4 相关。一个条形图说明了不同组织中蛋白质平均丰度。这些蛋白质被分类为胰腺富集蛋白(GLS > 1)并在胰腺炎血浆队列中鉴定。
◉ 每个条形代表一种蛋白质及其平均丰度,误差线表示平均值的标准误差(SEM)。
Para_01
-
第二个队列由因胸痛入急诊科的患者组成,包括有和没有心肌梗死的患者。
-
-
在这个队列中,全球分布图谱能够识别血浆中的24种心脏富集蛋白,并且这些蛋白在不同组织的所有图谱中的平均丰度模式如图4H所示。
-
与对照组相比,心肌梗死患者的血浆中有五种心脏富集蛋白显著升高,包括肌红蛋白(MB)、脂肪酸结合蛋白、心脏型(FAB3P)和含有三部分基序的蛋白54(TRIM54)(图4I)。
-
有趣的是,MB、FAB3P和TRIM54已经被提议作为心脏生物标志物。
Para_02
-
在最终的患者队列中,我们纳入了由不同微生物病原体引起的感染患者(n = 47例病毒性感染,n = 40例细菌性感染)。
-
-
中性粒细胞、巨噬细胞和血小板是先天免疫系统中的关键细胞参与者,并且对于协调早期宿主对入侵病原体的反应至关重要。
-
为了靶向和监测细胞衍生蛋白,我们使用基于细胞的图谱来识别特异性富集于中性粒细胞、巨噬细胞和血小板中的蛋白质组。
-
图4J显示了一部分中性粒细胞蛋白在不同细胞类型中的平均丰度水平。
-
这些蛋白质,包括抵抗素(RETN)、组织蛋白酶G(CTSG)和脂质运载蛋白2(LCN2),在细菌感染期间的血浆中相对于病毒感染显示出显著更高的丰度(图4K)。
-
类似的模式也见于巨噬细胞衍生的蛋白质(图4L),其中约有20种巨噬细胞富集的蛋白质在细菌感染患者的血浆中显著升高(见图4M中的例子)。
-
相比之下,血小板衍生的蛋白质(图4N)与中性粒细胞和巨噬细胞相比表现出不同的血浆蛋白质组丰度谱型。
-
例如,前血小板碱性蛋白(PPBP)、血小板因子4(PF4)和糖蛋白IX血小板(GP9)在细菌感染中相对于病毒感染主要表现为下调(图4O)。
-
这很可能是由于血小板减少症,这种症状常见于严重的细菌感染如败血症中。
Para_03
-
最后,为了测试组织富集蛋白特征的变化是否与特定的病理生理机制或特定条件相关,我们比较了三个患者队列中的组织和细胞富集蛋白变化(图 S5A-S5F:条形图描绘了在三个患者队列中鉴定出的血浆中各种组织富集蛋白的平均丰度模式,与图 4 相关)。
-
在所有疾病状态下,急性期蛋白的数量统计上显著高于各自的对照组。
-
这些结果是可以预见的,因为之前已有描述表明急性期蛋白在急性冠状动脉综合征期间会被动员起来,并且败血症和胰腺炎的病理生理学与全身性炎症有关。
-
相比之下,血浆中胰腺富集蛋白的增加与胰腺炎特异性相关。
-
此外,心脏富集蛋白的水平在患有心肌梗死和细菌感染的患者中显著升高,与其他队列相比更为明显。
-
败血症与心脏功能障碍有关,但其潜在的病理生理机制与急性冠状动脉综合征不同,这可能解释了这些观察结果。
-
此外,中性粒细胞富集蛋白在细菌感染中增加更多,尽管在心肌梗死和胰腺炎患者中也观察到了部分重叠。
-
因此,结果显示所有患者队列中组织富集蛋白丰度水平既存在共同的变化,也存在独特的变化。
图片说明
◉ 图 S5. 不同患者队列中病理血浆蛋白质组变化的比较,与图 4 相关 全球分布图谱结合了 161 个 DIA-MS 蛋白质组图谱,用于分析不同患者队列中组织富集和初级血浆蛋白特征的变化。
◉ (A–F)条形图显示了三个患者队列中急性期、胰腺富集、心脏富集、中性粒细胞富集、巨噬细胞富集和血小板富集蛋白在血浆中的平均丰度模式。
◉ 误差线表示平均值的标准误差(SEM),并使用 Mann-Whitney 检验对指定的比较进行了分析(∗p < 0.05;∗∗p < 0.01;∗∗∗p < 0.001)。
Monitoring of tissue-specific protein signatures in population-scale plasma cohorts
在人群规模的血浆队列中监测组织特异性的蛋白质特征
Para_01
-
为了进一步量化不同器官和细胞在健康和疾病状态下对血浆蛋白质组的影响,我们纳入了来自两个大型额外血浆队列的数据——一个来自英国生物银行的大规模人群队列和一个大型败血症研究。", "Sentence_02": "英国生物银行的血浆队列源于一项制药合作项目,该项目使用Olink蛋白质组学技术对54,219名英国生物银行参与者进行了血浆蛋白质组定量分析。", "Sentence_03": "败血症血浆队列是一项基于质谱的败血症研究,涵盖了1,364名败血症患者,数据是通过DIA-MS方法获得的。
Para_02
-
在本研究包含的所有队列中,血浆中检测到3,585种独特的蛋白质,并根据其基础GLS和蛋白质-组织分配被划分为不同的蛋白质组(图5A;表S13)。
-
其中,1,364种被指定为具有单一标签的组织蛋白,大约10%的这些蛋白的GLS为4。
-
进一步将组织或细胞富集的蛋白质细分为各自的组织和细胞类型后发现,所有包含的29个器官和细胞都对血浆蛋白质组有贡献。
-
-
对于某些器官,如大脑、脾脏、肝脏、肌肉和胰腺,特定组织蛋白对血浆的贡献是其他器官(如膀胱、甲状腺和前列腺)的许多倍(数百种蛋白质),而后者仅贡献了数十种蛋白质(图5B)。
-
我们注意到,一般来说,具有独特蛋白质组和许多组织特异性蛋白质的大且血管化的器官对血浆蛋白质组组成的影响更为显著,相比之下,较小的器官影响较小。
图片说明
◉ 图5. 血浆中组织富集蛋白的概况(A)圆环饼图显示了血浆中所有已鉴定的蛋白质及其根据全球分布图谱分配到的全球蛋白质组的百分比分布。
◉ (B)一个圆形条形图描述了血浆中识别出的组织富集蛋白,根据其基础组织分配和GLS进行细分。每个条形代表一种蛋白质,颜色表示其在相应组织中的标准化平均丰度水平。目标器官中的标准化丰度根据图例着色。
◉ (C和D)点图展示了与肝功能障碍(C)和胃炎(D)相关的组织富集蛋白及其蛋白质关联(效应大小)。误差线表示标准差。这些蛋白质根据全球分布图谱中推断的来源进行分类。
◉ (E)点图显示了脓毒症患者中肺表面活性蛋白B的血浆水平,其中呼吸功能障碍(SOFA呼吸评分>2)相对于没有呼吸功能障碍的脓毒症患者(SOFA呼吸评分为0)。
◉ (F)我们首先选择了在血浆中检测到的肝脏和胃部富集的所有蛋白质。条形图描绘了两种图谱(HATLAS和EMBL)中蛋白质比例与其在相应器官中的强度比例之间的比较。
◉ (G)在(C)中标记为"肝脏"的蛋白质的富集String网络图。每个点代表一种蛋白质,边表示从String得出的蛋白质关联。对指示的比较进行了Mann-Whitney检验。
p < 0.05;
p < 0.01;
p < 0.001。
Para_02
-
英国生物银行提供了参与者的特征,包括与疾病相关的蛋白质关联,使其成为检测组织特异性蛋白质组学疾病特征变化的宝贵资源。
-
为了研究器官损伤的发生是否改变了组织富集蛋白的丰度,我们选择了根据其来源组织分类的蛋白质,这些蛋白质与肝功能障碍(ALT升高)和胃炎有显著正相关关系(图5C和5D)。
-
分析表明,与其它器官来源的蛋白质相比,128种肝脏富集蛋白和10种胃富集蛋白分别与肝功能障碍和胃炎的关联强两倍。
-
在败血症队列中,我们发现肺表面活性蛋白B(SFTPB),一种高度肺特异性的蛋白质,在患有呼吸功能障碍的败血症患者的血浆中显著增加,相对于没有呼吸功能障碍的败血症患者(图5E)。
Para_03
-
有趣的是,在血浆中检测到的组织富集蛋白中,具有GLS4的蛋白质比例比所有组织富集蛋白高出两倍。
-
然而,我们观察到,并非所有GLS高的蛋白质都在血浆中被检测到,这表明其他因素可能影响哪些蛋白质能在血浆中被识别。
-
为了研究这一点,我们选择了在血浆中检测到的肝脏和胃部蛋白质,并将其比例与相应器官中的强度进行了比较(图5F和5G)。
-
分析显示,在血浆中鉴定出的这些组织特异性蛋白质中有25%至30%消耗了其各自组织中约40%的强度。
-
这些发现表明,在血浆中检测到的组织富集蛋白在其相应的器官中通常非常丰富,因此很可能在血浆中产生更丰富的印记,这与动物模型中的先前观察结果一致。
Para_04
-
总体而言,结果表明所有分析的组织都对血浆蛋白质组有所贡献,生成了可用于探测器官功能障碍的组织富集蛋白面板。
-
本研究展示的结果表明,在疾病过程中,周围组织和细胞会改变血浆蛋白质组的组成,这可以用来定义基于血液的、疾病特异性的蛋白模式,为未来的生物标志物研究评估器官功能障碍提供资源。
Discussion
Para_01
-
多年来,血浆蛋白质组作为了解疾病和生物标志物发现研究的来源已被广泛研究。
-
然而,对于周围组织和细胞如何影响血浆蛋白质组组成的不完全理解使得此类研究变得复杂。
-
在这项工作中,我们构建了一个蛋白质组分布图谱,以推断在血浆中可检测到的所有蛋白质最可能的起源,从而促进发现特定于组织或细胞的蛋白质特征。
Para_02
-
为了实现蛋白质-组织关联的客观和自动分配,我们开发了一种UMAP/KDE分类策略,该策略在根据蛋白质和RNA丰度谱将蛋白质分配到组织方面发挥了重要作用。
-
这种策略提供了一个灵活的数据驱动解决方案,可以根据实验问题进行调整,而不是依赖于手动规则替代方案。
-
为了进一步增强蛋白质-组织分配,我们将蛋白质组图谱与之前的大型目录整合,以计算每个蛋白质的GLS。
-
整合多个图谱的目的是最小化技术和生物变异,并构建一个跨越多种组织和细胞类型的更深层次的全球分布图谱。
-
-
许多因素,如活检中的细胞组成以及个体和技术变异性,显著影响组织RNA和蛋白质丰度水平。
-
获得较低GLS 1-2的蛋白质由于低转录物和蛋白质丰度,通常被一个或几个图谱遗漏。
-
然而,这些蛋白质的功能富集和丰度分布图表明,这些蛋白质实际上仍然主要在这些分配的器官中产生,并与具有较高GLS的蛋白质具有相似的生物学功能。
-
这些结果强化了使用多个图谱不仅可以通过重复观察增加组织分配的信心,还可以扩展可以在健康和疾病期间监测的组织富集蛋白候选列表。
Para_03
-
我们预测,结合全球分布图谱和大规模基于血浆的蛋白质组学分析,将为未来研究中许多病理条件下组织蛋白如何被调控提供有价值的见解。
-
为此,诸如蛋白质耗竭和蛋白质富集策略等技术进步将进一步增加在血浆中鉴定出的蛋白质数量,并揭示额外的组织富集蛋白质。
-
此外,这里描述的全球分布图谱可以扩展到包括其他组织、细胞或分布图谱,无论技术方式如何,从而允许利用未来的科学发展。
-
这里提供的资源为进一步增加我们对不同病理生理过程如何扭曲健康血浆中的蛋白质组成以探索潜在病理生理机制的知识提供了起点。
Para_04
-
我们的研究有几个局限性。首先,用于生成蛋白质组图谱的样本量相对较小,因为每个器官或细胞类型的组织样本仅来自三个健康个体。
-
每个器官的样本数量较少,这使得难以解释个体差异的影响。
-
然而,这一局限性凸显了将我们的蛋白质组图谱与之前发表的数据集整合的重要性。
-
另一个局限性是,在包含的独立研究中缺乏标准化程序,例如如何收集活检样本以及采样器官的哪些部分。
-
这些技术差异会影响活检中的细胞组成和观察到的蛋白质水平。
-
第三个局限性是,由于样本量小,我们没有考虑性别、种族和年龄。
-
然而,我们的数据显示,组织独立聚类,表明这些因素对变异的影响较小——这一观察结果与之前一项出版物的发现一致。
-
另一个局限性是,将蛋白质分配给特定组织具有挑战性,因为没有蛋白质-组织分配的黄金标准。
-
尽管我们提出了一种解决方案,但缺乏客观定义的组织分配方法表明科学界需要制定标准化的方法。
-
-
单个细胞存在于不同的器官和组织中,导致广泛的蛋白质重叠。
-
我们的数据显示,两种类型图谱之间的蛋白质重叠率几乎达到91%。
-
由于我们研究中包含的细胞图谱数量有限,进一步增加了比较的复杂性。
-
尽管存在这些局限性,这里呈现的全球分布图谱为科学界提供了一个资源,可用于研究血浆蛋白质组组成与周围组织之间的关系,以及在疾病过程中组织特异性蛋白质面板的变化。
Resource availability
Lead contact
主要联系人
Para_01
-
Materials availability
材料可用性
Para_01
-
Data and code availability
数据和代码的可用性