正文
基于基因的罕见变异聚合研究的设计框架及主要结果
(Credit:
Nature Genetics
)
研究背景和数据来源:
研究基于来自德国慢性肾病研究(GCKD)的4,737名参与者的全外显子组测序(Whole Exome Sequencing, WES)数据,结合血浆和尿液代谢组学数据(分别涉及1,294种血浆代谢物和1,396种尿液代谢物)。这些代谢物涵盖了氨基酸、脂质等多种代谢通路。
基因聚合分析:采用负担测试(burden test)对超过16,525个基因进行分析,每个基因包含至少3个罕见的、可能有害的变异(Qualifying Variants, QVs)。使用两种不同的变异筛选“掩码”(mask)策略:
LoF_mis:聚焦高置信的功能缺失(Loss-of-Function, LoF)变异和致病性错义变异。
显著性水平:结合主成分分析(Principal Component, PC)和PheWAS(表型全范围关联研究)确定严格的统计学显著性阈值(血浆:P < 5.04 × 10⁻⁹;尿液:P < 4.46 × 10⁻⁹)。
鉴定出 192对显著的基因-代谢物关联,包括血浆和尿液的独特及重叠关联。共有73个基因与179种代谢物关联,其中新发现了31个基因和110个基因-代谢物关联。
在血浆和尿液中,多数关联的代谢物影响方向一致,尤其是氨基酸和脂质类代谢物在血浆中的相关性较高。
虚拟基因敲除(in silico knockout):在全身代谢模型(Whole-Body Model, WBM)中模拟基因的敲除效应,评估基因-代谢物关联的生物学合理性。
实验验证:通过特定基因和代谢物的实验分析,确认部分基因变异的功能效应。
外部数据验证:在英国生物样本库(UK Biobank)中进一步验证基因和代谢物的关联,支持研究结果的普适性。
新发现的基因和代谢物关联揭示了许多未充分理解的代谢途径。
这些代谢物被证明可以作为分子标志物,帮助预测与代谢相关的性状(如身高)和疾病风险(如骨骼疾病)。
基因与代谢的联系曾像一幅复杂拼图,许多关键片段始终模糊难见。而代谢组学与外显子组测序(Whole Exome Sequencing, WES)的结合,为这一难题提供了全新的解法。这种结合通过高通量技术,精确捕捉代谢物的浓度变化与基因变异之间的潜在关联,帮助研究人员绘制出更完整的基因-代谢网络图谱。
代谢组学是一种通过质谱等先进技术,定量分析体内代谢物的科学方法。在该研究中,研究团队利用非靶向代谢组分析技术检测了1,294种血浆代谢物和1,396种尿液代谢物。这些代谢物覆盖了氨基酸、脂质、核苷酸等多个超级通路,为解读代谢网络提供了丰富的基础数据。而WES技术则通过捕获所有编码区的基因变异,将基因层面的信息与代谢物的动态变化直接关联起来。
但数据的获取仅是研究的起点,核心挑战在于如何从海量信息中提取有效信号。该研究采用了基因聚合负担测试(gene-based burden testing)和多种计算建模方法,例如性别分层分析和全身代谢模型的基因敲除模拟(Whole-body metabolism knockout simulation)。这些方法不仅帮助识别了192个显著的基因-代谢物关联,还通过对杂合状态下的基因变异影响进行建模,验证了多个关键发现的可靠性。研究发现,通过虚拟基因敲除模型(in silico knockout),可以精准预测KYNU基因变异对尿液代谢物的影响,并成功通过实验验证了这一预测的准确性。
同时,这项研究展示了数据建模的威力。通过基因-代谢物关联的剂量依赖效应分析,研究团队发现了血浆硫酸盐水平与身高等性状之间的潜在因果关系。这种关联不仅为基础科学研究提供了新思路,还为代谢物作为疾病分子标志物的临床应用奠定了基础。