正文
Para_01
-
使用LD分数回归(LDSC)对全基因组关联分析元分析汇总统计数据进行分析,我们估计了SNP遗传力(
),重点关注有效样本量大于5,000的性状(方法部分)。
-
总体而言,风险模型中的遗传力估计值范围从1%到21%(中位数为4.3%;图2a和补充表11)。
-
具有代谢成分的疾病,如颅内压增高(95% CI 12–30%)、多囊卵巢综合征(10–21%)和子痫前期(8–15%),显示出较高的遗传力估计值。
-
相反,以流产结局的妊娠并发症的遗传力较低(0–3%),以及主要与感染或炎症病因相关的诊断,如宫颈炎(<2.6%)、其他阴道和外阴炎症(1.5–3%)以及子宫颈上皮内瘤变(1.2–3.7%)。
-
尽管对于这些性状中的一些,我们的估计提供了对
的首次评估,但对于其他性状(如子宫脱垂、子宫内膜异位症),我们的估计结果与之前发表的结果基本一致。
Fig. 2: SNP-based heritability, genetic correlations and phenotypic overlap, and discoverability and polygenicity of the studied traits.
- 图片说明
◉ a,所研究的女性生殖健康诊断的危险性尺度SNP遗传率(
)的森林图。诊断按照遗传率估计值排序,遗传率较高的特征在左侧。条形的颜色对应于诊断领域。中间点表示
的估计值,而误差条表示95%的置信区间。
◉ b,遗传相关性(上三角)和表型重叠(下三角)。成对的遗传相关性使用LDSC计算,星号表示经过Benjamini–Hochberg方法校正后的显著相关性。粉色表示正的遗传相关性,蓝色表示负的遗传相关性。表型重叠由Jaccard指数表示,颜色越深表示两个表型的相似性或病例重叠越高。方块的大小对应于各自的估计值。
◉ c,对于12种女性生殖健康特征,使用MiXeR估算的多基因性(因果SNP的比例)、可发现性(因果SNP效应大小的方差)以及达到
90%所需的样本量(M,百万),这些特征的模型拟合同时具有正的AIC(Akaike信息准则)和BIC(贝叶斯信息准则)值。有关表型缩写和样本量,请参见补充表1。
Para_02
-
为进一步表征所研究性状的遗传结构,我们使用MiXeR38进行了单变量分析。
-
该分析应用于12个性状(方法),揭示了多基因性(因果关联SNP的估计比例)和可发现性(效应大小估计变异的估计)存在显著差异(图2c和补充表12),表明对于某些性状,需要较大的样本量才能揭示其遗传结构。
-
相比之下,ICP和妊娠糖尿病表现出最高的可发现性,这意味着对于这些诊断,有更多的遗传信号具有较大的效应或效应估计值的方差较小;因此,较小的样本量即可描述大部分SNP遗传力。
-
这与一项近期针对ICP的GWAS研究结果一致(1,138例病例和153,642例对照),尽管其样本量相对较小,但仍发现了11个位点,这些位点的效应大小在复杂疾病中可以被认为是显著的(报告的OR值在1.27到7.09之间)。
Genetic correlations and phenotypic overlap
遗传相关性和表型重叠
Para_01
-
-
由于对共享遗传和生物因素的更好了解将对鉴别诊断和治疗产生影响,而且遗传相似性可以被利用以进一步促进基因发现,因此我们全面评估了所研究特征之间的遗传和表型相关性。
-
我们使用LDSC来估计所有样本量足够的分析条件之间的成对遗传相关性(rg)。
-
遗传相关性可以表明共享的遗传背景,这在单个变异分析缺乏足够效力时尤其有价值。
-
经过多重检验校正后,仍有156个相关性具有统计学意义,rg范围从-0.46到1.27(中位数为0.502;图2b和补充表13)。
-
最强的相关性出现在处于同一表型谱中的特征之间(宫颈癌和宫颈上皮内瘤变(rg = 1.27,标准误差(SE)= 0.43)),或代表潜在疾病的典型症状(早孕出血和自然流产(rg = 1.04,SE = 0.33)以及月经稀发和多囊卵巢综合征(rg = 1.02,SE = 0.19))。
-
观察到的相关性中有两个是负的——分别是早产劳动和分娩(ICD-10代码O60)与妊娠延长(O48)之间,以及O60与多囊卵巢综合征(E28.2)之间。
-
虽然前者是预期的,但多囊卵巢综合征风险与早产之间的负相关与流行病学研究结果相矛盾,这些研究表明患有多囊卵巢综合征的女性早产风险增加;这需要进一步验证。
-
总体而言,我们观察到了无排卵障碍(无排卵性不孕、多囊卵巢综合征和月经稀发)、具有代谢成分的妊娠并发症(妊娠高血压、子痫前期和妊娠糖尿病)、生殖道良性增生(息肉、肌瘤、子宫内膜异位症和卵巢囊肿)以及炎症性疾病(阴道、子宫或输卵管炎症或其他盆腔炎性疾病)之间的相关性,以及其他一些情况(图2b)。
Para_02
-
不同研究表型之间的病例重叠在EstBB表型水平分析中(补充表14)或在荟萃分析中(补充表13)通常并不显著,但对于某些表型对,病例重叠超过20%:子宫肌瘤–经血过多;宫颈炎–阴道或外阴炎症;宫颈炎–宫颈上皮内瘤变;宫颈炎–经血过多;经血过多–阴道或外阴炎症。
-
然而,我们的敏感性分析表明,病例重叠不会导致显著的额外遗传相关性。
Genetic risk score for ICP
ICP的遗传风险评分
Para_01
-
为了说明遗传研究(即遗传风险预测)的一个潜在应用,我们利用了ICP易感性的显著遗传贡献,并评估了其遗传易感性在风险估计中的效用。
-
我们使用来自一项已发表的GWAS元分析数据构建了ICP的PRS,该分析结合了NIHR-RD(国家健康与护理研究所生物资源罕见病合作项目)、100KGP(10万基因组计划)和FinnGen R4的数据(参考文献24)。
-
然后在独立的EstBB数据集中测试了PRS与ICP的关联性,该数据集包括1,152名被诊断为ICP的女性和47,775名未患ICP的经产女性对照组。
Para_02
-
我们观察到ICP患病率与PRS之间存在强相关性,最高十分位的患病率为6.1%,而最低十分位为0.9%。
-
在调整了出生年份和前十个遗传主成分(PCs)以控制人群分层后,将最高PRS十分位与最低十分位进行比较,ICP的OR值为6.7(95% CI 5.0–9.3,P = 1.9 × 10−33),而将最高十分位与中间两个十分位进行比较时,OR值为3.3(95% CI 2.7–3.9,P = 1.4 × 10−35)(图3a)。
-
该模型的曲线下面积(AUC)为0.66,相较于不包含PRS的模型(AUC为0.55)有所提升。
-
在挪威特隆赫姆健康研究(HUNT)的独立数据集中进行验证,包括71例病例和10,723例对照,确认了PRS与ICP之间的关联,每增加一个标准差的PRS,OR值为1.7(95% CI 1.3–2.1,P = 2.8 × 10−5)(模型AUC 0.71)。
-
将PRS值最高的三分之一个体与最低的三分之一进行比较,OR值为2.7(95% CI 1.4–5.0,P = 0.0018),模型的AUC为0.7。
Fig. 3: PRS for ICP.
- 图片说明
◉ a,根据基于包含1,138例病例和153,642例欧洲血统对照的全基因组关联分析(GWAS)元分析汇总统计信息的PRS,将1,152名被诊断为ICP的女性以及来自EstBB的47,775名女性对照分配到分位数(1,最低PRS;10,最高PRS)。中间的分位数(5–6)用作参考。
◉ 使用调整了入组年龄和前十个遗传主成分(PCs)的逻辑回归方法估计OR值(中点)和95%置信区间(误差条)。
◉ b,不同PRS组在妊娠期间ICP发病的累积发病率及95%置信区间。共有138例病例和10,073例对照被分配到PRS组:低PRS组包括第1和第2分位数(最低40%的PRS值);中等PRS组由第3和第4分位数(中间40%)组成;高PRS组包括第5分位数(最高20%的PRS值)。
◉ 的个体。
Para_03
-
在对138例病例和10,073例对照进行的生存分析中,时间从妊娠开始到诊断或分娩计算,PRS每增加一个标准差,ICP发病的危险比为2.46(95% CI 2.06–2.93,P = 1.9 × 10−23)。
-
不同PRS组别在妊娠期间ICP的累积发病率可见于图3b。
Para_04
-
为了探讨ICP PRS与其他表型之间的关联,我们分别对女性和男女合并进行了全表型组关联研究(PheWAS),使用ICD-10主要类别代码。在两种分析中,胆结石是唯一显著的表型(仅女性:P = 1.4 × 10−19,合并:P = 6.7 × 10−18),支持这些疾病之间的遗传基础共享。
-
Pleiotropic loci
多效性位点